Программа семинара

3

Click here to load reader

Upload: witology

Post on 19-Jun-2015

490 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Программа семинара

Программа семинара

Утренняя сессия (12:00-14:00)

1. Ростислав Яворский (Witology). Интеллектуальный краудсорсинг и деятельные сообщества.

В докладе будут перечислены слабые и сильные стороны использования краудсорсинга в

бизнесе и сформулированы некоторые релевантные задачи, которые имеют четкую

математическую формулировку.

2. Алексей Друца (Witology, МГУ). Визуализация данных социосемантической сети.

Рассматривается пакет программ социально-сетевого анализа WitoAnalytics, позволяющий анализировать и визуализировать данные социосемантической сети платформы Witology. На текущий момент он включает более 10 визуализаций социосемантической сети, а также алгоритмы кластеризации и анализа текстовых данных.

3. Александр Воробьев (Witology, МГУ). Определение компетенций участников конкурса и уровня представленных ими проектов.

Рассмотрим некоторый конкурс проектов. В рамках этого конкурса его участники предлагают проекты и оценивают качество проектов, предложенных другими участниками. Важным условием является возможность участника представить на конкурс любое количество проектов. На основе всех оценок, выставленных участниками проектам, нам необходимо оценить качество проектов и характеристики участников как оценщиков проектов и как авторов (создателей) проектов. Предлагается модель такого конкурса - байесовская сеть, в которой применимы стандартные методы оценки параметров.

4. Алексей Трегубов (Witology, МГУ). Алгоритмы рейтингования участников социальной сети, основанные на марковской модели.

Рассматриваются различные алгоритмы рейтингования участников социальной сети, основанные на марковской модели. Выбираются алгоритмы, наиболее соответствующие составу и специфике данных с проектов компании Витология, и применяются к этим данным. Сопоставляются результаты их применения.

5. Дмитрий Игнатов, Александра Каминская (ВШЭ, Witology). Цели создания ПУГ. Система анализа данных Witology.

В докладе будут освящены основные цели создания проектно-учебной группы «Алгоритмы интеллектуального анализа данных (Data Mining) для Интернет-форумов обсуждения инновационных проектов». Кроме того, будет описана система анализа данных коллаборативной платформы компании Witology и результаты некоторых экспериментов. В основу системы положен ряд моделей и методов современного анализа объектно-признаковых и неструктурированных данных (текстов), таких как Анализ Формальных Понятий, спектральная кластеризация, извлечение ключевых словосочетаний и слов из текстов.

Page 2: Программа семинара

6. Константин Блинкин, Никита Ромашкин (ВШЭ). Прототип системы анализа данных CrowDM.

Для достижения ряда задач, стоящих перед проектно-учебной группой,, разрабатывается система анализа данных CrowDM на основе решеток формальных понятий. В докладе описываются основные возможности, уже реализованные в системе, процесс работы с программой и выдаваемые результаты. Приведены примеры построения решеток понятий, выделения устойчивых понятий и бикластеров по данным проекта Сбербанк-21. Обозначены функциональные возможности, которые планируется реализовать в системе в будущем.

Вечерняя сессия (15:00-17:00)

7. Екатерина Черняк, Даниил Недумов (ВШЭ). Извлечение ключевых слов (ключевых выражений). Реализация алгоритма выделения ключевых слов и словосочетаний. Сравнительный анализ подходов к вычислению сходства тегов.

Важной промежуточной задачей в рамках проекта «Алгоритмы интеллектуального анализа данных (Data Mining) для Интернет-форумов обсуждения инновационных проектов» является извлечение ключевых слов и ключевых выражений из текстов сообщений форумов. В докладе будут освещены общие подходы к проблеме выделения ключевых слов, рассказано о принципах, примененных в проекте. Также будут представлены два подхода к вычислению сходств тегов и показаны результаты сравнительного анализа эффективности их работы.

Кроме того, в докладе будут рассмотрены практические аспекты задачи выделения ключевых слов и словосочетаний. Особое внимание будет уделено использованию внешних приложений для морфологического анализа и программной реализации других этапов алгоритма. Будут представлены некоторые результаты, полученные для текстов проекта Сбербанк-21.

8. Ольга Чугунова (ВШЭ). Спектральная и иерархическая кластеризация пользователей по активности и ключевым словам.

В докладе представлен отчет по анализу данных по пользователям проекта методами кластер-анализа. В работе применялись два метода: аддитивно-спектральный метод нечеткого кластер-анализа и иерархический метод кластер-анализа. Первый метод использовался для анализа активности пользователей (по матрице человек-человек-комментарий), второй – для выявления связей между пользователями на основе используемых ими слов (по матрице человек-ключевое слово). Полученные обоими методами результаты, к сожалению, не оправдали ожиданий: интерпретация найденных кластеров оказалась затруднительной.

9. Федор Строк (ВШЭ). Анализ социальных сетей. Результаты экспериментов на данных Witology.

В данном докладе будут рассмотрены подходы к анализу данных проекта Сбербанк-21 с точки зрения социальных сетей. Основное внимание уделяется вопросам индексов центральности, отдельного внимание заслуживает изучение взаимосвязи рейтингов, предложенных Witology, и индексов центральности агентов. Так же затрагиваются вопросы визуализации мер центральностей для больших сетей.

10. Андрей Константинов (ВШЭ). Модель рекомендательной системы для внедрения на платформу Witology.

В докладе будет кратко рассказано о существующих алгоритмах рекомендательных систем, а также о возможностях внедрения реокмендательной системы в платформу Witology в трёх аспектах: рекомендация интересных идей, рекомендация интересных людей, поиск антагонистов.

Page 3: Программа семинара

11. Анастасия Беззубцева (ВШЭ, Witology). Анализ распределений по данным проекта Сбербанк-21: в погоне за power law. О типологиях пользователей коллаборативной платформы.

Одной из задач, поставленных в рамках работы проектно-учебной группы CrowDM, является базовый статистический анализ данных одного из проектов краудсорсинговой платформы Witology. Этой частью исследований в надежде найти интересные закономерности занималась Анастасия Беззубцева. Поскольку деятельность участников сетевых сообществ чаще всего подчиняется степенному закону, именно его Анастасия и пыталась найти, что даже отчасти получилось. Анализ распределений активности на проекте также требовался для еще одной части исследования – построения типологии пользователей коллаборативной платформы Witology. Полученная типология далека от совершенства, полноты и универсальности, однако уже можно сказать, что на проекте «Сбербанк-21» наблюдались шесть классов пользователей (неактивные, прохожие, критики, создатели, спорщики и звезды), а их активность примерно соответствует близкому к закону Парето правилу Нильсена «90 – 9 – 1»: большая часть сообщества только потребляет и ничего не создает, и лишь на активных единицах держится все сообщество.