problems with big data analysis in the social sciences
TRANSCRIPT
ПРОБЛЕМЫ АНАЛИЗА BIG DATAВ СОЦИАЛЬНЫХ НАУКАХ
Широканова А.А.Кафедра социальной коммуникации БГУ
WebConf-2015Минск, 12-13 мая 2015
„Большие данные“
● Объем – volume● Скорость – velocity● Разнообразие – variety
+● Точность – veracity (по сравнению с опросом)
Общие трудности
● Хранение массивов данных
● Необходимость потоковой обработки
● Невозможность хранения для повторного анализа
● Фильтрация шума● Поиск и распознание
ценных паттернов в „терриконах информации“
● Нет изначального соответствия цели исследования
Проблемы социальных наук в работе с big data: технические1. Освоение техник сбора информации из
электронных социальных сетей и Web.
2. Интеллектуальный анализ данных (data mining).
3. Разработка программ машинного обучения для автоматизированной классификации данных.
4. Сетевой (SNA), текстовый, семантический анализ.
Проблемы социальных наук в работе с big data: содержательные
1. Динамичные источники ошибок и погрешностей (проблема надежности, невозможность замера в нескольких точках).
2. Этические проблемы соблюдения границ частной жизни.
3. Отсутствие общественно одобренных стандартов применения больших данных.
4. Необходимость законодательной защиты персональных данных и определения юрисдикции в регулировании сбора данных.
Источники
1. Отчет AAPOR о больших данных: 12 февраля 2015 / Л.Джапек [и др.]. - Москва, 2015. - URL: wciom.ru/
2.Dumbill E. What is big data? - 2012. - URL: radar.oreilly.com/
3.The FOUR V's of Big Data. - 2015. - URL: ibmbigdatahub.com/
4. Защита персональных данных – основа цифрового доверия / М.Соколова. - 2014. - URL: lawtrend.org/