datamining – что это?
TRANSCRIPT
Datamining – ?что это
Сергей ОрешковАспирант БФУ им. И. Канта
Немногоистории
Первый жесткий диск
Датамайнинг
Knowledge Discovery in Databases
• Математическая статистика• Алгоритмы машинного обучения• Большие объемы данных
Применения :датамайнинга
• Бизнес• Наука(CERN, например)• Медицина• Системы поддержки принятия решений• Еще много разных применений…
Бизнесприменение• Любой современный бизнес порождает огромное
количество информации, содержащей в себе знания• Если информацию правильно обработать или даже просто
представить, можно узнать о своей компании много крайне интересных вещей и даже принять какие-то важные решения
НаучноеприменениеТам, где проводят эксперименты, всегда много данных, которые надо обработать и слишком мало людей, которые разбираются в данных.
Процессдатамайнинга• Выбор данных• Препроцессинг(подготовка данных)• Датамайнинг• Проверка• Интерпретация/использование
ВидыдатамайнингаВиды задач, которые обычно связывают с понятиями датамайнинга и KDD:• Выявление аномалий.• Поиск внутренних зависимостей.• Кластеризация.• Классификация.• Статистика, OLAP.
ВыявлениеаномалийНахождение необычных записей - ошибок, чего-то необычного, того, что может потребовать расследования.
ПоисквнутреннихзависимостейВероятностый анализ данных и нахождение корреляций.
КластеризацияРазбиение набора данных на группы
КлассификацияОпределение принадлежности новых данных по уже имеющимся.
Примерудачнойклассификации
Примернеочень удачнойклассификации