splunk - универсальная платформа для работы с любыми...

36
Make your data clever

Upload: cleverdata

Post on 26-Jan-2017

351 views

Category:

Data & Analytics


3 download

TRANSCRIPT

Page 1: Splunk - универсальная платформа для работы с любыми данными

Make your data clever

Page 2: Splunk - универсальная платформа для работы с любыми данными

Congregata (собрал)

Vidi (увидел)

Praedictum (предсказал)

Page 3: Splunk - универсальная платформа для работы с любыми данными

cleverdata.ru | [email protected]

Структура презентации

> splunk> - универсальная платформа для работы с любыми данными

> Аналитика и визуализация

> Прогнозирование

> Дополнительные возможности

> Демонстрация

> Вопросы

Page 4: Splunk - универсальная платформа для работы с любыми данными

cleverdata.ru | [email protected]

CONGREGATA

VIDI

PRAEDICTUM

Page 5: Splunk - универсальная платформа для работы с любыми данными

HA / DR Admin Data Security Apps SDKs/APIScale

Сборданных

Индексацияданных

Обогащениеданных

Поиски

исследованиеПрогноз

Отчетыи

dashboards

Оповещения

cleverdata.ru | [email protected]

- полностью интегрированная платформа масштаба предприятияsplunk>

Page 6: Splunk - универсальная платформа для работы с любыми данными

Congregata (собрал)

Page 7: Splunk - универсальная платформа для работы с любыми данными

cleverdata.ru | [email protected]

Исходные данныеиз любых источников, различных типов и объема

Online Services Web

Services

ServersSecurity GPS

Location

StorageDesktops

Networks

Packaged Applications

CustomApplicationsMessaging

TelecomsOnline

Shopping Cart

Web Clickstreams

Databases

Energy Meters

Call Detail Records

Smartphones and Devices

RFID

On-Premises

Private Cloud

Public Cloud

Аналитикапо направлениям

Доступность сервисов и

приложений

Безопасность

IT Operations

Бизнес-аналитика

Технологические процессы

Источники данных splunk>

Page 8: Splunk - универсальная платформа для работы с любыми данными

cleverdata.ru | [email protected]

Local Event LogsCollect event logs from this machine

Remote Event LogsCollect event logs from remote hosts Files & Directories

Upload a file, index a local file, or monitor an entire directory

HTTP Event CollectorConfigure tokens that clients can use to send data over HTTP or HTTPS

TCP / UDPConfigure Splunk to listen on a network port

Local Performance MonitoringCollect performance data from this machine

Remote Performance MonitoringCollect performance and event information from remote hosts

Registry monitoringHave Splunk index the local Windows Registry

Active Directory monitoringIndex and monitor Active Directory

Local Windows host monitoringCollect up-to-date hardware and software

Local Windows network monitoringThis is an input for Splunk Network Monitor

Local Windows print monitoringCollect information about printers, printer jobs

ScriptsGet data from from any API, service, or database with a script

Modular inputPython script

Powershell Modular InputExecute PowerShell scripts v3 with parameters as inputs

RESTREST API input for polling data from RESTful endpoints

Wire dataPassively capture wire data from network traffic

Источники данных splunk>

DataBasesSQL and NoSQL

SyslogSyslog

Page 9: Splunk - универсальная платформа для работы с любыми данными

cleverdata.ru | [email protected]

Автоматическая балансировка нагрузки между Splunk Indexers

Распределенный поиск с использованием Splunk Search Heads

Источники с установленными Splunk Forwarders

Масштабируемость, надежность и доступность splunk>

Page 10: Splunk - универсальная платформа для работы с любыми данными

Vidi (увидел)

Page 11: Splunk - универсальная платформа для работы с любыми данными

cleverdata.ru | [email protected]

Аналитика в splunk >splunk>: примеры панелей управления

Page 12: Splunk - универсальная платформа для работы с любыми данными

cleverdata.ru | [email protected]

splunk>: примеры панелей управленияАналитика в splunk >

Page 13: Splunk - универсальная платформа для работы с любыми данными

cleverdata.ru | [email protected]

splunk> аналитика геоинформационных данных

Анализ количества транзакций клиентов, сгруппированных по

уровню текущего остатка, за последний час

…| lookup… | geostats latfield=eventlat longfield=eventlong count(trn) by current_balance| where card_type=mastercard

Поисковая команда языка SPL

Аналитика в splunk >

Page 14: Splunk - универсальная платформа для работы с любыми данными

cleverdata.ru | [email protected]

> Разработка аналитических моделей данных (data models) на базе команд SPL.> Использование моделей данных конечными бизнес-пользователями в редакторе PIVOT.> Размещение результатов в отчетах и панелях управления (dashboards).

Поисковый запрос SPL

Атрибуты результирующей

выборки

Аналитика в splunk >

Page 15: Splunk - универсальная платформа для работы с любыми данными

cleverdata.ru | [email protected]

Мониторинг и оповещения

Page 16: Splunk - универсальная платформа для работы с любыми данными

cleverdata.ru | [email protected]

Интеграция splunk> с MS Excel и BI:

Pentaho Business Analytics, Tableau, Microstrategy.

Интеграция splunk> с BI

Page 17: Splunk - универсальная платформа для работы с любыми данными

cleverdata.ru | [email protected]

Интеграция splunk> с BI

Page 18: Splunk - универсальная платформа для работы с любыми данными

cleverdata.ru | [email protected]

Интеграция splunk> с Tableau

Анализ данных splunk> в Tableau

Page 19: Splunk - универсальная платформа для работы с любыми данными

cleverdata.ru | [email protected]

Интеграция splunk> с Pentaho Business Analytics

Интеграция c сервером Splunk> в среде Pentaho data Integration

(PDI)

Анализ данных Splunk> в Pentaho Business Analytics

Page 20: Splunk - универсальная платформа для работы с любыми данными

Praedictum (предсказал)

Page 21: Splunk - универсальная платформа для работы с любыми данными

cleverdata.ru | [email protected]

Data mining и Machine Learning

Отрасль Пример

IT Прогноз объема интернет-трафика по дням недели.IT Real-time анализ логов proxy-сервера и web-сервера на наличие определенных слов или выражений

для предотвращения SQL injections. Используется наивная байесовская классификация. IT Прогнозирование нагрузки на Службу поддержки на основании активности клиентов (например,

смена/сброс пароля, запрос баланса и т.д.). Планирование активностей по привлечению

дополнительных ресурсов в пиковые периоды.Банки Прогноз нагрузки на платежный шлюз банка (например, запросов в секунду) на основании

имеющейся статистики. Определение пиковых и адаптивных пороговых значений на основании

функционала Splunk по выявлению аномалий (anomaly detection).Банки Real-time анализ ВСЕХ действий клиентов (в т.ч. потенциальных) на сайте банка/на странице с

кредитным калькулятором для принятия решения о выдаче кредита. Использование

дополнительных имеющихся атрибутов (предикторов).Промышлен

ностьОпределение вероятности снижения энергоэффективности оборудования (повышение потребляемой

мощности, снижение КПД) на основании характеристик его работы из логов управляющих систем,

информации с датчиков и сенсоров и выявленной статистики снижения энергоэффективности.

Проведение внеплановых замен/модернизаций оборудования на основании полученного прогноза.

Page 22: Splunk - универсальная платформа для работы с любыми данными

cleverdata.ru | [email protected]

Data mining и Machine Learning

Отрасль Пример

Маркетинг 1. Прогнозирование объема продаж.

2. Определение ассоциативных правил, приводящих к покупкам на сайте. Динамическое

формирование страниц сайта (контента страниц) для повышения конверсии.

Безопасность Определение транзакций клиентов, которые выполняются со скоростью, значительно

превышающую скорость других клиентов (средняя частота использования карты, идентификатора

клиента и т.д.). Данное поведение может быть идентифицировано как шаблон. Например,

использование интернет-ботов (bot) для перебора паролей/загрузки канала или планирование

DDoS атак. Используется функционал Splunk по выявлению аномалий (anomaly detection).

Безопасность Определение шаблонов аномальной передачи данных. Построение предиктивной модели,

которая будет определять такие шаблоны и уведомлять заинтересованных лиц, используя

механизм alert’ов.

Телеком Predict Customer Churn. Построение модели оттока клиентов.

Page 23: Splunk - универсальная платформа для работы с любыми данными

cleverdata.ru | [email protected]

> Большая библиотека команд и алгоритмов.

> Возможность использовать R и Python с помощью R Project App и SDK for Python.> Набор дополнительных приложений: Machine Learning Toolkit and Showcase, Predict App, Sentiment analysis App, Prelert.

> Богатые возможности визуализации (в т.ч. использование D3).

Анализ трендов: predict, trendline, autoregress

Выявление аномалий и сегментирование: anomalies,

cluster, kmeans

Data mining и Machine Learning

Page 24: Splunk - универсальная платформа для работы с любыми данными

cleverdata.ru | [email protected]

Команды и алгоритмы:> корреляция;> кластеризация (k means, cluster);> ассоциативные правила;> классификация и прогнозирование (байесовская классификация, регрессии, SVM);> поиск аномалий;> метод главных компонент (PCA);

> а также использование любыхбиблиотек и алгоритмов как команд Splunk (SPL).

Команда Описание

analyzefields Analyze numerical fields for their ability to predict another discrete field.

anomalies Computes an "unexpectedness" score for an event.

anomalousvalue Finds and summarizes irregular, or uncommon, search results.

cluster Clusters similar events together.

kmeans Performs k-means clustering on selected fields.

outlier Removes outlying numerical values.

rare Displays the least common values of a field.

contingency Builds a contingency table, a co-occurrence matrix, for the values of two fields.

correlate Calculates the correlation between different fields.

predict Enables you to use time series algorithms to predict future values of fields.

trendline Computes moving averages of fields.

x11 Enables you to determine the trend in your data by removing the seasonal pattern.

Data mining и Machine Learning

Page 25: Splunk - универсальная платформа для работы с любыми данными

cleverdata.ru | [email protected]

ML Toolkit and Showcase

> Линейная регрессия > Логистическая регрессия > Определение аномалий

> Кластеризация > Прогнозирование

Page 26: Splunk - универсальная платформа для работы с любыми данными

cleverdata.ru | [email protected]

Собственные приложения и визуализация с использованием D3

Page 27: Splunk - универсальная платформа для работы с любыми данными

cleverdata.ru | [email protected]

Использование любых алгоритмов как команд SPL

Новая команда SPL «dtree»

Page 28: Splunk - универсальная платформа для работы с любыми данными

cleverdata.ru | [email protected]

Дополнительные возможности

> Splunk> Enterprise Security.

> Splunk> ITSI.

> Интеграция HUNK с Hadoop как оптимальный путь

использования имеющихся «больших данных».

Page 29: Splunk - универсальная платформа для работы с любыми данными

cleverdata.ru | [email protected]

splunk> ITSI

> Service AnalyzerВысокоуровневая панель состояния сервисов и интегральных показателей.

> Glass TablesПерсонализированное представление состояния сервисов и показателей.

> Deep divesДетальный сравнительный анализ состояния сервисов на общей шкале времени.

> Notable EventsУдобное представление значимых событий.

> Multi KPI AlertsНастройка оповещений при корреляции нескольких событий.

> Data driven analysis: anomaly detection and adaptive thresholdsОпределение аномальных событий и релевантных (адаптивных) пороговых значений показателей на основе использования методов машинного обучения.

Page 30: Splunk - универсальная платформа для работы с любыми данными

cleverdata.ru | [email protected]

splunk> HUNK

Подготовительные действия:- Установка java;- Развертывание необходимого дистрибутива Hadoop.Настройка HUNK в два шага:1. Настройка провайдера Hadoop;2. Настройка виртуального индекса.

Простые шаги к использованию данных Hadoop

Page 31: Splunk - универсальная платформа для работы с любыми данными

cleverdata.ru | [email protected]

> Платформа обеспечивающая «зонтичный мониторинг», объединяя любые системы и сервисы гетерогенного IT-ландшафта компании в сквозные процессы мониторинга. Проактивный мониторинг соответствия процессов KPI и SLA. Формирование сервисно-ресурсной модели с отображением KPI.> Простой доступ к данным всех систем и сервисов в соответствии с настраиваемой ролевой моделью: использование dashboards, отчетов и pivots.> Быстрый поиск причин инцидентов, путем выявления корреляций между событиями в различных системах.> Real-time аналитика событий и показателей: от уровня IT до уровня а бизнес-процессов компании в целом.

> Адаптивный мониторинг и Machine Learning.

Отличительные особенности splunk>

Page 32: Splunk - универсальная платформа для работы с любыми данными

cleverdata.ru | [email protected]

splunk >

> Универсальная платформа для любых данных

> Масштабируемость от уровня desktop до enterprise

> Развитые возможности аналитики

> Быстрое получение первых бизнес-результатов

Page 33: Splunk - универсальная платформа для работы с любыми данными

cleverdata.ru | [email protected]

Демонстрация

Page 34: Splunk - универсальная платформа для работы с любыми данными

cleverdata.ru | [email protected]

Спасибо!

Page 35: Splunk - универсальная платформа для работы с любыми данными

cleverdata.ru | [email protected]

Вопросы

Page 36: Splunk - универсальная платформа для работы с любыми данными