big data e agile analytics

57
Big Data e Agile Analytics @lucabastos ThoughtWorks

Upload: luca-bastos

Post on 13-Dec-2014

513 views

Category:

Technology


1 download

DESCRIPTION

Apresentação feita no TDC 2013 em 10/07/2013 na trilha de NoSQL.

TRANSCRIPT

Page 1: Big data e agile analytics

Big Data e Agile Analytics

@lucabastos ThoughtWorks

Page 2: Big data e agile analytics

O Mercado hoje precisa de analíticos

Page 3: Big data e agile analytics

Os líderes estão sob pressão crescente para tomar as decisões certas e fazer previsões para seus

negócios.

Page 4: Big data e agile analytics

Estagnação, competição global crecente, mercado que se modifica rápido, redução de

margens de lucro.

Page 5: Big data e agile analytics

Alguns ramos industriais que eram antes eram poderosos estão quase

em colapso.

Exemplo: imprensa tradicional.

Page 6: Big data e agile analytics

É preciso aumentar a retenção dos clientes e a participação no

mercado.

Page 7: Big data e agile analytics

É preciso medir, aprender.

Page 8: Big data e agile analytics

A combinação de BigData com Agile Analytics promete ser a

solução.

Page 9: Big data e agile analytics

O que é Big Data?

Page 10: Big data e agile analytics

Para mim Big Data são dados cujo tamanho são parte do problema

Page 11: Big data e agile analytics

Agile Analytics

Page 12: Big data e agile analytics

Do que estamos falando?

Page 13: Big data e agile analytics

Conjunto de ferramentas e métodos

Page 14: Big data e agile analytics

Conjunto de ferramentas e métodos

que visa perceber padrões e extrair visões

Page 15: Big data e agile analytics

Conjunto de ferramentas e métodos

que visa perceber padrões e extrair visões

a partir de registros de observações e dados de exemplos ou experiências passadas.

Page 16: Big data e agile analytics

Para quê é usado

Page 17: Big data e agile analytics

Web mining

Decisões que envolvem julgamento

Examinar imagens (screening)

Previsões

Diagnósticos

Análises de marketing e de vendas

Page 18: Big data e agile analytics

Afinal, que diabo é isso?

Page 19: Big data e agile analytics

A arte de fazer as questões certas.

Page 20: Big data e agile analytics

A ciência de usar dados para encontrar as respostas.

Page 21: Big data e agile analytics

A coragem de agir sobre as evidências e sobre os dados mesmo quando contraria o senso comum e

os conceitos previamente estabelecidos.

Page 22: Big data e agile analytics

Alguns tipos de problemas que podemos resolver

Page 23: Big data e agile analytics

Agrupar coisas relacionadas -‐ clustering

Page 24: Big data e agile analytics

Agrupar coisas relacionadas -‐ clustering

Page 25: Big data e agile analytics

Agrupar coisas relacionadas -‐ clustering

Page 26: Big data e agile analytics

Agrupar coisas relacionadas -‐ clustering

Não supervisionado

Page 27: Big data e agile analytics

Exemplo de clustering:

Linkedin, Skills & Expertise:

http://www.linkedin.com/skills/skill/Machine_Learning?trk=skills-‐hp-‐search

Page 28: Big data e agile analytics

Previsões

Se dividem de acordo com a tarefa que faz:

Classificação – prevê resultados qualitativos discretos do tipo S/N, morre/sobrevive

Regressão – prevê resultados quantitativos

Page 29: Big data e agile analytics

Classificação consiste em rotular um input baseado em dados previamente vistos

Filtro anti spam

Identificação de linguagem

Detecção de rosto (você conhece o rosto)

Page 30: Big data e agile analytics
Page 31: Big data e agile analytics
Page 32: Big data e agile analytics
Page 33: Big data e agile analytics

Recomendações

Page 34: Big data e agile analytics

Detecção de anomalias

Reconhecer padrão de intrusão

Resolver ambiguidades

Fraudes financeiras

Page 35: Big data e agile analytics

Por que chamar de Agile Analytics?

Page 36: Big data e agile analytics

Collective Intelligence

Page 37: Big data e agile analytics

Collective Intelligence

Parece que há um esforço coletivo de inteligência quando na verdade os dados podem vir de fontes não exatamente das mais inteligentes

Page 38: Big data e agile analytics

Collective Intelligence

Prefiro não usar o termo genérico Collective Intelligence.

Page 39: Big data e agile analytics

Predictive Analytics

Page 40: Big data e agile analytics

Predictive Analytics

Na verdade a técnicas usadas nesta área de conhecimento vão muito além de análise preditiva.

Page 41: Big data e agile analytics

Predictive Analytics

Prefiro não usar o termo genérico Predictive Analytics.

Page 42: Big data e agile analytics

Machine Learning

Permite uma discussão filosófica. Muita gente não aceita que máquinas sejam capazes de

aprender.

Page 43: Big data e agile analytics

Machine Learning

Page 44: Big data e agile analytics

Machine Learning

É o termo mais usado mas em geral subentende uso de algoritmos complexos que nem sempre são

necessários.

Page 45: Big data e agile analytics

Machine Learning

Permite uma discussão filosófica.

Page 46: Big data e agile analytics

Machine Learning

Muita gente não aceita que máquinas sejam capazes de

aprender. Wittgenstein, Waldemar Setzer e

outros

Page 47: Big data e agile analytics

Machine Learning

Talvez não seja “politicamente correto” usar o termo genérico

Machine Learning.

Page 48: Big data e agile analytics

Agile Analytics

Vou justificar o termo com exemplos e citações

Page 49: Big data e agile analytics

DJ Patil

Data Scientist -‐ Greylock Partners, ex eBay e ex LinkedIn

Page 50: Big data e agile analytics

DJ Patil

Data Scientist -‐ Greylock Partners, ex eBay e ex LinkedIn

“Try to be clever before you do the heavyweight work”

Page 51: Big data e agile analytics

DJ Patil

Antes de começar o trabalho duro usando algoritmos sofisticados de classificação ou information retrieval, é preciso observar os dados e ver se é possível encontrar um ponto de partida mais a frente para começar a iterar.

Page 52: Big data e agile analytics

Hilary Mason

Data Scientist -‐ bitly

Nem sempre devemos a usar um tipo de armazenamento sofisticado para arquivos grandes de dados. Às vezes basta um arquivo .txt ou .csv.

Page 53: Big data e agile analytics

As primeiras ferramentas que devemos experimentar são as de linha de comando do Linux:

cat, grep, head, tail, awk, find, xargs, sort, wc, etc..

Page 54: Big data e agile analytics

As primeiras ferramentas que devemos experimentar são as de linha de comando do Linux:

cat, grep, head, tail, awk, find, xargs, sort, wc, etc..

E não esquecer recursos gráficos do gnuplot.

Page 55: Big data e agile analytics

É isso!

Page 56: Big data e agile analytics
Page 57: Big data e agile analytics