using predictive analytics to forecast drone attacks in pakistan adailson de castro marcio mendes...

38
Using Predictive Analytics to Forecast Drone Attacks in Pakistan Adailson de Castro Marcio Mendes Uzma Afzal Federal Urdu University of Arts Science & Technology Karachi, Pakistan Dr. Tariq Mahmood PAF - Karachi Institute of Economics & Technology Karachi, Pakistan

Upload: artur-fontes-chagas

Post on 07-Apr-2016

216 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Using Predictive Analytics to Forecast Drone Attacks in Pakistan Adailson de Castro Marcio Mendes Uzma Afzal Federal Urdu University of Arts Science &

Using Predictive Analytics to Forecast Drone Attacks in Pakistan

Adailson de CastroMarcio Mendes

Uzma AfzalFederal Urdu University ofArts Science & TechnologyKarachi, Pakistan

Dr. Tariq MahmoodPAF - Karachi Institute ofEconomics & TechnologyKarachi, Pakistan

Page 2: Using Predictive Analytics to Forecast Drone Attacks in Pakistan Adailson de Castro Marcio Mendes Uzma Afzal Federal Urdu University of Arts Science &

Roteiro

• Contextualização• Objetivo• Dados• Ferramentas• Preprocessamento• Modelagem e Forecasting• Conclusão

Page 3: Using Predictive Analytics to Forecast Drone Attacks in Pakistan Adailson de Castro Marcio Mendes Uzma Afzal Federal Urdu University of Arts Science &

Drones• Unmanned Aerial Vehicles (UAV) or• Remotely Piloted Aerial Systems (RPAS).

• São empregados, no âmbito militar, em condições onde o vôo tripulado é considerado difícil e arriscado.

Page 4: Using Predictive Analytics to Forecast Drone Attacks in Pakistan Adailson de Castro Marcio Mendes Uzma Afzal Federal Urdu University of Arts Science &

Drones

Page 5: Using Predictive Analytics to Forecast Drone Attacks in Pakistan Adailson de Castro Marcio Mendes Uzma Afzal Federal Urdu University of Arts Science &

Drones

Page 6: Using Predictive Analytics to Forecast Drone Attacks in Pakistan Adailson de Castro Marcio Mendes Uzma Afzal Federal Urdu University of Arts Science &

Objetivo• Aplicar tecnicas de previsão para medir futuros danos

• E prever ataques futuros para salvar vidas inocentes

Page 7: Using Predictive Analytics to Forecast Drone Attacks in Pakistan Adailson de Castro Marcio Mendes Uzma Afzal Federal Urdu University of Arts Science &

Os Ataques

Page 8: Using Predictive Analytics to Forecast Drone Attacks in Pakistan Adailson de Castro Marcio Mendes Uzma Afzal Federal Urdu University of Arts Science &

Fontes1. Pakistan Body Count (PBC) Website2. Cruzamentos das correspondencias

com1. entradas na wikipedia2. South Asia Terrorism Portal (SATP)

Website

• Cerca de 340 ataques registrados, desde Junho/2004 até junho/2013

Page 9: Using Predictive Analytics to Forecast Drone Attacks in Pakistan Adailson de Castro Marcio Mendes Uzma Afzal Federal Urdu University of Arts Science &

Atributos

Page 10: Using Predictive Analytics to Forecast Drone Attacks in Pakistan Adailson de Castro Marcio Mendes Uzma Afzal Federal Urdu University of Arts Science &

Atributos

Page 11: Using Predictive Analytics to Forecast Drone Attacks in Pakistan Adailson de Castro Marcio Mendes Uzma Afzal Federal Urdu University of Arts Science &

Atributos

Curtose

Obliquidade

Média

Page 12: Using Predictive Analytics to Forecast Drone Attacks in Pakistan Adailson de Castro Marcio Mendes Uzma Afzal Federal Urdu University of Arts Science &

Atributos

Número de ataques

JUN 2004 JUN 2013

Page 13: Using Predictive Analytics to Forecast Drone Attacks in Pakistan Adailson de Castro Marcio Mendes Uzma Afzal Federal Urdu University of Arts Science &

Atributos

Mortes de Militantes

JUN 2004 JUN 2013

Page 14: Using Predictive Analytics to Forecast Drone Attacks in Pakistan Adailson de Castro Marcio Mendes Uzma Afzal Federal Urdu University of Arts Science &

Atributos

Mortes de civis

JUN 2004 JUN 2013

Page 15: Using Predictive Analytics to Forecast Drone Attacks in Pakistan Adailson de Castro Marcio Mendes Uzma Afzal Federal Urdu University of Arts Science &

Atributos

Feridos

JUN 2004 JUN 2013

Page 16: Using Predictive Analytics to Forecast Drone Attacks in Pakistan Adailson de Castro Marcio Mendes Uzma Afzal Federal Urdu University of Arts Science &

AtributosSobreposição

JUN 2004 JUN 2013

Numero de ataquesMortes de civisMortes de militantes

Obs.: Escala Aproximada

Page 17: Using Predictive Analytics to Forecast Drone Attacks in Pakistan Adailson de Castro Marcio Mendes Uzma Afzal Federal Urdu University of Arts Science &

Série temporal EstacionáriaUma série temporal é dita estacionária quando ela se desenvolve no tempo aleatoriamente ao redor de uma média constante, refletindo alguma forma de equilíbrio estável. O que facilita a previsão.

Page 18: Using Predictive Analytics to Forecast Drone Attacks in Pakistan Adailson de Castro Marcio Mendes Uzma Afzal Federal Urdu University of Arts Science &

TransformaçãoNâo Estacionária -> estacionária

Diferenças sucessivas da série original

Primeira diferença:

Segunda diferença:

N-ésima diferença:

Page 19: Using Predictive Analytics to Forecast Drone Attacks in Pakistan Adailson de Castro Marcio Mendes Uzma Afzal Federal Urdu University of Arts Science &

TransformaçãoEstacionária -> Não estacionária

Diferenças sucessivas da série original

Page 20: Using Predictive Analytics to Forecast Drone Attacks in Pakistan Adailson de Castro Marcio Mendes Uzma Afzal Federal Urdu University of Arts Science &

Trend

Trend, ou tendência , é o movimento de uma serie tempo a longo prazo

Exemplo

Page 21: Using Predictive Analytics to Forecast Drone Attacks in Pakistan Adailson de Castro Marcio Mendes Uzma Afzal Federal Urdu University of Arts Science &

SeasonSeasonality, ou sazonalidade , é o movimento de uma serie temporal em intervalos menores que um ano. Mensalmente, semanalmente, diariamente , e.g.

Exemplo

Page 22: Using Predictive Analytics to Forecast Drone Attacks in Pakistan Adailson de Castro Marcio Mendes Uzma Afzal Federal Urdu University of Arts Science &

TransformaçãoEstacionária -> Não estacionária

Não é dito no artigo, mas provavelmente foram feitos testes de estacionaridade nas series temporais dos 4 parâmetros. Provavelmente também foi descoberto que as mesmas eram não estacionárias (um tanto quanto óbvio pelos gráficos), por isso a necessidade de se aplicar a transformação por uma função de diferenciação. Como é dito no artigo:

“In all four graphs, the mean value ischanging across different time periods, signaling the need to

apply a differencing function across consecutive timePeriods [...]”

Page 23: Using Predictive Analytics to Forecast Drone Attacks in Pakistan Adailson de Castro Marcio Mendes Uzma Afzal Federal Urdu University of Arts Science &

Partial Autocorrelation function (PACF)

É usado uma função de auto correção parcial(Partial Auto correlation function, PACF) para identificar a extensão do “lag”(atraso) no modelo

Seja um valor da serie temporal no tempo t:

Auto correlação parcial do lag 1:

Auto correlação parcial do lag k:

Page 24: Using Predictive Analytics to Forecast Drone Attacks in Pakistan Adailson de Castro Marcio Mendes Uzma Afzal Federal Urdu University of Arts Science &

Partial Autocorrelation function (PACF)

Page 25: Using Predictive Analytics to Forecast Drone Attacks in Pakistan Adailson de Castro Marcio Mendes Uzma Afzal Federal Urdu University of Arts Science &

IBM SPSS Tool

Exponential Smoothing

Autoregressive Integrated Moving Average (ARIMA)

AutomatedExpert Modeler

Page 26: Using Predictive Analytics to Forecast Drone Attacks in Pakistan Adailson de Castro Marcio Mendes Uzma Afzal Federal Urdu University of Arts Science &

Exponential Smoothing

+(1- )

𝑆0=𝑋 0

0<<1

Smoothing Factor (“Fator Suavizante”, tradução livre)

Previsão no tempo “t”

Valor observado no instante inicial

Page 27: Using Predictive Analytics to Forecast Drone Attacks in Pakistan Adailson de Castro Marcio Mendes Uzma Afzal Federal Urdu University of Arts Science &

ARIMAAutoregressive Integrated Moving Average

(1−∑𝑖=1𝑝

𝜑𝑖𝐿𝑖) (1− 𝐿)𝑑𝑋 𝑡=𝛿+(1+∑𝑖=1

𝑞

𝜃𝑖𝐿𝑖)𝜀𝑡

Modelo ARIMA (p, d, q) ARIMA (autoregressive, Integrated, Moving)

Lag Operator Erro

Número de parâmetrosauto-regressivos,

Número de diferenças número de parâmetros da média móvel

𝐿𝑖=𝑋 𝑡 −𝑖/ 𝑋 𝑡𝑋 𝑡−𝑋 𝑡− 1=𝜀𝑡

Page 28: Using Predictive Analytics to Forecast Drone Attacks in Pakistan Adailson de Castro Marcio Mendes Uzma Afzal Federal Urdu University of Arts Science &

ARIMAAutoregressive Integrated Moving Average

(1−∑𝑖=1𝑝

𝜑𝑖𝐿𝑖) (1− 𝐿)𝑑𝑌 𝑡=𝛿+(1+∑𝑖=1

𝑞

𝜃𝑖𝐿𝑖)𝜀𝑡

𝑌 𝑡 ¿ (1−𝐿 )𝑑 𝑋 𝑡

𝑌 𝑡=(𝛿+(1+∑𝑖=1𝑞

𝜃 𝑖𝐿𝑖)𝜀𝑡) /((1−∑𝑖=1

𝑝

𝜑𝑖𝐿𝑖)(1−𝐿 )𝑑  )

Page 29: Using Predictive Analytics to Forecast Drone Attacks in Pakistan Adailson de Castro Marcio Mendes Uzma Afzal Federal Urdu University of Arts Science &

Dados observados vs Forecast

Dados observadosForecast

Expert Modeler

Page 30: Using Predictive Analytics to Forecast Drone Attacks in Pakistan Adailson de Castro Marcio Mendes Uzma Afzal Federal Urdu University of Arts Science &

Dados observadosForecast

ARIMA Modelado Manualmente

Dados observados vs Forecast

Page 31: Using Predictive Analytics to Forecast Drone Attacks in Pakistan Adailson de Castro Marcio Mendes Uzma Afzal Federal Urdu University of Arts Science &

Comparação de erros

Root Mean Squared Error (RMSE)

Page 32: Using Predictive Analytics to Forecast Drone Attacks in Pakistan Adailson de Castro Marcio Mendes Uzma Afzal Federal Urdu University of Arts Science &

Dados observados Forecast

Expert Modeler

Page 33: Using Predictive Analytics to Forecast Drone Attacks in Pakistan Adailson de Castro Marcio Mendes Uzma Afzal Federal Urdu University of Arts Science &

ARIMA Modelado Manualmente

Page 34: Using Predictive Analytics to Forecast Drone Attacks in Pakistan Adailson de Castro Marcio Mendes Uzma Afzal Federal Urdu University of Arts Science &

Forecast

Page 35: Using Predictive Analytics to Forecast Drone Attacks in Pakistan Adailson de Castro Marcio Mendes Uzma Afzal Federal Urdu University of Arts Science &

Forecast• Julho 2013: 2(ataques), 17

(militantes), 2(estrangeiros), 0 (feridos)

• Agosto 2013: Não houve ataques• Setembro 2013: 3(ataques), 6

(militantes), 12(civis e estrangeiros), 9 (feridos)

• Outubro 2013: 2(ataques), 5 (militantes), 3(civis), 5 (feridos)

• Novembro 2013: 2(ataques), 2 (militantes), 6(civis e estrangeiros), 10 (feridos)

• Dezembro 2013: 2(ataques), 0 (militantes), 9(civis), 3 (feridos)

Page 36: Using Predictive Analytics to Forecast Drone Attacks in Pakistan Adailson de Castro Marcio Mendes Uzma Afzal Federal Urdu University of Arts Science &

Comparação do ARIMA e EM em 2012

Page 37: Using Predictive Analytics to Forecast Drone Attacks in Pakistan Adailson de Castro Marcio Mendes Uzma Afzal Federal Urdu University of Arts Science &

Conclusão• O Expert Modeler, no IBM SPSS, se mostrou melhor, com menos erros que o ARIMA Modelado Manualmente.

• Os ataques tem grande número de civis mortos comparados com as mortes de militantes.

Page 38: Using Predictive Analytics to Forecast Drone Attacks in Pakistan Adailson de Castro Marcio Mendes Uzma Afzal Federal Urdu University of Arts Science &

Obrigado, dúvidas?