Download - ANWB Data Gedreven
ANWB data gedreven: Voorspellen van autopech
Gregor Abbas, Tijmen Blankevoort, Remko Stam
Gregor Abbas, Tijmen Blankevoort, Remko Stam
2
Hoe kunnen we big data technologie inzetten?
Gregor Abbas, Tijmen Blankevoort, Remko Stam
3
Forecasting Wegenwacht
Gregor Abbas, Tijmen Blankevoort, Remko Stam
Forecasting Wegenwacht: Wie krijgt waar wanneer waarmee pech?• ± 1.100.000 pechmeldingen per jaar• 750 wegenwachten
• Overcapaciteit = duur• Ondercapaciteit = slecht product
Datum Dag Aantal gestrande auto's - TOP 10
2012-02-07 Dinsdag 9.8902012-02-02 Donderdag 9.3522012-02-06 Maandag 9.2712012-02-01 Woensdag 8.3322010-12-02 Donderdag 7.8182010-12-01 Woensdag 7.5102010-01-04 Maandag 7.4752012-02-03 Vrijdag 7.2442010-12-20 Maandag 6.9652010-12-03 Vrijdag 6.846
Gregor Abbas, Tijmen Blankevoort, Remko Stam
5Forecasting Wegenwacht: Wie krijgt waar wanneer waarmee pech?
Ultieme uitdaging: Voorspellen dat dhr. Jansen morgen om 9:24 met zijn VW polo strandt met een lekke band (rechtsvoor) op de Kerkdijk 59.
Economische ontwikkeling
Temperatuur
Neerslag
Technologische ontwikkeling
Consumenten gedrag
Consumenten
behoeften
Global warming
De case: forecast pechgevallen
Regio’s Nederland (totaal 4)
Per half uur:
HoofdvraagKunnen we de hoeveelheid pechgevallen voorspellen op basis van historische data?
Per dag:
Analyse op werkgebied-niveau
Werkgebieden Nederland (totaal 33)
Weerstation
Per half uur:
Per dag:
Gebruikte data
Scyfer Deep Learning
Weerslag
Historische gegevens KNMIPredicties Weerslag
PechgevallenLedenaantallen
FeestdagenSchoolvakantiesDag/Maand/Jaar
Deep Learning
Superhuman image recognition (Microsoft 2015)
Self-Driving Car (Google)
Deep Learning - more complex concepts in subsequent layers
Deep learning is currently winning all machine learning challenges
Voorspellingen - Werkgebied
Voorspellingen - Regio
Voorspellingen per dag heel 2014
De resultaten
ANWB Scyfer Verbetering
Noord-Oost 44 38 14%
Noord-West 55 44 20%
Zuid 55 45 18%
Zuid-West 46 38 17%
Nederland 164 123 25%
Gemiddelde absolute fout per dag op 2014
Vergelijking Scyfer modellen en ANWB personeel voorspellingen (m.b.v. ander model en eigen inzicht)
De verbetering is t.o.v. het aantal fouten per dag.Totaal gemm. 7% foute voorspellingen per dag.
- Trainset: data 2004-2012- Validatieset: data 2013
- Hertraining data 2004-2013- Test: Forecast 2014
Sneller voorspellen
Voorheen meerdere uren per dag kwijt met maken voorspellingen
Nu:Software die met één druk op de knop de forecast maakt:
○ Downloaden weergegevens
○ Genereren input voor model
○ Voorspelling (incl. grafieken/tabellen)
In de praktijk?
Voorspellingen pechgevallen van 7% in 2014 naar 4.5% fout in deze maandMaar: Geen significant verschil tussen ANWB personeel en Scyfer model.
Vervolgstap: Zoek uit waarom dit zo is!
Conclusie
Alternatieve vervolgstap:Voorspelling locatie?
Eindresultaat:● Theoretisch verbeterd pechgevallen model m.b.v. Big Data● Snellere voorspellingen maken, geen Excel● Vervolgonderzoek: Waarom in de praktijk hetzelfde
resultaat?
Gregor Abbas, Tijmen Blankevoort, Remko Stam
17
Computer says ‘no’
Gregor Abbas, Tijmen Blankevoort, Remko Stam
18
Van Passief naar Preventief
? !
Passief Proactief Preventief
Voorspellen dat dhr. Jansen morgen om 9:24 met zijn VW polo strandt met een lekke band (rechtsvoor) op de Kerkdijk 59.
Gregor Abbas, Tijmen Blankevoort, Remko Stam
19