data driven journalism - i primi passi
DESCRIPTION
Introduzione alle esperienze internazionali e nazionali di data j per gli studenti del Master in giornalismo dello IULM, summer school IULM-Ahref agosto 2012, TransacquaTRANSCRIPT
data driven journalism
i primi passi
Elisabetta Tola
iData - fondazione ahref
formicablu srl
Guido Romeo
iData - fondazione ahref
Wired IT
II ed. Summer School ahref-IULM, 27.08.12
1. cosa succede in giro per il mondo2. cosa succede in Italia3. perché fare ddj4. un processo a step5. primi tools del data journalist6. le fonti7. get your hands on those data – think in xls
http://datajournalism.stanford.edu/
cosa succede in giro per il mondo
http://www.guardian.co.uk/news/datablog
http://www.guardian.co.uk/news/datablog
http://www.nytimes.com/interactive/2012/01/15/business/one-percent-map.html
http://www.nytimes.com/2012/01/15/business/the-1-percent-paint-a-more-nuanced-portrait-of-the-rich.html?_r=1&ref=business
http://www.nytimes.com/interactive/2012/05/13/business/student-debt-at-colleges-and-universities.html?ref=multimedia
http://www.baycitizen.org/data/bike-accidents/
L’inchiesta Dollars for docshttp://projects.propublica.org/docdollars/
http://www.heraldtribune.com/article/20110418/BREAKING/110419506
2011: i dati vincono il Pulitzer
Paige St. John
http://cf.htcreative.com/insurance2/insuranceriskhome.html
cosa succede in Italia
http://www.transcrime.unitn.it/tc/1.phphttp://www.corriere.it/cronache/speciali/2011/mafiopoli/
http://danielebelleri.altervista.org/mappamilano2012.html
Audizione del Presidente dell’Istat Enrico Giovannini alla Commissione Territorio, Ambiente e Beni ambientali del Senato
http://www.focus.it/scienza/salute/la-guida-ai-migliori-ospedali-ditalia_52321_C12.aspx
http://www.toxiceurope.eu/index.html
http://www.ahref.eu/it
http://datablog.ahref.eu/i-numeri-della-scuola-1-2013-lavorare-con-i-dati-della-scuola
http://datablog.ahref.eu/
perché fare ddj
È uno strumento per raccontare storie complesse da tanti punti di vistaÉ uno strumento collaborativoRende trasparente il processo di costruzione della storiaTrasforma un racconto astratto in un quadro comprensibile e spesso direttamente correlato al lettore
É un giornalismo di precisione, che applica un metodo scientificoGenera storie nuove e correlate a livello globale e localeSviluppa nuove competenze e dà nuove opportunitàValorizza la reteÈ un equalizer: non dipende dalla lingua
un processo a step
ma si parte comunque dalle domande
EJC - Mirko Lorenz
Il bugiardino
I dati raramente arrivano puliti e pronti all'uso
Spesso sono in formato non prontamente utilizzabile (.pdf, flash!)e vanno estratti
I dati raccolti per fini burocratici sono organizzati
diversamente da quelli utili per fini giornalistici
(meno precisione, molti codici incomprensibili)
leggere sempre le note metodologiche!!!
attenti ai confronti(es. dati sui crimini in diversi paesi)
Nel data j contano più la reputazione e l'affidabilità che
non la velocità di pubblicazione!
Un buon lavoro di data j genera molto traffico su un sito e non
muore a breve termine (più storie nel tempo)
i primi tools del data journalist
raccogliere i numeri organizzare i dati
excelgoogle spreadsheet
libre calcaccess, SQL
RSPSS o Stata
pulire i dati - Google Refineprime analisi e viz – Google Fusion Tables – Google charts
mappe – BatchGeo, QGisaltri strumenti semplici di data
viz: ManyEyes, Tableau
le fonti di dati
incrociare più fonti e verificare i dati
SEMPRE (la preziosa lista degli
esperti-amici!)
Comuni, Province, Regioni: servizi statistici, osservatori
Siti dei Ministeri
Istat: dati.istat.it
dati.gov.it e vari portali opendata
Grandi aziende:ENEL,INPShttp://data.enel.com/
Camere di commercio: a pagamento
OKFN,SOD e Linked Open Data,GlobalLeaks,Scraper wiki
ONG: legambiente, associazioni consumatori, cittadinanzattiva,
etc
Altri siti di news e alcuni blog (dati grezzi resi
disponibili per riuso – eg. EU structural funds – eg.
http://fortresseurope.blogspot.it/)
Sindacati e associazioni di categoria: vari report
Università e istituti di ricerca
Organizzazioni internazionali: OECD, UNICEF, FAO, World Bank,
etc (eg. OECD e FAO sulla produzione di grano)
Saper cercare
1. cercare con più parole chiave (beware: termini burocratici e
tecnici)2. specificare il formato: filetype:xls, filetype:csv
3. limitare la ricerca a un sito: site:dati.emilia-romagna.it4. usare search site o plugin
simile
Le info al contorno
1. whois.domaintools.com – chi ha registrato un sito, varie info2. the wayback machine – le
vecchie pagine3. TinEye – ritrovare l'origine
di una immagine
E con i dati che faccio?
1. salvare sempre il file originale, lavorare su una copia2. fare screenshot delle pagine
3. tenere diario di bordo4. non usare i dati per
confermare visioni preconcette5. accettare dati non completi
Quando i dati non sono online?
1. richiedere i dati (no tel)2. parlare con la persona responsabile dei dati3. informare sulla pubblicazione: può facilitare rilascio altri dati4. lanciare raccolta dati in crowdsourcing5. conoscere bene il FOIA e le sue applicazioni
The investigation is a story: la storia della costruzione del
puzzle è un buon pezzo di giornalismo (soprattutto se
qualcuno mette i bastoni tra le ruote)
Le domande valide sono sempre le stesse: i dati sono una
sorte di fonte 'viva'
http://datajournalismhandbook.org/
Altre ref Hacks/Hackers Ahref Datablog datajournalism.it
data driven journalism
i primi passi
Elisabetta Tola
iData - fondazione ahref
formicablu srl
Guido Romeo
iData - fondazione ahref
Wired IT
II ed. Summer School ahref-IULM, 27.08.12
1. cosa succede in giro per il mondo2. cosa succede in Italia3. perché fare ddj4. un processo a step5. primi tools del data journalist6. le fonti7. get your hands on those data – think in xls
cosa succede in giro per il mondo
http://www.guardian.co.uk/news/datablog
http://www.guardian.co.uk/news/datablog
http://www.nytimes.com/interactive/2012/01/15/business/one-percent-map.html
http://www.nytimes.com/2012/01/15/business/the-1-percent-paint-a-more-nuanced-portrait-of-the-rich.html?_r=1&ref=business
http://www.baycitizen.org/data/bike-accidents/
L’inchiesta Dollars for docshttp://projects.propublica.org/docdollars/
http://www.heraldtribune.com/article/20110418/BREAKING/110419506
2011: i dati vincono il Pulitzer
Paige St. John
http://cf.htcreative.com/insurance2/insuranceriskhome.html
cosa succede in Italia
http://openspending.org/
http://www.transcrime.unitn.it/tc/1.phphttp://www.corriere.it/cronache/speciali/2011/mafiopoli/
http://danielebelleri.altervista.org/mappamilano2012.html
Audizione del Presidente dell’Istat Enrico Giovannini alla Commissione Territorio, Ambiente e Beni ambientali del Senato
http://www.ahref.eu/it
http://datablog.ahref.eu/i-numeri-della-scuola-1-2013-lavorare-con-i-dati-della-scuola
http://datablog.ahref.eu/
un processo a step
ma si parte comunque dalle domande
EJC - Mirko Lorenz
Il bugiardino
I dati raramente arrivano puliti e pronti all'uso
Spesso sono in formato non prontamente utilizzabile (.pdf, flash!)e vanno estratti
I dati raccolti per fini burocratici sono organizzati
diversamente da quelli utili per fini giornalistici
(meno precisione, molti codici incomprensibili)
leggere sempre le note metodologiche!!!
attenti ai confronti(es. dati sui crimini in diversi paesi)
Nel data j contano più la reputazione e l'affidabilità che
non la velocità di pubblicazione!
Un buon lavoro di data j genera molto traffico su un sito e non
muore a breve termine (più storie nel tempo)
raccogliere i numeri organizzare i dati
excelgoogle spreadsheet
libre calcaccess, SQL
RSPSS o Stata
pulire i dati - Google Refineprime analisi e viz – Google Fusion Tables – Google charts
mappe – BatchGeo, QGisaltri strumenti semplici di data
viz: ManyEyes, Tableau