open data: come fare

73
Perugia, 19 maggio 2015 Sonia Montegiove DATAJOURNALISM E OPEN DATA. TRA RICERCA E INCHIESTA GIORNALISTICA DATAJOURNALISM E OPEN DATA Perugia, 19 maggio 2015 - Sonia Montegiove Foto di cucchiaio, Flickr

Upload: sonia-montegiove

Post on 02-Aug-2015

422 views

Category:

Technology


1 download

TRANSCRIPT

Page 1: Open data: come fare

Perugia, 19 maggio 2015Sonia Montegiove

DATAJOURNALISM E OPEN DATA. TRA RICERCA E INCHIESTA GIORNALISTICA

DATAJOURNALISM E OPEN DATA

Perugia, 19 maggio 2015 - Sonia Montegiove

Foto di cucchiaio, Flickr

Page 2: Open data: come fare

<Open Data: come fare>

Open Data, chi?

Open cosa?

“Un contenuto o un dato si definisce aperto se chiunque è libero di usarlo, riusarlo, ridistribuirlo – soggetto, al massimo, al requisito di attribuzione e/o condivisione allo stesso modo”

Open Knowledge Foundation

Page 3: Open data: come fare

<Open Data: come fare>

E soprattutto perché signora mia?

Page 4: Open data: come fare

<Open Data: come fare>Foto di Anna Lena Schiller, FlickrFoto di Anna Lena Schiller, Flickr

Page 5: Open data: come fare

<Open Data: come fare>Foto di Anna Lena Schiller, FlickrFoto di Anna Lena Schiller, Flickr

Page 6: Open data: come fare

<Open Data: come fare>

Identikit dell'open data

Disponibili con licenza che ne permetta l'uso da parte di chiunque

Accessibili attraverso le ICT e adatti all'utilizzo automatico da software

In formato aperto

Gratuiti o a costo marginale per la loro riproduzione e divulgazione

Page 7: Open data: come fare

<Open Data: come fare>

Disponibili: le licenze Creative Commons

Le licenze Creative Commons offrono […] diverse articolazioni dei diritti d'autore per […] creatori che desiderino condividere in maniera ampia le proprie opere secondo il modello "alcuni diritti riservati"

Page 8: Open data: come fare

<Open Data: come fare>

Quali diritti l’autore vuole riservarsi e quali vuole condividere?

Page 9: Open data: come fare

<Open Data: come fare>

E poi le licenze IODL

Italian Open Data Licenses (IODL) sono le licenze aperte sviluppate da FORMEZ PA allo scopo di dare a tutte le Amministrazioni Italiane uno strumento chiaro e certificato in grado di facilitare la diffusione e il riutilizzo dell’informazione del settore pubblico

Page 10: Open data: come fare

<Open Data: come fare>

IODL: l'utente ha la libertà di...

● consultare, estrarre, scaricare, copiare, pubblicare, distribuire e trasmettere i dati

● creare un lavoro derivato, per esempio attraverso la combinazione con altre informazioni, includendole in un prodotto o sviluppando un’applicazione informatica che le utilizzi come base dati

● usare e riutilizzare gratuitamente i dati anche per finalità lucrative

Page 11: Open data: come fare

<Open Data: come fare>

Accessibili? Pdf immagine anche no

Page 12: Open data: come fare

<Open Data: come fare>

Formato aperto [e standard]

Page 13: Open data: come fare

<Open Data: come fare>

Formato Standard

Sviluppato da un Ente Neutrale

Costruito come Standard Aperto

Implementazione Nativa Libera

Apertura/Salvataggio senza Condizioni

Page 14: Open data: come fare

<Open Data: come fare>

Formato ApertoE' indipendente da un unico software (e vendor)

E' interoperabile, perché permette una condivisione trasparente dei dati tra più sistemi eterogenei

E' perenne, perché tutela il patrimonio di informazioni nel tempo di fronte all'evoluzione della tecnologia

E' neutrale, perché non costringe l'utente a usare uno specifico software, ma lascia un'ampia scelta

Page 15: Open data: come fare

<Open Data: come fare>

Open ContentClosed Content

Open FormatClosed Format

Page 16: Open data: come fare

<Open Data: come fare>

Non Standard: Circa 2000 AC

Page 17: Open data: come fare

<Open Data: come fare>

Non Standard: Circa 2000 DC

Page 18: Open data: come fare

<Open Data: come fare>

Standard: Circa 2000 DC

Page 19: Open data: come fare

<Open Data: come fare>

Open Data a tavola

Foto di Karen Morgan, Flickr

ovvero come rendere appetibiliingredienti che non lo sono

Page 20: Open data: come fare

<Open Data: come fare>

Ingredienti

Per l'impasto:

100 g di Open Data

400 g di altre Fonti di Informazione

1 Kg di Pazienza nella ricerca

LibreOffice e altri sw open source

Per la comprensione e il mash-up:

Passione q.b.Foto di The Hellos, Flickr

Page 21: Open data: come fare

<Open Data: come fare>

Dove trovare ingredienti freschi

Portale www.dati.gov.it

Portali Open Data delle PA

Sezione Trasparenza Siti della PA

Da motore di ricerca con parola magica open data

Data scraping

Foto di Young Sok Yun, Flickr

Page 22: Open data: come fare

<Open Data: come fare>

Quanti sono i dataset liberati in Italia?

Fonte: dati.gov.it

Page 23: Open data: come fare

<Open Data: come fare>

Chi pubblica più dati?

Fonte: dati.gov.it

Page 24: Open data: come fare

<Open Data: come fare>

Chi pubblica più dati?

noi siamo qui

Fonte: dati.gov.it

Page 25: Open data: come fare

<Open Data: come fare> Foto di Bas Van Uyen, FlickrLavorare con i dati stanca?

Page 26: Open data: come fare

<Open Data: come fare>

Quando i dati [buoni] sono un sogno...

Page 27: Open data: come fare

<Open Data: come fare>

La via crucis dell'open data

1° mistero doloroso del dataset

● vecchio● incompleto ● troppo aggregato● poco aggregato ● grande tanto da mandare in

crash un foglio di calcolo

Page 28: Open data: come fare

<Open Data: come fare>

La via crucis dell'open data

2° mistero doloroso del dataset ● in solo formato chiuso (per

esempio .xls)● in finto open data (pdf

immagine), in strafinto open data (elaborazioni pubblicate in pdf di dati grezzi)

Page 29: Open data: come fare

<Open Data: come fare>

La via crucis dell'open data

3° mistero doloroso del dataset ● con nomi di colonne incomprensibili

possibilmente non descritte tramite appositi file

● con informazioni accorpate quando potrebbero essere divise

● con dati divisi quando sarebbe più utile fossero accorpati

● con colonne duplicate in italiano e inglese

● con informazioni replicate in posti diversi con nomi differenti

Page 30: Open data: come fare

<Open Data: come fare>

La via crucis dell'open data

4° mistero doloroso del dataset ● con colonne dai formati non

uniformi● con numeri che risultano testi ● con date non in formato data● con percentuali scritte tra

virgolette

Page 31: Open data: come fare

<Open Data: come fare>

La via crucis dell'open data

Rischio: crocifissione di chi presenta un dato rielaborato attraverso un dataset difettoso, non corretto, non pulito, pubblicato tanto per essere pubblicato, inutile

Page 32: Open data: come fare

<Open Data: come fare>

La strada è ancora lunga ma non disperiamo

Page 33: Open data: come fare

<Open Data: come fare>

Che fare allora?

Foto di Neil Moralee, Flickr

Page 34: Open data: come fare

<Open Data: come fare>

Si parte dal download: le piattaforme cKan

Posso cercare i dati per parola o tag

per poi effettuare il download

Page 35: Open data: come fare

<Open Data: come fare>

Si parte dal download: il caso Istat

Posso fare dei filtri ed esportare

Da notare il formatoExcel…

Page 36: Open data: come fare

<Open Data: come fare>

Si parte dal download: il caso Inps

Posso fare ricerche dei dati (anche per Categoria) ed esportare

e anche qui l'immancabile formato chiuso...

Page 37: Open data: come fare

<Open Data: come fare>

Se trovo dati .CSV

SEMPLICE!

Aprire il file con

LibreOffice e importare

il testo

Page 38: Open data: come fare

<Open Data: come fare>

E se trovo un .XLS?Un formato chiuso per esporre un dato aperto? Ossimoro?

Page 39: Open data: come fare

<Open Data: come fare>

E se trovo un .pdf?

1. Scarico Tabula

2. Lo installo

3. Apro Tabula.exe

4. Faccio upload del file.pdf

Page 40: Open data: come fare

<Open Data: come fare>

E se trovo un .pdf?

Aspetto che arrivino i dati in forma tabellare.

L'attesa dipende dalla complessità del file.

Page 41: Open data: come fare

<Open Data: come fare>

E se trovo una tabella html?

Questo non è il formato adatto a pubblicare

Il caro vecchio copia-incolla può aiutarci

Fonte: http://www.benisequestraticonfiscati.it/

Page 42: Open data: come fare

<Open Data: come fare>

Un LibreOffice in “cucina”

Foto di Young Sok Yun, Flickr

Page 43: Open data: come fare

<Open Data: come fare>

Decorare con i grafici

da così...

...a così

Fonte: http://www.dati.salute.gov.it/

Page 44: Open data: come fare

<Open Data: come fare>

Decorare con i grafici

da così...

...a così

Fonte: http://www.dati.salute.gov.it/

Page 45: Open data: come fare

<Open Data: come fare>

Decorare con i grafici

1. scaricare il dataset e aprirlo in Calc

2. selezionare i dati da rappresentare

3. Inserisci – Grafico

4. Seguire la creazione guidata

5. Rifinire modificando alcuni elementi

Page 46: Open data: come fare

<Open Data: come fare>

Decorare con i grafici (in modo guidato) Da Inserisci-Grafico...

1 2

3 4

Page 47: Open data: come fare

<Open Data: come fare>

Mettere in risalto alcuni dati

Fonte: http://dati.umbria.it

Per esempio se voglio evidenziare con un colore diverso i nidi aperti tutto l'anno...

Page 48: Open data: come fare

<Open Data: come fare>

Come fare? Formattazione condizionata

Da:

Formato

Formattazione condizionata

Condizione

Page 49: Open data: come fare

<Open Data: come fare>

Contare in base ad una condizione

Con conta.se trovo 28 scuole senza superficie esterna. Come?

CONTA.SE(intervallo celle:condizione)Fonte: http://dati.umbria.it

Page 50: Open data: come fare

<Open Data: come fare>

Contare in base ad una condizione

Con somma.se trovo che i pasti erogati da strutture aperte tutto l'anno sono 6.878. Come?

SOMMA.SE(intervallo celle in cui verificare:condizione: intervallo celle in cui sommare)

Fonte: http://dati.umbria.it

Page 51: Open data: come fare

<Open Data: come fare>

Selezionare tra tante informazioni

Fonte: http://www.dati.piemonte.it/catalogodati/dato/100670-.html

Per esempio se volessi evidenziare alcune tipologie di incarichi...

Page 52: Open data: come fare

<Open Data: come fare>

Selezionare tra tante informazioni

Da Dati

Filtro

Filtro standard

Page 53: Open data: come fare

<Open Data: come fare>

Ho così un elenco degli incarichi sopra una certa soglia

Foto di Geoff Llerena, Flickr

Page 54: Open data: come fare

<Open Data: come fare>

Ottenere somme, medie, conteggi per dato

Fonte: http:/dati.lombardia.it/

Page 55: Open data: come fare

<Open Data: come fare>

Ottenere somme, medie, conteggi per dato

Da Dati

Subtotali

Page 56: Open data: come fare

<Open Data: come fare>

Che aria tira?

1 2

3Fonte: http://www.arpa.umbria.it/open-data.aspx

Page 57: Open data: come fare

<Open Data: come fare>

E se i dati sono tanti

Page 58: Open data: come fare

<Open Data: come fare>

Da così...

Page 59: Open data: come fare

<Open Data: come fare>

...a così

Page 60: Open data: come fare

<Open Data: come fare>

La fortuna di avere le tabelle pivot

Da Dati

Tabella Pivot

Crea

Page 61: Open data: come fare

<Open Data: come fare>

Non avete capito come si usa LibreOffice?

Page 62: Open data: come fare

<Open Data: come fare>

Scaricate l'ebook gratuito da Tech Economy!

Page 63: Open data: come fare

<Open Data: come fare>

E se i dati sono da aggiustare?

Software prodotto da Google Finalizzato al data cleaning Interfaccia intuitiva e semplice da usare Open Source, sorgente disponibile in Github

Refine offre una serie di trasformazioni preconfezionate (trasformazioni comuni)

Refine utilizza il linguaggio GREL (Google Refine Expression Language) per trasformazioni avanzate

Supporta diversi formati: TSV, CSV, *SV, JSON, XML, RDF

Page 64: Open data: come fare

<Open Data: come fare>

Open Refine Luoghi di interesse, Città di Firenze (Risorsa in CSV).

Page 65: Open data: come fare

<Open Data: come fare>

Open Refine 1. Importare il file CSV in Open Refine

Page 66: Open data: come fare

<Open Data: come fare>

Open Refine 2. Eliminare colonne duplicate (italiano/inglese)

Page 67: Open data: come fare

<Open Data: come fare>

Open Refine 3. Rinominare intestazione colonne

Page 68: Open data: come fare

<Open Data: come fare>

Open Refine 4. Trasformare celle utilizzando caratteri maiuscoli

Page 69: Open data: come fare

<Open Data: come fare>

Open Refine 5. Unire due colonne ed ottenere l'indirizzo completo

Page 70: Open data: come fare

<Open Data: come fare>

Open Refine 5. Unire due colonne ed ottenere l'indirizzo completo

Page 71: Open data: come fare

<Open Data: come fare>

Open Refine 5. Unire due colonne ed ottenere l'indirizzo completo

6. Esportare il dataset! Formati disponibili TSV, CSV, ODS, XLS.

Page 72: Open data: come fare

<Open Data: come fare>

datasets can't change the world. (people do)

Jonathan Gray

Foto di Francesca G., Flickr