web gis, statistical geospatial data visualization and real time monitoring

41
Alessandro Capezzuoli alessandro.capezzuoli@is tat.it www.statview.eu Una piattaforma web GIS per la visualizzazione, l'analisi e il monitoraggio dei dati statistici e geospaziali

Upload: alessandro-capezzuoli

Post on 12-Apr-2017

54 views

Category:

Data & Analytics


2 download

TRANSCRIPT

Page 1: Web GIS, statistical geospatial data visualization and real time monitoring

Alessandro Capezzuoli

[email protected]

www.statview.eu

Una piattaforma web GIS per la visualizzazione, l'analisi e il monitoraggio dei dati statistici e geospaziali

Page 2: Web GIS, statistical geospatial data visualization and real time monitoring

I SISTEMI WEB GIS

I DATI STATISTICI

STATVIEW

Alessandro Capezzuoli

[email protected]

Page 3: Web GIS, statistical geospatial data visualization and real time monitoring

1 - Acquisizione

2 - Trattamento

3 - Diffusione

ALESSANDRO CAPEZZUOLI

La diffusioneI DATI STATISTICI

1

Page 4: Web GIS, statistical geospatial data visualization and real time monitoring

La diffusioneI DATI STATISTICI

2

Page 5: Web GIS, statistical geospatial data visualization and real time monitoring

MODELLO (Standard)

DATI STASTISTICI: JSON-stat, SDMX(JSON statistical standard , Statistical Data and Metadata Exchange)

TRASPORTI: GTFS(General Transit Feed Specification)

ALESSANDRO CAPEZZUOLI

I DATI STATISTICI

TERREMOTI: FDSNWS (Event Federation of Digital Seismograph Networks Web Services)

FORMATO

12

ARCHITETTURA3

La diffusione

3

Page 6: Web GIS, statistical geospatial data visualization and real time monitoring

1ALESSANDRO CAPEZZUOLI

I DATI STATISTICI Il modello JSON-stat

4

Page 7: Web GIS, statistical geospatial data visualization and real time monitoring

JSON-STAT, SDMX, ODATA

ALESSANDRO CAPEZZUOLI 5

Page 8: Web GIS, statistical geospatial data visualization and real time monitoring

JSON-STAT, SDMX, ODATA

ALESSANDRO CAPEZZUOLI 6

Page 9: Web GIS, statistical geospatial data visualization and real time monitoring

ALESSANDRO CAPEZZUOLI

I DATI STATISTICI Application Programming Interface (API)

7

Page 10: Web GIS, statistical geospatial data visualization and real time monitoring

SOAPSimple Object Access Protocol

RESTRepresentation State Transfer

I DATI STATISTICI SOAP vs REST

ALESSANDRO CAPEZZUOLI 8

Page 11: Web GIS, statistical geospatial data visualization and real time monitoring

1) Identificazione delle risorse

http://apistat.istat.it/?dataset=DCIS_VEICOLIINCID1&dim=,2,4,8,1,2,13,2148&idLayer=1002&q=getdatajsonnuts

2) Utilizzo esplicito dei metodi HTTP

3) Risorse autodescrittiveI principi REST non pongono nessun vincolo sulle modalità di rappresentazione di una risorsa. Virtualmente possiamo utilizzare il formato che preferiamo senza essere obbligati a seguire uno standard. Di fatto, però, è opportuno utilizzare formati il più possibile standard in modo da semplificare l’interazione con i client (JSON-stat?).

4) Collegamenti tra risorseUn altro vincolo dei principi REST consiste nella necessità che le risorse siano tra loro messe in relazione tramite link ipertestuali. Questo principio è anche noto come HATEOAS, dall’acronimo di Hypermedia As The Engine Of Application State, e pone l’accento sulle modalità di gestione dello stato dell’applicazione.

5) Comunicazione senza statoREST prevede la comunicazione stateless, ma un’applicazione può avere uno stato. La responsabilità della gestione di tale stato non deve essere conferita al server, ma rientra nei compiti del client.

Metodo HTTP Operazione CRUD DescrizionePOST Create Crea una nuova risorsaGET Read Ottiene una risorsa

esistente

PUT Update Aggiorna una risorsa o ne modifica lo stato

DELETE Delete Elimina una risorsa

Create Read Update Delete

I DATI STATISTICI Le operazioni CRUD

ALESSANDRO CAPEZZUOLI 9

Page 12: Web GIS, statistical geospatial data visualization and real time monitoring

WITHOUT REST WITH REST

I DATI STATISTICI Architettura REST

ALESSANDRO CAPEZZUOLI 10

Page 13: Web GIS, statistical geospatial data visualization and real time monitoring

● Buffering

● Network analysis

● Topology Overlay

I SISTEMI WEB GIS Caratteristiche

ALESSANDRO CAPEZZUOLI 11

Page 14: Web GIS, statistical geospatial data visualization and real time monitoring

PUNTI SU POLIGONIEs. tipologia del suolo in cui cade un traliccio elettrico

LINEE SU POLIGONIEs. tipologia del suolo in cui cade un tratto di strada

POLIGONI SU POLIGONIEs. tipologia del suolo in cui cade un fabbricato

SOVRAPPOSIZIONE DI DIVERSI STRATI (LAYERS)

I SISTEMI WEB GIS Overlay Topologico

ALESSANDRO CAPEZZUOLI 12

Page 15: Web GIS, statistical geospatial data visualization and real time monitoring

Aree di rispetto intorno a specifici elementi geografici

Le linee elettriche ad alta tensione prevedono delle fasce di rispetto di oltre 250 metri per parte; le leggi ambientali prevedono l'inedificabilità entro una specifica distanza dalle rive di corsi d'acqua, laghi e mare; un ponte ripetitore copre un'area con un determinato raggio.

I buffer possono essere:

• asimmetrici rispetto, ad esempio, ai due lati di un elemento lineare

• parametrizzati a seconda delle caratteristiche dell'elemento (es. tensione di esercizio delle linee elettriche)

I SISTEMI WEB GIS Buffering

ALESSANDRO CAPEZZUOLI 13

Page 16: Web GIS, statistical geospatial data visualization and real time monitoring

Quali reti? Trasporto, distribuzione, comunicazione

• Ricerca del minimo percorso su una rete o comunque del percorso meno costoso

• Verifica delle connettività tra due punti della rete

• Allocazione di porzioni della rete ad un fornitore o consumatore di risorse

I SISTEMI WEB GIS Analisi di rete

ALESSANDRO CAPEZZUOLI 14

Page 17: Web GIS, statistical geospatial data visualization and real time monitoring

StatVIEW è una piattaforma web GIS che utilizza:

1) Un map server e un database con la sua componente geospaziale (Geoserver, Postgres, PostGIS)

2) Differenti fonti di dati (datawarehouse, web service, database, etc.)

3) Motore di interrogazione e interfaccia utente

WMSWFS WCS

StatVIEW

Sistema scalabile

o Supporta differenti fonti di dati (database, files, web service)

o Supporta differenti modelli per l’open data (SDMX, DDI, JSON-STAT)

o Supporta differenti formati per l’open data (XML, JSON)

STATVIEW Caratteristiche

ALESSANDRO CAPEZZUOLI 15

Page 18: Web GIS, statistical geospatial data visualization and real time monitoring

STATVIEW Architettura

ALESSANDRO CAPEZZUOLI 16

Page 19: Web GIS, statistical geospatial data visualization and real time monitoring

Dimensioni associate al dataset

Differenti rappresentazioni (Mappe, Grafici, Tabelle)

Ricerca personalizzata

Mappa di densità – incidenti stradali

STATVIEW Mappe di densità

ALESSANDRO CAPEZZUOLI 17

Page 22: Web GIS, statistical geospatial data visualization and real time monitoring

Dati sui Permessi di soggiorno

Selezionando un layer e, per esempio, una diversa mappa di base, un diverso gradiente di colore o una diversa partizione (quartile, quintile, etc.) è possibile ottenere differenti visualizzazioni per una migliore comprensione dei fenomeni

Layer che crea un bubble chart attraverso una query geospaziale

Layer che contiene le associazioni geolocalizzate che forniscono servizi ai migranti

STATVIEW Overaly

ALESSANDRO CAPEZZUOLI 20

Page 23: Web GIS, statistical geospatial data visualization and real time monitoring

OSRM (Open Source Routing Machine): algoritmo che consente di ottenere il percorso stradale più breve tra due punti geolocalizzati

STATVIEW Routing

ALESSANDRO CAPEZZUOLI 21

Page 24: Web GIS, statistical geospatial data visualization and real time monitoring

La dimensione delle frecce fornisce un’idea della portata del flusso

Flussi in entrata e in uscita da un certo confine territoriale per rappresentare i trasferimenti di residenza

TRASFERIMENTI DI RESIDENZA

E’ possibile scegliere il range di distanza o la massima distanza entro la quale visualizzare il flusso

STATVIEW Flussi

ALESSANDRO CAPEZZUOLI 22

Page 25: Web GIS, statistical geospatial data visualization and real time monitoring

REGIONI

Dati sull’occupazione rappresentati a livello regionale

STATVIEW Livelli territoriali

ALESSANDRO CAPEZZUOLI 23

Page 27: Web GIS, statistical geospatial data visualization and real time monitoring

"41.9284106"|"12.4840124"

STATVIEW Dati geolocalizzati e codificati

ALESSANDRO CAPEZZUOLI 25

Page 28: Web GIS, statistical geospatial data visualization and real time monitoring

Applicazione che permette la gestione dei centri di accoglienza in base alla capienza e alla disponibilità

STATVIEW Applicazioni web ad hoc

ALESSANDRO CAPEZZUOLI 26

Page 29: Web GIS, statistical geospatial data visualization and real time monitoring

L'algoritmo K-Means è un algoritmo di clustering, progettato nel 1967 da MacQeen, che permette di suddividere gruppi di oggetti in K partizioni sulla base dei loro attributi.

Tutti gli oggetti sono rappresentati come vettori, quindi formano uno spazio vettoriale. K-means minimizza la deviazione standard.

Ogni cluster viene identificato mediante un centroide o punto medio.

L'algoritmo segue una procedura iterativa:

• inizialmente crea K partizioni e assegna ad ogni partizione i punti d'ingresso o • casualmente o usando alcune informazioni euristiche;

• calcola il centroide di ogni gruppo;

• costruisce quindi una nuova partizione associando ogni punto d'ingresso al cluster il cui centroide è più vicino ad esso;

• vengono ricalcolati i centroidi per i nuovi cluster e così via, finché l'algoritmo non converge

STATVIEW Clustering

ALESSANDRO CAPEZZUOLI 27

Page 30: Web GIS, statistical geospatial data visualization and real time monitoring

Esempio di clustering ottenuto con i punti geolocalizzati

STATVIEW Clustering

ALESSANDRO CAPEZZUOLI 28

Page 31: Web GIS, statistical geospatial data visualization and real time monitoring

Heatmap dei musei e delle aree archeologiche private

STATVIEW Heatmap

ALESSANDRO CAPEZZUOLI 29

Page 32: Web GIS, statistical geospatial data visualization and real time monitoring

STATVIEW Monitoraggio, raccolta e analisi dati

APPLICATION WRAPPERS

DB

XML DOCS

CSV FILES

WEB SERVICES

ARCHIVIAZIONE DIFFUSIONE

VISUALIZZAZIONE

ALESSANDRO CAPEZZUOLI 30

Page 33: Web GIS, statistical geospatial data visualization and real time monitoring

Una variabile regionalizzata Z(x) è una variabile con valore fortemente dipendente dalla posizione spaziale.

α = componente casualeR(x) = componente regionalizzata

La condizione è che R(x) sia preponderante rispetto alla componente casuale

AUTOCORRELAZIONE: Tutto è correlato con tutto, ma le cose vicine sono più correlate delle cose lontane «Prima legge di Tobler»

Teoria delle Variabili Regionalizzate di Matheron (1965)

STATVIEW Autocorrelazione

ALESSANDRO CAPEZZUOLI 31

Page 34: Web GIS, statistical geospatial data visualization and real time monitoring

Il kriging è un metodo di regressione usato nell'ambito dell'analisi spaziale (geostatistica) che permette di interpolare una grandezza nello spazio, minimizzando l’errore quadratico medio. In statistica è meglio noto come processo gaussiano.

Deve il suo nome a Danie Krige, ingegnere minerario sudafricano che sviluppò negli anni ’50 alcuni metodi empirici per la previsione della distribuzione di minerale nel sottosuolo a partire da campionamenti del terreno.

STATVIEW Autocorrelazione

ALESSANDRO CAPEZZUOLI 32

Page 35: Web GIS, statistical geospatial data visualization and real time monitoring

Conoscendo il valore di una grandezza in alcuni punti nello spazio (per esempio la temperatura misurata in ogni città di una regione), si può determinare il valore della grandezza in altri punti per i quali non esistono misure, per esempio una località sprovvista di termometri. Nel kriging, questa interpolazione spaziale si basa sull'autocorrelazione della grandezza, cioè l’assunto che la grandezza in oggetto vari nello spazio con continuità. 

Il valore incognito in un punto viene calcolato con una media pesata dei valori noti.I pesi che vengono dati alle misure note (es. le temperature misurate nelle città) dipendono dalla relazione spaziale tra i valori misurati nell'intorno del punto incognito (es. il punto in campagna).

STATVIEW Autocorrelazione

ALESSANDRO CAPEZZUOLI 33

Page 36: Web GIS, statistical geospatial data visualization and real time monitoring

Per calcolare i pesi si usa il semivariogramma, un grafico che mette in relazione la distanza tra due punti e il valore di semivarianza tra le misure effettuate in questi due punti. Il semivariogramma espone, sia in maniera qualitativa che quantitativa, il grado di dipendenza spaziale, che altro non è che l’autocorrelazione vista prima.

Dipendenza spaziale

Indipendenza spaziale

STATVIEW Semivariogramma

ALESSANDRO CAPEZZUOLI 34

Page 37: Web GIS, statistical geospatial data visualization and real time monitoring

STATVIEW Monitoraggio: i terremoti

ALESSANDRO CAPEZZUOLI 35

Page 38: Web GIS, statistical geospatial data visualization and real time monitoring

STATVIEW Monitoraggio: i terremoti

ALESSANDRO CAPEZZUOLI 36

Page 39: Web GIS, statistical geospatial data visualization and real time monitoring

24/12/2016 17/01/201724/08/2016 18/01/2017

STATVIEW Monitoraggio: i terremoti

ALESSANDRO CAPEZZUOLI 37

Page 40: Web GIS, statistical geospatial data visualization and real time monitoring

STATVIEW Monitoraggio: i trasporti

ALESSANDRO CAPEZZUOLI 38

Page 41: Web GIS, statistical geospatial data visualization and real time monitoring

Meglio una storia interrotta che.

[email protected]