1 laura de sandro in collaborazione con stefania fegatelli il trattamento delle mancate risposte:...
TRANSCRIPT
![Page 1: 1 Laura De Sandro in collaborazione con Stefania Fegatelli Il trattamento delle mancate risposte: utilizzo dei dati delle Capitanerie di porto Roma, 06](https://reader036.vdocuments.net/reader036/viewer/2022062512/5542eb4e497959361e8bda03/html5/thumbnails/1.jpg)
1
Laura De Sandro in collaborazione con Stefania Fegatelli
“Il trattamento delle mancate risposte:utilizzo dei dati delle Capitanerie di porto”
Roma, 06 dicembre 2011
Innovazione nelle Indagini statistiche sui trasporti
![Page 2: 1 Laura De Sandro in collaborazione con Stefania Fegatelli Il trattamento delle mancate risposte: utilizzo dei dati delle Capitanerie di porto Roma, 06](https://reader036.vdocuments.net/reader036/viewer/2022062512/5542eb4e497959361e8bda03/html5/thumbnails/2.jpg)
1. Esplicitazione del problema2. Trattamento Mancate Risposte3. Record Linkage4. L’ integrazione con dati delle capitanerie di porto5. Utilizzo dei mirror data
2
SOMMARIOInnovazione nelle
indagini statistiche sui trasporti
Roma, 6 dicembre 2011
![Page 3: 1 Laura De Sandro in collaborazione con Stefania Fegatelli Il trattamento delle mancate risposte: utilizzo dei dati delle Capitanerie di porto Roma, 06](https://reader036.vdocuments.net/reader036/viewer/2022062512/5542eb4e497959361e8bda03/html5/thumbnails/3.jpg)
LA CAUSA:• Complessità organizzativa dell’indagine• Difficoltà di individuare l’universo dei rispondentiL’EFFETTO:• dichiarazioni mancanti (non pervenute o non
effettuate) di Arrivo/Partenza MANCATE RISPOSTE TOTALI
• dichiarazioni non complete di Arrivo/PartenzaL’evento nave A/P viene rilevato, ma senza dettagli
sul carico
MANCATE RISPOSTE PARZIALI
3
Esplicitazione del problema
Roma, 6 dicembre 2011
Innovazione nelle indagini statistiche sui
trasporti
![Page 4: 1 Laura De Sandro in collaborazione con Stefania Fegatelli Il trattamento delle mancate risposte: utilizzo dei dati delle Capitanerie di porto Roma, 06](https://reader036.vdocuments.net/reader036/viewer/2022062512/5542eb4e497959361e8bda03/html5/thumbnails/4.jpg)
TRATTAMENTO MANCATE RISPOSTE
1. Utilizzo modelli delle capitanerie di porto
2. Utilizzo mirror data
4Roma, 6 dicembre 2011
Esplicitazione del problemaInnovazione nelle
indagini statistiche sui trasporti
![Page 5: 1 Laura De Sandro in collaborazione con Stefania Fegatelli Il trattamento delle mancate risposte: utilizzo dei dati delle Capitanerie di porto Roma, 06](https://reader036.vdocuments.net/reader036/viewer/2022062512/5542eb4e497959361e8bda03/html5/thumbnails/5.jpg)
5Roma, 6 dicembre 2011
• Il metodo di IMPUTAZIONE scelto:
Record Linkage (RL) tra la base dati Istat e una fonte amministrativa
• La FONTE amministrativa UFFICIALE scelta:
il modello 61 delle CAPITANERIE DI PORTO, trasmesso all’Istat dal Ministero delle
Infrastrutture e Trasporti
Esplicitazione del problemaInnovazione nelle
indagini statistiche sui trasporti
![Page 6: 1 Laura De Sandro in collaborazione con Stefania Fegatelli Il trattamento delle mancate risposte: utilizzo dei dati delle Capitanerie di porto Roma, 06](https://reader036.vdocuments.net/reader036/viewer/2022062512/5542eb4e497959361e8bda03/html5/thumbnails/6.jpg)
Perché un Record Linkage?
Perché la nave, dichiarata in ‘arrivo (partenza)’ dall’agente marittimo, viene registrata anche in capitaneria di porto con il suo carico,
cioè con la sua merce e i suoi passeggeri
6Roma, 6 dicembre 2011
RECORD LINKAGEInnovazione nelle
indagini statistiche sui trasporti
![Page 7: 1 Laura De Sandro in collaborazione con Stefania Fegatelli Il trattamento delle mancate risposte: utilizzo dei dati delle Capitanerie di porto Roma, 06](https://reader036.vdocuments.net/reader036/viewer/2022062512/5542eb4e497959361e8bda03/html5/thumbnails/7.jpg)
Punti di forza dei modelli 61 stesso campo d’osservazione dell’indaginefornisce l’universo delle navi
arrivate/partitepermette di integrare eventuali MR, totali
e parziali, rispetto ai viaggi (navi arrivate/partite), alla merce o ai passeggeri
7
RECORD LINKAGE
Roma, 6 dicembre 2011
Innovazione nelle indagini statistiche sui
trasporti
![Page 8: 1 Laura De Sandro in collaborazione con Stefania Fegatelli Il trattamento delle mancate risposte: utilizzo dei dati delle Capitanerie di porto Roma, 06](https://reader036.vdocuments.net/reader036/viewer/2022062512/5542eb4e497959361e8bda03/html5/thumbnails/8.jpg)
Punti di debolezza dei modelli 61 non sono generati da una procedura automatizzata,
quindi non sono immediatamente trattabili da Istat
contengono informazioni aggregate con riferimento al numero di navi arrivate/partite e alle tonnellate di merce e al numero di passeggeri sbarcati/imbarcati
8Roma, 6 dicembre 2011
RECORD LINKAGEInnovazione nelle
indagini statistiche sui trasporti
![Page 9: 1 Laura De Sandro in collaborazione con Stefania Fegatelli Il trattamento delle mancate risposte: utilizzo dei dati delle Capitanerie di porto Roma, 06](https://reader036.vdocuments.net/reader036/viewer/2022062512/5542eb4e497959361e8bda03/html5/thumbnails/9.jpg)
Ipotesi di base• le unità statistiche devono essere definite allo
stesso modo nelle diverse fonti o provenire dalla stessa fonte
• le unità devono fare riferimento allo stesso collettivo statistico
• il contenuto informativo delle variabili della fonte “donatrice” deve essere identico a quello delle variabili “oggetto” di indagine
• IPOTESI SODDISFATTE!!
9Roma, 6 dicembre 2011
RECORD LINKAGEInnovazione nelle
indagini statistiche sui trasporti
![Page 10: 1 Laura De Sandro in collaborazione con Stefania Fegatelli Il trattamento delle mancate risposte: utilizzo dei dati delle Capitanerie di porto Roma, 06](https://reader036.vdocuments.net/reader036/viewer/2022062512/5542eb4e497959361e8bda03/html5/thumbnails/10.jpg)
Il match e la match key
• Tecnica di exact matching con una chiave di abbinamento che identifichi univocamente l’evento ‘nave arrivata/partita’
• Ad ogni evento (nel nostro caso l’evento nave arrivata/partita) da integrare corrisponde un solo record ‘donatore’
10Roma, 6 dicembre 2011
RECORD LINKAGEInnovazione nelle
indagini statistiche sui trasporti
![Page 11: 1 Laura De Sandro in collaborazione con Stefania Fegatelli Il trattamento delle mancate risposte: utilizzo dei dati delle Capitanerie di porto Roma, 06](https://reader036.vdocuments.net/reader036/viewer/2022062512/5542eb4e497959361e8bda03/html5/thumbnails/11.jpg)
Il match e la match key La chiave di abbinamento:
• Numero IMO (International Maritime Organization)
• mese• direzione (arrivo/partenza)• porto dichiarante• porto di origine/destinazione• zona di origine/destinazione
11Roma, 6 dicembre 2011
RECORD LINKAGEInnovazione nelle
indagini statistiche sui trasporti
![Page 12: 1 Laura De Sandro in collaborazione con Stefania Fegatelli Il trattamento delle mancate risposte: utilizzo dei dati delle Capitanerie di porto Roma, 06](https://reader036.vdocuments.net/reader036/viewer/2022062512/5542eb4e497959361e8bda03/html5/thumbnails/12.jpg)
LA FORMALIZZAZIONEDall’insieme di tutte le coppie formate da
unità appartenenti alle fonti A e B,
A × B ={(a, b) : a є A, b є B},
si determinano due sottoinsiemi
disgiunti ed esaustivi M e u, per cui
M∩u =ø e MUu = A × B
12Roma, 6 dicembre 2011
RECORD LINKAGEInnovazione nelle
indagini statistiche sui trasporti
![Page 13: 1 Laura De Sandro in collaborazione con Stefania Fegatelli Il trattamento delle mancate risposte: utilizzo dei dati delle Capitanerie di porto Roma, 06](https://reader036.vdocuments.net/reader036/viewer/2022062512/5542eb4e497959361e8bda03/html5/thumbnails/13.jpg)
LA FORMALIZZAZIONE• M = unità rilevate in entrambe le fonti
“match”
• u= unità rilevate in A e non presenti in B, e viceversa
“non-match”
13Roma, 6 dicembre 2011
RECORD LINKAGEInnovazione nelle
indagini statistiche sui trasporti
![Page 14: 1 Laura De Sandro in collaborazione con Stefania Fegatelli Il trattamento delle mancate risposte: utilizzo dei dati delle Capitanerie di porto Roma, 06](https://reader036.vdocuments.net/reader036/viewer/2022062512/5542eb4e497959361e8bda03/html5/thumbnails/14.jpg)
LA FORMALIZZAZIONE• A = la base dati Istat• B = la base dati delle capitanerie di
porto;• IL RL VIENE EFFETTUATO SU SOTTOINSIEMI DELLE
2 FONTI, selezionati in base alla variabile ‘TIPO DI NAVE’, per individuare correttamente il tipo di carico da integrare
• Gli insiemi finali M ed u sono pertanto l’unione di tanti sottoinsiemi, le cui coppie contengono, in entrambe le fonti, la merce e i passeggeri da integrare
14Roma, 6 dicembre 2011
RECORD LINKAGEInnovazione nelle
indagini statistiche sui trasporti
![Page 15: 1 Laura De Sandro in collaborazione con Stefania Fegatelli Il trattamento delle mancate risposte: utilizzo dei dati delle Capitanerie di porto Roma, 06](https://reader036.vdocuments.net/reader036/viewer/2022062512/5542eb4e497959361e8bda03/html5/thumbnails/15.jpg)
TIPI DI CARICO INTEGRATI:TIPI DI CARICO INTEGRATI:• merce in Rinfusa liquida attraverso il tipo nave
Portarinfuse liquide• merce in Rinfusa solida attraverso il tipo nave
Portarinfuse solide• merce in container attraverso tipo nave
Portacontainer• merce in traghetto attraverso il tipo nave
Traghetto• merce in Trasportatore non specializzato
attraverso l’omonimo tipo nave
15
L’integrazione della MERCEInnovazione nelle
indagini statistiche sui trasporti
![Page 16: 1 Laura De Sandro in collaborazione con Stefania Fegatelli Il trattamento delle mancate risposte: utilizzo dei dati delle Capitanerie di porto Roma, 06](https://reader036.vdocuments.net/reader036/viewer/2022062512/5542eb4e497959361e8bda03/html5/thumbnails/16.jpg)
segue ALTRE INTEGRAZIONIsegue ALTRE INTEGRAZIONI:
Numero di passeggeri attraverso il tipo nave Traghetto-Aliscafo
Movimenti di TUTTE le NAVI Arrivate/Partite
16
L’integrazione di PASSEGGERI e NAVI
Roma, 6 dicembre 2011
Innovazione nelle indagini statistiche sui
trasporti
![Page 17: 1 Laura De Sandro in collaborazione con Stefania Fegatelli Il trattamento delle mancate risposte: utilizzo dei dati delle Capitanerie di porto Roma, 06](https://reader036.vdocuments.net/reader036/viewer/2022062512/5542eb4e497959361e8bda03/html5/thumbnails/17.jpg)
17
L’ INTEGRAZIONE
Roma, 6 dicembre 2011
RISULTATI DEL linkage
• l’evento Nave Arrivata/Partita si rileva nei modelli 61 e non nella fonte Istat
INTEGRAZIONE MR TOTALI
Innovazione nelle indagini statistiche sui
trasporti
![Page 18: 1 Laura De Sandro in collaborazione con Stefania Fegatelli Il trattamento delle mancate risposte: utilizzo dei dati delle Capitanerie di porto Roma, 06](https://reader036.vdocuments.net/reader036/viewer/2022062512/5542eb4e497959361e8bda03/html5/thumbnails/18.jpg)
18Roma, 6 dicembre 2011
l’evento Nave Arrivata/Partita si rileva in entrambe le fonti, ma merce, passeggeri e/o il numero di navi A/P non coincidono,
si tiene conto di quanto dichiarato nei modelli 61
INTEGRAZIONE MR PARZIALI
L’ INTEGRAZIONEInnovazione nelle
indagini statistiche sui trasporti
![Page 19: 1 Laura De Sandro in collaborazione con Stefania Fegatelli Il trattamento delle mancate risposte: utilizzo dei dati delle Capitanerie di porto Roma, 06](https://reader036.vdocuments.net/reader036/viewer/2022062512/5542eb4e497959361e8bda03/html5/thumbnails/19.jpg)
19
ESEMPIO di integrazione delle tonn. merce
Roma, 6 dicembre 2011
RINFUSA LIQUIDAISTAT
RINFUSA LIQUIDAFonte AMM.
RINFUSA SOLIDAISTAT
RINFUSA SOLIDAFonte AMM.
TRAGHETTIISTAT
TRAGHETTIFonte AMM.
PORTACONTAINERISTAT PORTACONTAINER
Fonte AMM.
Innovazione nelle indagini statistiche sui
trasporti
![Page 20: 1 Laura De Sandro in collaborazione con Stefania Fegatelli Il trattamento delle mancate risposte: utilizzo dei dati delle Capitanerie di porto Roma, 06](https://reader036.vdocuments.net/reader036/viewer/2022062512/5542eb4e497959361e8bda03/html5/thumbnails/20.jpg)
20
L’utilizzo dei MIRROR DATA
Roma, 6 dicembre 2011
Il Trattamento delle MR totali e parziali prevede anche una integrazione utilizzando i mirror data.
Attualmente sono utilizzate entrambe le tecniche:
- RL per l’Integrazione con i mirror data
- RL per l’Integrazione con dati amministrativi delle capitanerie di porto
Innovazione nelle indagini statistiche sui
trasporti
![Page 21: 1 Laura De Sandro in collaborazione con Stefania Fegatelli Il trattamento delle mancate risposte: utilizzo dei dati delle Capitanerie di porto Roma, 06](https://reader036.vdocuments.net/reader036/viewer/2022062512/5542eb4e497959361e8bda03/html5/thumbnails/21.jpg)
Ogni porto può avere al massimo 2 eventi (Nave Arrivata/Partita) verificabili
per una coppia di porti AB il n. max = 4
21Roma, 6 dicembre 2011
Partenza da A per B
Arrivo in B da A
A B
L’utilizzo dei MIRROR DATAInnovazione nelle
indagini statistiche sui trasporti
![Page 22: 1 Laura De Sandro in collaborazione con Stefania Fegatelli Il trattamento delle mancate risposte: utilizzo dei dati delle Capitanerie di porto Roma, 06](https://reader036.vdocuments.net/reader036/viewer/2022062512/5542eb4e497959361e8bda03/html5/thumbnails/22.jpg)
La chiave differisce da quella utilizzata per integrare con dati delle capit. di porto nella variabile Direzione (Arrivo/Partenza):
• Numero IMO (International Maritime Organization)
• mese• direzione (arrivo/partenza)• porto dichiarante• porto di origine/destinazione• zona di origine/destinazione
22
RL e mirror data: la match key
Roma, 6 dicembre 2011
Innovazione nelle indagini statistiche sui
trasporti
![Page 23: 1 Laura De Sandro in collaborazione con Stefania Fegatelli Il trattamento delle mancate risposte: utilizzo dei dati delle Capitanerie di porto Roma, 06](https://reader036.vdocuments.net/reader036/viewer/2022062512/5542eb4e497959361e8bda03/html5/thumbnails/23.jpg)
23
ESEMPI DI MIRROR
Roma, 6 dicembre 2011
Olbia
Civitavecchia
Innovazione nelle indagini statistiche sui
trasporti
![Page 24: 1 Laura De Sandro in collaborazione con Stefania Fegatelli Il trattamento delle mancate risposte: utilizzo dei dati delle Capitanerie di porto Roma, 06](https://reader036.vdocuments.net/reader036/viewer/2022062512/5542eb4e497959361e8bda03/html5/thumbnails/24.jpg)
24
ESEMPI DI MIRROR
Roma, 6 dicembre 2011
Lampedusa
Linosa
P.Empedocle
Innovazione nelle indagini statistiche sui
trasporti
![Page 25: 1 Laura De Sandro in collaborazione con Stefania Fegatelli Il trattamento delle mancate risposte: utilizzo dei dati delle Capitanerie di porto Roma, 06](https://reader036.vdocuments.net/reader036/viewer/2022062512/5542eb4e497959361e8bda03/html5/thumbnails/25.jpg)
25Roma, 6 dicembre 2011
a) INFORMATIZZAZIONE dei modelli 61, ad opera del Ministero delle Infrastrutture e Trasporti
b) Procedure automatiche per l’individuazione e il recupero dei ‘non rispondenti’, utilizzando anche i risultati del RL
Sviluppi futuri
Innovazione nelle indagini statistiche sui
trasporti