dipartimento di politiche pubbliche e scelte collettive...

28
Dipartimento di Politiche Pubbliche e Scelte Collettive – POLIS Department of Public Policy and Public Choice – POLIS Working paper n. 63 January 2006 Propensity score matching: un'applicazione per la creazione di un database integrato ISTAT-Banca d'Italia Andrea Sisto UNIVERSITA’ DEL PIEMONTE ORIENTALE “Amedeo AvogadroALESSANDRIA

Upload: others

Post on 16-Nov-2020

6 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Dipartimento di Politiche Pubbliche e Scelte Collettive ...polis.unipmn.it/pubbl/RePEc/uca/ucapdv/sisto63.pdf · possibili balancing scores, Rosembaum e Rubin (1983) suggeriscono

Dipartimento di Politiche Pubbliche e Scelte Collettive – POLIS Department of Public Policy and Public Choice – POLIS

Working paper n. 63

January 2006

Propensity score matching: un'applicazione per la creazione di un database

integrato ISTAT-Banca d'Italia

Andrea Sisto

UNIVERSITA’ DEL PIEMONTE ORIENTALE “Amedeo Avogadro” ALESSANDRIA

Page 2: Dipartimento di Politiche Pubbliche e Scelte Collettive ...polis.unipmn.it/pubbl/RePEc/uca/ucapdv/sisto63.pdf · possibili balancing scores, Rosembaum e Rubin (1983) suggeriscono

2

Propensity Score Matching:

un’applicazione per la creazione di un database integrato ISTAT-Banca d’Italia

A.Sisto*

ABSTRACT

Il propensity score (Rosemabum e Rubin,1983) è ormai diventati l’approccio predominante

nella letteratura della stima dei casual treatment effect. Tuttavia, recentemente i principali

istituti nazionali di statistica hanno utilizzato tale strumento per integrare informazioni

provenienti da fonti differenti. Infatti, le survey attualmente disponibili spesso mancano di

tutte quelle variabili necessarie per condurre una rigorosa indagine economica e gli

economisti sono spessa costretti a integrare tali informazioni ricorrendo procedimenti di

matching. Tra le diverse tecniche di imputazione presenti in letteratura il propensity score

offre l’indiscutibile vantaggio di ridurre un problema di integrazione potenzialmente

multidimensionale a uno unidimensionale, riducendo il costo dell’operazione. Il presente

contributo valuta l’efficacia di tale strumento nel generare un database integrato a partire

dalla survey multiscopo ISTAT “Aspetti della vita quotidiana 2000” e l’indagine Banca

d’Italia “Bilanci delle famiglie Italiane 2000”.

Keywords: propensity score, survey data fusion, integration

* Università del Piemonte Orientale, Dipartimento di politiche pubbliche e scelte collettive, POLIS, Via Cavour 84, Alessandria, Italia. E-mail: [email protected]

Page 3: Dipartimento di Politiche Pubbliche e Scelte Collettive ...polis.unipmn.it/pubbl/RePEc/uca/ucapdv/sisto63.pdf · possibili balancing scores, Rosembaum e Rubin (1983) suggeriscono

3

1. Introduzione

I procedimenti statistici di imputazione sono ormai diventati l’approccio predominante in letteratura

per la stima dei casual treatment effect. Le procedure di matching sono infatti utilizzate in tutte

quelle situazioni in cui si voglia stimare l’impatto su un determinato output derivante dall’aver

ricevuto un particolare trattamento. Se da una parte la natura di quest’ultimo può essere

estremamente differente1, i problemi legati alla valutazione dell’impatto di un trattamento attraverso

l’uso di strumenti microeconometrici (essenzialmente indagini a livello individuale) sono ben noti

in letteratura e sono riconducibili a un problema fondamentale di misurazione. Infatti, mentre la

valutazione corretta dei casual treatment effect dovrebbe essere effettuata calcolando la differenza

media tra l’outcome ottenuto dai partecipanti dopo il trattamento e quello potenziale che gli stessi

avrebbero realizzato nel caso ipotetico in cui non fossero stati trattati, i dati reali con cui si

confrontano i microeconomisti contengono esclusivamente informazioni circa l’outcome degli

individui trattati e quello ottenuto da un secondo gruppo di individui che non hanno ricevuto il

trattamento. E’ dimostrato che la mancanza di un appropriato controfattuale non possa essere risolto

considerando la media dell’outcome dei non trattati come proxy per l’outcome potenziale dei

trattati, in quanto, generalmente, l’outcome per i due gruppi differisce in maniera sistematica anche

in assenza di trattamento. Questo è infatti dovuto alla presenza di un probabile problema di auto-

selezione. Un esempio classico può essere quello di un individuo che entra in un programma di

formazione professionale. E’ probabile che questo individuo sia maggiormente motivato rispetto ad

altri che non entrano nel programma e, conseguentemente, ci si aspetta che avrà anche una

maggiore probabilità di trovare lavoro.

Per ovviare a questo problema, una possibile soluzione è quella di utilizzare un procedimento di

matching che consenta di imputare a ogni individuo trattato l’outcome associato a quell’individuo

non trattato maggiormente somigliante in termini di determinate caratteristiche pre-trattamento. A

tal fine risulta necessario il rispetto di due assunzioni. La prima è che il vettore di variabili su cui si

vuole condizionare il matching (X) risulti indipendente dall’essere o meno assegnato al trattamento.

La seconda è che anche la distribuzione dell’outcome, condizionata al set X risulti indipendente dal

trattamento. In particolare, quest’ultima assunzione è conosciuta in letteratura come CIA, ossia

conditional independence assumption e risulta di fondamentale importanza in quanto solo se la CIA

è rispettata la selezione degli individui può essere espressa in funzione delle sole caratteristiche pre-

trattamento (il set di covariate X perfettamente osservabile ex ante dal ricercatore).

1 Per un’esaustiva letteratura si veda Caliendo e Kopeinig (2005).

Page 4: Dipartimento di Politiche Pubbliche e Scelte Collettive ...polis.unipmn.it/pubbl/RePEc/uca/ucapdv/sisto63.pdf · possibili balancing scores, Rosembaum e Rubin (1983) suggeriscono

4

Tuttavia, uno dei principali problemi legati al matching consiste nel fatto che il processo di

imputazione risulta spesso difficoltoso nel caso di un’elevata dimensione del vettore X. Per ovviare

a tale inconveniente Rosenbaum e Rubin (1983) hanno suggerito l’utilizzo del balancing scores

(b(X)), ossia di una funzione del set X. Infatti, se la CIA non solo il vettore X risulterà indipendente

dal processo di selezione ma anche qualsiasi funzione di X possederà questa caratteristica. Tra i

possibili balancing scores, Rosembaum e Rubin (1983) suggeriscono l’uso del propensity score, un

indice definibile come la probabilità di essere trattato dato il vettore X. Rosembaum e Rubin (1983)

hanno dimostrato che se la CIA è rispettata, allora la probabilità di appartenere ad una delle due

indagini, condizionata al vettore X, si configura anch’essa come una variabile casuale e può essere

definita come p(X) ≡ Pr (t = 1 | xi = x), dove t è una variabile dicotomica che assume valore 1 se

l’individuo è trattato e 0 l’individuo non è trattato. Siccome la distribuzione del propensity score

dipende dalla distribuzione congiunta del vettore X, il procedimento di matching può essere

condizionato esclusivamente al propensity score, riducendo un problema potenzialmente

multidimensionale a uno monodimensionale. Un ulteriore vantaggio legato all’utilizzo di questa

tecnica risiede nel fatto che viene generata una variabile continua, il che evita, di fatto, il pericolo di

trovare più individui con lo stesso valore di propensity score.

Sebbene la letteratura sul matching si è essenzialmente sviluppata come risposta a un problema di

valutazione dell’impatto di trattamenti economici, recentemente l’interesse verso tali procedure

statistiche è maturato anche da parte dei principali istituti nazionali di statistica che vedono in esse

lo strumento per poter integrare informazioni provenienti da fonti differenti. Infatti, le survey

attualmente disponibili spesso mancano di tutte quelle informazioni necessarie per condurre una

rigorosa indagine economica. Si pensi, per esempio, allo studio sui comportamenti di risparmio

delle famiglie o all’analisi della spesa in servizi sanitari. Nelle indagini disponibili, alcune variabili

come il reddito o la ricchezza immobiliare sono spesso oscurate per motivi di privacy, oppure

contengono informazioni approssimative, inadeguate per l’analisi del fenomeno di interesse. Per

ovviare al problema molti economisti si sono concentrati sulle possibilità offerti dai procedimenti

statistici di matching al fine di integrare dati provenienti da fonti diverse senza introdurre sostanziali

distorsioni nell’indagine. Infatti, la situazione tipica che deve affrontare un micro-economista

applicato è quella nella quale date tre variabili di interesse X, Y, Z, il database utilizzato risulti

mancante, in tutto o in parte, dell’osservazione congiunta di tali variabili. Si supponga l’esistenza di

due distinti indagini, una contenete le variabili Y, X, e l’altra le variabili Z, X. L’unico modo per

integrare i due dataset è quello di supporre che le informazioni contenute in X siano sufficienti per

determinare congiuntamente Y e Z. Formalmente, un microeconomista basa il processo di

integrazione sull’assunzione che Y e Z siano indipendenti condizionatamente a X, i.e. P(Y,Z | X) =

Page 5: Dipartimento di Politiche Pubbliche e Scelte Collettive ...polis.unipmn.it/pubbl/RePEc/uca/ucapdv/sisto63.pdf · possibili balancing scores, Rosembaum e Rubin (1983) suggeriscono

5

P(Y | X)P(Z | X), ipotesi del tutto equivalente alla CIA. Data l’assunzione di indipendenza

condizionale, il procedimento di integrazione è del tutto simile a quello incontrato nella letteratura

della stima degli effetti casuali di un trattamento: si deve definire un criterio per abbinare ad ogni

individuo della prima survey la variabile Z associata all’individuo della seconda survey

maggiormente simile condizionato a un set di variabili comuni X.

Rispetto all’eventualità di rilevare una nuova indagine contenete tutte le variabili del database

integrato, l’operazione di matching statistico offre un duplice vantaggio: la riduzione dei costi e la

possibilità di ottenere una maggiore qualità nelle risposte fornite abbattendo il tasso di mancata

risposta. Infatti, Vousten e de Heer (1989) hanno dimostrato come, nelle rilevazione a questionario,

all’aumentare del numero di domande l’accuratezza e la precisione delle risposte tenda a diminuire.

Scopo del presente contributo è proprio quello di valutare la possibilità della costruzione di un tale

database applicando la tecnica del propensity score (Rosembaum e Rubin, 1983) all’indagine

multiscopo ISTAT “Aspetti della vita quotidiana” (2000) e all’indagine Banca d’Italia sui Bilanci

delle famiglie Italiane (2000). Il lavoro è strutturato come segue: il paragrafo 2 presenta una

sintetica descrizione delle due survey e delle variabili in esse contenute. Il paragrafo 3 descrive

invece i principali problemi riscontrati nelle operazioni di matching mentre il paragrafo 4 conclude

presentando i principali risultato ottenuti.

2. L’indagine multiscopo ISTAT e l’indagine Banca d’Italia sui Bilanci delle famiglie

Italiane a confronto

L’indagine Multiscopo ISTAT “Aspetti della vita quotidiana” (d’ora in avanti MP, Multipurpose

survey) è una survey a rilevazione annuale. L’edizione 20000 raccoglie dati di oltre 58000

individui, per un totale di 20000 famiglie. Le informazioni disponibili sono molto particolareggiate

e svariano dalle attività del tempo libero (numero di volte in cui si è assistito a spettacoli teatrali,

cinematografici, sportivi, numero di volte in cui si è visitato musei e siti archeologici, consumo

musicale e partecipazione a concerti e altre manifestazioni dl vivo a carattere musicale), alle attività

di ripristino e mantenimento della salute, come il corretto uso di farmaci, la frequenza con cui si

pratica sport, il comportamento alimentare (regolarità dei pasti, frequenza del consumo di

determinate categorie di alimenti come frutta, verdura, oli, grassi) fino al consumo di alcolici, super

alcolici e tabacchi. Una parte corposa dell’indagine è, inoltre, incentrata sull’analisi delle condizioni

di salute degli Italiani, dallo stato di salute percepito, alla presenza di malattie croniche, fino al

ricorso nell’anno a servizi medici, sanitari e socio-assistenziali. Tuttavia, un possibile problema

legato all’utilizzo della Multiscopo è la completa mancanza di informazioni circa la distribuzione

Page 6: Dipartimento di Politiche Pubbliche e Scelte Collettive ...polis.unipmn.it/pubbl/RePEc/uca/ucapdv/sisto63.pdf · possibili balancing scores, Rosembaum e Rubin (1983) suggeriscono

6

del reddito individuale sul territorio. Siccome il reddito è uno dei principali determinanti di diversi

comportamenti economici, la disponibilità di tale variabile risulta di fondamentale per qualsiasi

analisi empirica. Al fine di recuperare tali informazioni è quindi necessario individuare un database

che contenga rilevazioni dettagliate circa la ricchezza della popolazione italiana, in modo da poter

effettuare un’operazione di integrazione con l’indagine MP. Tra le indagini disponibili, quella

condotta da Banca d’Italia sui Bilanci delle famiglie Italiane (d’ora in avanti SHIW, Survey on

Household Income and Wealth), è certamente quella che presenta la più elevata qualità nelle

informazioni relative alle disponibilità finanziarie delle famiglie italiane. L’edizione 2000 presenta i

dati rilevati da un campione di circa 22000 individui per un totale di 8000 famiglie. L’indagine è

composta da una batteria di variabili identificative di carattere socio-demografico (sesso, stato

civile, titolo di studio, composizione del nucleo familiare, professione, ecc.) e da una serie di

informazioni molto dettagliate relative alle disponibilità economiche sia a livello individuale che

familiare (reddito da lavoro, da capitale, ricchezze immobiliari, ecc.).

3. Il matching statistico

La creazione di un dataset integrato è avvenuta attraverso la definizione di un algoritmo che ha

permesso di ricreare nella MP la distribuzione dei redditi presenti nella SHIW. Tale procedimento

può essere effettuato solo se si verificano le seguenti condizioni: i) le survey devono configurarsi

come campioni casuali estratti a sorte dalla stessa popolazione, ii) deve esistere in entrambe le

indagini un set di variabili comuni sulle quali condizionare l’operazione di matching. Se la i) e la ii)

sono soddisfatte allora si può procedere al matching. Nel caso in esame, la prima condizione è

soddisfatta in partenza in quanto, per entrambe le indagini, il campionamento statistico è stato

effettuato in modo da fornire una fotografia rappresentativa della popolazione italiana e quindi si

può essere certi che i due provengano dalla stessa popolazione. Per quanto riguarda il secondo

vincolo, la scelta delle variabili su cui condizionare il processo di imputazione del reddito é

necessariamente caduta su quelle caratteristiche socio-demografiche che permettono di fornire una

descrizione accurata delle differenti tipologie di individui intervistati, come quelle anagrafiche

(sesso, età e stato civile, regione e area geografica di residenza, numerosità del nucleo familiare di

appartenenza, relazione di parentela del soggetto intervistato all’interno del nucleo familiare) e

quelle socio-economiche (titolo di studio, tipologia di occupazione, settore di occupazione, ecc.).

Tuttavia, una volta individuate le variabili di interesse si é dovuto procedere a un’operazione

preliminare di allineamento dei due dataset attraverso la ricodifca di quelle variabili che

presentavano o una differente denominazione o una diversa metrica di classificazione. La tabella di

Page 7: Dipartimento di Politiche Pubbliche e Scelte Collettive ...polis.unipmn.it/pubbl/RePEc/uca/ucapdv/sisto63.pdf · possibili balancing scores, Rosembaum e Rubin (1983) suggeriscono

7

conversione delle variabili socio demografiche è riportata nell’appendice 1, insieme con il nome e

la codifica posseduta da tali variabili nelle indagini di origine. A parte alcune variabili come la

classe di età (non presente nella MP e ricreata a partire dall’osservazione dell’età) o il titolo di

studio (in cui la classificazione utilizzata nelle due survey era l’esatto opposto), l’allineamento delle

due survey ha presentato parecchi inconvenienti, soprattutto per quel che riguarda la definizione

della professione, per la quale la survey SHIW presentava una classificazione maggiormente

dettagliata rispetto a quella utilizzata nella MP. Lo stesso discorso può essere effettuato per quanto

riguarda il ramo di attività e la posizione nella professione. Un ultimo problema è legato alla

definizione del numero di percettori di reddito, la cui variabile è disponibile solo nella SHIW ed è

stata ricostruita nella MP.

Una volta completato l’allineamento dei due dataset si è proceduto alla comparazione della

distribuzione delle variabili di interesse nella MP e nella SHIW. Come si può vedere dalle tabelle

riportate in appendice 2, i test chi-quadro dimostrano come solo la composizione degli individui per

sesso e classi di età risultano omogenee tra le due indagini. La composizione per area geografica,

stato civile, professione e settore di professione presenta invece una differenza statisticamente

significativa. Per quanto riguarda la composizione del nucleo familiare, questo è probabilmente

dovuto al fatto mentre per la MP, l’ISTAT, pesando le famiglie a seconda della numerosità

familiare è portata a sostituire unità unipersonali non rispondenti con altrettante unità unipersonali,

la Banca d’Italia, non pesando le famiglie a seconda della numerosità, ha la tendenza a sostituire

unità non rispondenti unipersonali con unità a uno e più componenti. Per quanto riguarda le altre

variabili le differenze nella distribuzione sono probabilmente dovute alla differente classificazione

originaria delle stesse e alle difficoltà incontrate nel processo di allineamento.

Infine, l’operazione più importante è stata quella di definire una funzione di prossimità per

integrare, individuo per individuo, le informazioni provenienti da entrambe le indagini,

condizionandoci al set comune di variabili. Per applicare il propensity score è stata generata una

variabile di “trattamento” t, una dummy che assume valore 1 se l’osservazione considerata

appartiene alla MP e 0 se l’osservazione appartiene SHIW. Il propensity score può essere quindi

definito come la probabilità di appartenere alla MP condizionata al set di variabili comuni socio-

demografiche.

Il propensity score é stata calcolato attraverso una regressione probit della variabile t sul set di

variabili comuni X. Una volta ottenuto tale indice si è proceduto all’individuazione di una corretta

misura di distanza per misurare la similitudine tra i diversi soggetti presenti nelle indagini.

Considerato la differente numerosità campionaria delle due indagine, si é deciso di optare per il

metodo del nearest neighbour matching con possibilità di rimpiazzamento, ossia abbinando alla

Page 8: Dipartimento di Politiche Pubbliche e Scelte Collettive ...polis.unipmn.it/pubbl/RePEc/uca/ucapdv/sisto63.pdf · possibili balancing scores, Rosembaum e Rubin (1983) suggeriscono

8

Multiscopo quell’individuo della survey Banca d’Italia che minimizza la distanza assoluta in

termini di propensity score. Tale processo offre il vantaggio di incrementare la qualità del matching

a discapito, tuttavia, di una maggiore varianza dello stimatore (Caliendo e Kopeinig, 2005).

Tuttavia, al fine di evitare l’abbinamento tra individui con caratteristiche estremamente differenti

tra loro (ossia il caso in cui la distanza tra l’individuo considerato e quello che minimizza la

differenza tra i propensity score risulta molto elevata) si é deciso di partizionare il dataset in

differenti celle, in modo da effettuare l’operazione di matching non sull’intero dataset ma

separatamente all’interno di ogni singola cella. Il dataset é stato quindi diviso in 240 celle

individuate dalle cinque macro regioni (nord-ovest, nord-est, centro, sud, isole), le otto tipologie di

occupazione e le sei classi di età, all’interno delle quali é stata effettuata l’operazione di

imputazione. Inoltre, per migliorare la qualità del risultato si é deciso di settare un caliper, ossia una

soglia di distanza al di sopra della quale il candidato per l’abbinamento risulta scartato. Questo

procedimento ha migliorato la qualità del dataset integrato riducendone per la numerosità dalle

58000 unità alle 36029.

Una volta completata la procedura di matching si è proceduto a valutarne la bontà in termine di sia

preservazione della distribuzione del reddito tra le differenti celle individuate dal vettore X, sia in

termini di mantenimento delle preesistenti relazioni tra le variabili di interesse. Si é quindi

proceduto i) alla comparazione tra la distribuzione del reddito nel dataset integrato e quella

preesistente Banca d’Italia, ii) al calcolo delle correlazioni tra il reddito e il vettore X per verificare

il mantenimento del segno registrato nel dataset originario. Le tabelle con le distribuzioni del

reddito e i calcoli delle correlazioni sono riportate nell’appendice 3. In generale non si é notato

differenze significative nella distribuzione del reddito imputato rispetto alla fonte originaria SHIW.

Le uniche differenze evidenziate sono una leggera sottostima della distribuzione per la soglia dei

redditi più bassi per le categorie di professione casalinga e servizio di leva, mentre, sempre per le

stesse fasce di reddito, la distribuzione del reddito imputato risulta invece sovrastimata per gli

uomini (reddito minore di 30 milioni di lire). Queste differenze sono principalmente imputabili alle

difficoltà riscontrate nell’operazione di riclassificazione delle variabili di interesse, dovute in misura

principale alla diversa metrica e classificazione impiegata. Tuttavia le correlazioni con le variabili

socio-demografiche risultano identiche nei segni a quelle registrate nel campione SHIW. Quindi,

indipendentemente dalle piccole differenze riscontrate in precedenza, si può concludere che

l’operazione di matching sia riuscita.

4. Conclusioni

Page 9: Dipartimento di Politiche Pubbliche e Scelte Collettive ...polis.unipmn.it/pubbl/RePEc/uca/ucapdv/sisto63.pdf · possibili balancing scores, Rosembaum e Rubin (1983) suggeriscono

9

Recentemente l’attenzione di molti microeconomisti è stata rivolta a testare l’applicabilità in

economia dei metodi di imputazione statistica. Infatti, non sempre le indagini disponibili osservano

congiuntamente tutte le variabili di interesse per le indagini economiche. Spesso l’osservazione del

reddito, della ricchezza patrimoniale e del consumo di particolari tipologie di beni sono oscurate

nelle indagini ISTAT per motivi di privacy. Conseguentemente, gli economisti sono costretti a

ricorrere a strumenti statistici per integrare dati provenienti da fonti diverse. Scopo del presente

contributo è quello di testare la possibilità di creare un database integrato utilizzando l’indagine

multiscopo ISTAT “Aspetti della vita quotidiana” (2000) e l’indagine Banca d’Italia sui Bilanci

delle famiglie Italiane (2000). A tal fine si è utilizzato la metodologia del propensity score

(Rosembaum e Rubin, 1983), ossia la probabilità di appartenere a una delle due indagini

condizionata a un set comune di variabili socio-demografiche, una tecnica sviluppata nella

letteratura dei casual treatment effect e recentemente impiegata anche dai principali istituti di

statistica per l’elaborazione di database integrati. Uno dei principali vantaggi derivanti dall’uso del

propensity score è quello di ridurre un problema di matching potenzialmente multidimensionale a

uno unidimensionale, facilitando il compito di imputazione. Dopo aver individuato il set di variabili

comuni sul quale condizionare l’operazione di matching, si è proceduto a una fase preliminare di

assimilazione delle due indagini in modo da individuare per tali variabili una metrica e una

classificazione comune. Infine si è definito un algoritmo per misurare la somiglianza tra gli

individui appartenenti alle due survey. Dato la numerosità campionaria si è optato per il nearest

neighbor con rimpiazzamento, tecnica che permette di aumentare la qualità del matching a

discapito, però, di una maggiore varianza dello stimatore. Per migliorare la qualità dell’operazione

si è deciso di effettuare tale operazione dividendo i dataset per macroregioni e di utilizzare

l’opzione caliper che consente di individuare una soglia critica al di là della quale rifiutare l’unità

imputata. I risultati ottenuti, sia in termine di distribuzione del reddito imputato che in termine di

correlazione tra quest’ultimo e il set di variabili socio-demografiche dimostrano come, salvo

qualche piccola distorsione specie per le classi di reddito più basse, il procedimento sia riuscito.

Page 10: Dipartimento di Politiche Pubbliche e Scelte Collettive ...polis.unipmn.it/pubbl/RePEc/uca/ucapdv/sisto63.pdf · possibili balancing scores, Rosembaum e Rubin (1983) suggeriscono

10

Bibliografia

Caliendo, M., Kopeinig, S., 2005, Some pratical guidance for the implementation of propensity

score matching, IZA discussion paper n. 1588.

D’Orazio, M, Di Zio, M e Scanu, M., 2003, Statistical Matching: a tool for integrating data in

national statistical institutes.

Rosembaum, P. e Rubin, D., 1983, The central role of the propensity score in observational

studies for casual effects, Biometrika, 70, 41-50.

Vousten, R., de Heer, W., 1998, Reducing non-response: the POLS fieldwork design,

Netherlands official statistics, 13, 16-19.

Page 11: Dipartimento di Politiche Pubbliche e Scelte Collettive ...polis.unipmn.it/pubbl/RePEc/uca/ucapdv/sisto63.pdf · possibili balancing scores, Rosembaum e Rubin (1983) suggeriscono

11

APPENDICE 1. Ricodifica delle variabili Variabile Denominazione

Multiscopo Denominazione SHIW

Ri-codifica

Ampiezza survey Individui: 58653 Famiglie: 21718

Individui: 22268 Famiglie: 8001

Identificativo del nucleo familiare

IDFAMIG (00001-21718)

NQUEST (34-650111)

NQUEST (1-21718) per Istat (21719-29719) per SHIW

Numero ordine componenti all’interno del nucleo familiare

INUM_COMP (01-12)

NORD (1-12)

NORD (1-12)

Regione di residenza del soggetto intervistato

REGIONE (10 = Piemonte, 10 = Val d’Aosta, 30 = Lombardia, 40 = Trentino, 50 = Veneto, 60 = Friuli, 70 = Liguria, 80 = Emilia, 90 = Toscana, 100 = Umbria, 110 = Marche, 120 = Lazio, 130 = Abruzzo, 140 = Molise, 150 = Campania, 160 = Puglia, 170 = Basilicata, 180 = Calabria, 190 = Sicilia, 200 = Sardegna)

IREG (1 = Piemonte, 2 = Val d’Aosta, 3 = Lombardia, 4 = Trentino, 5 = Veneto, 6 = Friuli, 7 = Liguria, 8 = Emilia, 9 = Toscana, 10 = Umbria, 11 = Marche, 12 = Lazio, 13 = Abruzzo, 14 = Molise, 15 = Camapania, 16 = Puglia, 17 = Basilicata, 18 = Calabria, 19 = Sicilia, 20 = Sardegna)

IREG (10 = Piemonte, 10 = Val d’Aosta, 30 = Lombardia, 40 = Trentino, 50 = Veneto, 60 = Friuli, 70 = Liguria, 80 = Emilia, 90 = Toscana, 100 = Umbria, 110 = Marche, 120 = Lazio, 130 = Abruzzo, 140 = Molise, 150 = Campania, 160 = Puglia, 170 = Basilicata, 180 = Calabria, 190 = Sicilia, 200 = Sardegna)

Area geografica di residenza del soggetto intervistato

AREAGEO (1 = Nord ovest, 2 = Nord est, 3 = Centro, 4 = Sud, 5 = Isole) N.B. Nord ovest: Piemonte, Valle d’Aosta, Lombardia, Liguria Nord est: Trentino, Veneto, Friuli, Emilia; Centro: Toscana Marche, Umbria, Lazio, Sud: Abruzzo, Molise, Campania, Puglia, Calabria, Basilicata; Isole: Sicilia e Sardegna

AREA3 (1 = Nord, 2 = Centro, 3 = Sud) AREA5 (1 = Nord ovest, 2 = Nord est, 3 = Centro, 4 = Sud, 5 = Isole)

AREAGEO (1 = Nord ovest, 2 = Nord est, 3 = Centro, 4 = Sud, 5 = Isole)

Relazione di parentela del soggetto intervistato all’interno del nucleo familiare

REL_PARENT (1 = Pers.Riferim, 2 = coniuge, 3 = convivente,

PARENT (1 = capofamiglia, 2 = coniuge/convivente del C.F.,

PARENT (1 = capofamiglia, 2 = coniuge/convivente del C.F.,

Page 12: Dipartimento di Politiche Pubbliche e Scelte Collettive ...polis.unipmn.it/pubbl/RePEc/uca/ucapdv/sisto63.pdf · possibili balancing scores, Rosembaum e Rubin (1983) suggeriscono

12

4 = genitore di PR, 5 = Genitore di coniuge PR, 6 = figlio di PR, 7 = figlio nato da precedente matrimonio, 8 = coniuge del figlio, 9 = convivente del figlio, 10 = nipote del figlio, 11 = nipote figlio di fratello PR, 12 = fratello 13 = fratello del coniuge 14 = coniuge del fratello del PR 15 = convivente del fratello di PR 16 = altro parente di PR, 17 = persona legata in amicizia)

3 = figlio/a del C.F., 4 = genitore del C.F. 5 = altro parente/affine del C.F., 6 = altro elemento non legato da rapporto di parentela al C.F.)

3 = figlio/a del C.F., 4 = genitore del C.F. 5 = altro parente/affine del C.F., altro componente non legato da rapporto di parentela al C.F.)

Età del soggetto intervistato

ETA (000-105)

ETA (000-105)

ETA (000-105)

Classe di età del soggetto intervistato

- CLETA (1 = Fino a 30, 2 = 31-40, 3 = 41-50, 4 = 51-65, 5 = oltre 65)

CLETA (1 = Fino a 19, 2 = 20-30, 3 = 31-65, 4 = oltre 65)

Sesso dei componenti del nucleo familiare

SESSO ( 1 = uomo, 2 = donna)

SEX ( 1 = uomo, 2 = donna)

SEX ( 1 = uomo, 2 = donna)

Stato civile del soggetto intervistato

STATO_CIVILE ( 1 = celibe/nub., 2 = coniugato, 3 = separato di fatto, 4 = separato legalmente, 5 = divorziato, 6 = vedovo/a)

STACIV ( 1 = coniugato, 2 = celibe/nub., 3 = separato/div., 4 = vedovo/a)

STACIV ( 1 = coniugato, 2 = celibe/nub., 3 = separato/div, 4 = vedovo/a)

Titolo di studio del soggetto intervistato

STUDIO ( 1 = dottorato/specializz. post, 2 = laurea, 3 = diploma universit., 4 = diploma superiore, 5 = diploma professionale (3 anni), 6 = licenzia media, 7 = element., 8 = nessuno (non analfab.) specializzazione post-laurea 9 = nessun analfabeta

STUDIO ( 1 = nessuno, 2 = element., 3 = media, 4 = diploma profess., 5 = diploma superiore, 6 = laurea breve, 7 = laurea, 8 = specializzazione post-laurea)

STUDIO ( 1 = nessuno, 2 = element., 3 = media, 4 = diploma profess., 5 = diploma, 6 = laurea breve, 7 = laurea, 8 = specializzazione post-laurea )

Occupazione del soggetto intervistato

PROFESSIONE (1 = occupato, 2 = in cerca di nuova occup., 3 = in cerca di prima occupazione, 4 = in servizio di leva, 5 = casalinga, 6 = studente,

APQUAL (01 = operaio, comprende apprendisti, salariati, lavoranti a domicilio e commessi, 02 = impiegato, 03 = insegnante di qualsiasi tipo di scuola, 04 = impiegato

PROFESSIONE (1 = occupato, 2 = in cerca di nuova occup, 3 = in cerca di prima occupazione, 4 = in servizio di leva , 5 = casalinga, 6 = studente,

Page 13: Dipartimento di Politiche Pubbliche e Scelte Collettive ...polis.unipmn.it/pubbl/RePEc/uca/ucapdv/sisto63.pdf · possibili balancing scores, Rosembaum e Rubin (1983) suggeriscono

13

7 = inabile, 8 = ritirato dal lavoro, 9 = altra condizione)

direttivo/quadro, 05 = dirigente, alto funzionario, preside, docente universitario, magistrato, 06 = libero professionista, 07 = imprenditore individuale, 08 = lavoratore autonomo/ artigiano, 09 = titolare/coadiuvante impresa familiare, 10 = socio/gestore di società, 20 = co.co.co 11 = in cerca prima occup., 12 = disoccupato, 13 = casalinga, 14 = benestante, 15 = pensionato da lavoro, 16 = pensionato non da lavoro, 17 = studente, 18 = bambino età presocolare, 19 = militare di leva)

7 = ritirato dal lavoro, 8 = altra condizione)

Settore di attività nel quale è occupato il soggetto intervistato

RAMO_ATTIVITA’ (1 = agricoltura, caccia e pesca, 2 = industria ed estrazione, 3 = costruzioni 4 = commercio, alberghi e ristoranti 5 = trasporti, magazzini e comunicazioni, 6 = intermediazioni, noleggio, altre attività professionali, 7 = pubblica amministrazione e difesa, 8 = istruzione, sanità ed altri servizi sociali, 9 = altri servizi)

APSETT (01 = agricoltura, caccia, silvicoltura, pesca, piscicoltura e servizi connessi, 02 = estrazione minerali, industrie alimentari, tabacco, abbigliamento, prodotti in pelle, legno carta, chimica, metallo, attività manifatturiere, produzione energia elettrica, gas e acqua, 03 = edilizia, 04 = commercio all’ingrosso e al dettaglio, riparazioni autoveicoli, alberghi, ristoranti, 05 = trasporti, magazzinaggio e comunicazioni, 06 = intermediazioni monetaria, finanziaria e assicurazioni, 07 = attività immobiliari, noleggio, informatica, ricerca, altra attività imprenditoriali e professionali, 08 = servizi domestici presso famiglie, 09 = Pubblica amministrazione, Difesa, istruzioni, sanità e altri

APSETT (1 = agricoltura, caccia e pesca, 2 = industria ed estrazione, 3 = costruzioni 4 = commercio, alberghi e ristoranti 5 = trasporti, magazzini e comunicazioni, 6 = intermediazioni, noleggio, altre attività professionali, 7 = pubblica amministrazione e difesa, istruzione, sanità ed altri servizi sociali, 8 = altri servizi)

Page 14: Dipartimento di Politiche Pubbliche e Scelte Collettive ...polis.unipmn.it/pubbl/RePEc/uca/ucapdv/sisto63.pdf · possibili balancing scores, Rosembaum e Rubin (1983) suggeriscono

14

servizi pubblici, 10 = organizzazioni e organismi extraterritoriali)

Settore di occupazione del soggetto intervistato

SETT (1 = agricoltura, 2 = industria, 3 = servizi pubblici, 4 = altri settori, 5 = nessun settore)

SETT (1 = agricoltura, 2 = industria, 3 = servizi pubblici, 4 = altri settori, 5 = nessun settore)

Status lavoraivo del soggetto intervistato

POSIZIONE (1 = alle dipendenze come dirigente, 2 = direttivo, quadro, 3 = impiegato intermedio, 4 = capo operaio, operaio subalterno e assimilati, 5 = apprendista, 6 = lavoratore a domicilio per conto di impresa, 7 = autonomo come imprenditore, 8 = libero professionista,

9 = lavoratore in proprio, 10 = socio cooperativa Produzione beni e prestazione servizi

QUAL (1 = operaio, 2 = impiegato, 3 = dirigente/dirett., 4 = imprendit./libero professionista, 5 = altro autonomo, 6 = pensionato, 7 = altri non occupati)

QUAL (1 = operaio, 2 = impiegato, 3 = dirigente/dirett., 4 = imprendit./libero professionista, 5 = altro autonomo, 6 = pensionato, 7 = altri non occupati)

Il soggetto intervistato e’percettore di reddito?

- PERC (1 = Sì, 0 = No)

PERC (1 = Sì, 0 = No)

Titolo di possesso dell’abitazione di residenza del soggetto intervistato

AFFITTO (1 = affitto/subaff., 2 = proprietà, 3 = usofrutto, 4 = titolo gratuito, 5 = altro)

GODABIT (1 = proprietà, 2 = affitto/subaff., 3 = a riscatto 4 = usofrutto, 5 = titolo gratuito)

AFFITTO (1 = affitto/subaff., 2 = proprietà, 3 = usofrutto, 4 = titolo gratuito, 5 = altro)

Page 15: Dipartimento di Politiche Pubbliche e Scelte Collettive ...polis.unipmn.it/pubbl/RePEc/uca/ucapdv/sisto63.pdf · possibili balancing scores, Rosembaum e Rubin (1983) suggeriscono

15

APPENDICE 2. Confronto tra le distribuzione delle variabili di interesse

Tabella 2.1. Composizione dei database per area geografica di residenza

Areageo SHIW MP Totale Nord-Ovest 4848

(21.77) 11219 (19.13)

16067 (19.86)

Nord-Est 4286 (19.25)

14053 (23.96)

18339 (22.66)

Centro 4440 (19.94)

10533 (17.96)

14973 (18.50)

Sud 5922 (26.59)

16587 (28.28)

22509 (27.82)

Isole 2772 (12.45)

6261 (10.67)

9033 (11.16)

Totale 22268 (100.00)

58653 (100.00)

80921 (100.00)

Nota: composizione dei campioni SHIW e MP, frequenze assolute e relative (in parentesi). Chi-quadro (4): 311.1423 (p-value: 0.0000) Tabella 2.2. Composizione dei database per stato civile

Staciv SHIW MP Totale coniugato 11400

(51.19) 29078 (49.58)

40478 (50.02)

celibe/nub 8755 (39.32)

23381 (39.86)

32136 (39.71)

separato/divorziato 508 (2.28)

1842 (3.14)

2350 (2.90)

vedovo 1605 (7.21)

4352 (7.42)

5957 (7.36)

Totale 22268 (100.00)

58653 (100.00)

80921 (100.00)

Nota: composizione dei campioni SHIW e MP, frequenze assolute e relative (in parentesi). Chi-quadro (3): 51.6817 (p-value: 0.0000) Tabella 2.3. Composizione dei database per sesso

Sex SHIW MP Totale uomo 10953

(49.19) 28524 (48.63)

39477 (19.86)

donna 14053 (50.81)

4286 (51.37)

18339 (51.22)

Totale 58653 (100.00)

22268 (100.00)

80921 (100.00)

Nota: composizione dei campioni SHIW e MP, frequenze assolute e relative (in parentesi). Chi-quadro (1): 1.9926 (p-value: 0.1587)

Page 16: Dipartimento di Politiche Pubbliche e Scelte Collettive ...polis.unipmn.it/pubbl/RePEc/uca/ucapdv/sisto63.pdf · possibili balancing scores, Rosembaum e Rubin (1983) suggeriscono

16

Tabella 2.4. Composizione dei database per classi di età

Cleta SHIW MP Totale 0-19 4420

(19.85) 12005 (20.47)

16425 (20.30)

20-30 3382 (15.19)

8816 (15.03)

12198 (15.07)

31-65 10881 (48.86)

28511 (48.61)

39392 (48.68)

>65 3585 (16.10)

9321 (15.89)

12906 (15.95)

Totale 58653 (100.00)

22268 (100.00)

80921 (100.00)

Nota: composizione dei campioni SHIW e MP, frequenze assolute e relative (in parentesi). Chi-quadro (3): 3.9581 (p-value: 0.232) Tabella 2.5. Composizione dei database per numero componenti del nucleo familiare

Ncomp SHIW MP Totale 1 componente 1479

(6.64) 4782 (8.15)

16067 (7.74)

coniugi 4442 (19.95)

11206 (19.11)

18339 (19.34)

Coniugi e un figlio 5334 (19.95)

14919 (25.44)

14973 (25.03)

Coniugi e altri parenti

11013 (49.46)

27746 (47.31)

22509 (47.90)

Totale 22268 (100.00)

58653 (100.00)

80921 (100.00)

Nota: composizione dei campioni SHIW e MP, frequenze assolute e relative (in parentesi). Chi-quadro (3): 83.3295 (p-value: 0.0000) Tabella 2.6. Composizione dei database per tipologia di occupazione

Professione SHIW MP Totale occupato 7,941

(35.66) 22,156 (44.31)

30,097 (41.64)

in cerca nuova occupazione

502 (2.25)

1,204 (2.40)

1,706 (2.36)

in cerca prima occupazione

795 (3.57)

1,558 (3.12)

2,353 (3.26)

in servizio di leva 63 (0.28)

124 (0.24)

187 (0.26)

casalinga 2,954 (13.27)

7,689 (15.38)

10,643 (14.73)

studente 3,834 (17.22)

4,510 (9.01)

8,344 (11.5)

ritirato dal lavoro 3,884 (17.44)

10885 (21.77)

14769 (20.43)

altra condizione 2,295 (10.31)

1882 (3.76)

4177 (5.78)

Totale 22,268 (100.00)

50008 (100.00)

72276 (100.00)

Nota: composizione dei campioni SHIW e MP, frequenze assolute e relative (in parentesi). Chi-quadro (8): 1.0e+04 (p-value: 0.0000)

Page 17: Dipartimento di Politiche Pubbliche e Scelte Collettive ...polis.unipmn.it/pubbl/RePEc/uca/ucapdv/sisto63.pdf · possibili balancing scores, Rosembaum e Rubin (1983) suggeriscono

17

Tabella 2.7. Composizione dei database per settore di occupazione

Qual SHIW MP Totale Operaio 2807

(12.61) 7453

(14.90) 10260 (14.20)

impiegato 2716 (12.20)

7599 (15.20)

10315 (14.27)

dirigente/dirett 624 (2.80)

1411 (2.82)

2035 (2.22)

imprendit./libero pr

699 (3.14)

839 (1.68)

1538 (2.13)

altro autonomo 1095 (4.92)

4854 (9.71)

5949 (8.23)

pensionato 50471

(22.66) 10885 (21.77)

15932 (22.04)

altri non occupati 9280 (41.67)

16967 (33.93)

26247 (36.31)

Totale 22268 (100.00)

50008 (100.00)

72276 (100.00)

Nota: 1 la differenza tra il numero di ritirati dal lavoro e il numero di pensionati riportati in tabella e’ dovuta al fatto che la survey SHIW discrimina tra le persone in possesso di pensione da lavoro e quelle in possesso di altre forme di pensione. Composizione dei campioni SHIW e MP, frequenze assolute e relative (in parentesi) chi quadro (6) = 998.5246 (p-value: 0.000)

Page 18: Dipartimento di Politiche Pubbliche e Scelte Collettive ...polis.unipmn.it/pubbl/RePEc/uca/ucapdv/sisto63.pdf · possibili balancing scores, Rosembaum e Rubin (1983) suggeriscono

18

APPENDICE 3. Distribuzione del reddito nel database integrato

Tabella 3.1. Statistiche descrittive

Indagine Media Mediana Primo

quartile

Terzo

quartile

Dev.

Stand.

Min Max Obs.

SHIW 29398.21 24475 15000 36029 27586.26 -131746 741026.7 14303

MP 28372.88 24000 15000 35000 23594.96 -131746 363555.3 741026.7

Tabella 3.2. Distribuzione del reddito per classi di reddito Income (1000 lir) SHIW Frequenze

cumulate MP Frequenze

cumulate <15000 3,565

(24.89) 24.89 8,884

(24.45) 24.45

15000-29999 5,447 (38.04)

62.93 14,728 (40.53)

64.97

30000-49999 3,663 (25.58)

88.51 8,899 (24.49)

89.46

50000-74999 1,081 (7.55)

96.05 2,593 (7.14)

96.60

75000-99999 298 (2.08)

98.14 667 (1.84)

98.43

100000-149999 182 (1.27)

99.41 413 (1.14)

99.57

150000-199999 44 (0.31)

99.71 110 (0.30)

99.87

200000-249999 17 (0.12)

99.83 23 (0.06)

99.93

250000-299999 8 (0.06)

99.89 9 (0.02)

99.96

>299999 16 (0.11)

100.00 15 (0.04)

100.00

Totale 14,321 (100.00)

36,341 (100.00)

Nota: composizione dei campioni SHIW e MP, frequenze assolute e relative (in parentesi).

Page 19: Dipartimento di Politiche Pubbliche e Scelte Collettive ...polis.unipmn.it/pubbl/RePEc/uca/ucapdv/sisto63.pdf · possibili balancing scores, Rosembaum e Rubin (1983) suggeriscono

19

Tabella 3.3. Distribuzione dei reddito per sesso

Sex

Uomo Donna Income (1000 lir) SHIW MP SHIW MP

<15000 1,094 (13.78)

3,869 (19.21)

2,471 (38.72)

5,015 (30.96)

15000-29999 2,882 (36.30)

8,152 (40.47)

2,565 (40.19)

6,576 (40.59)

30000-49999 2,595 (32.69)

5,672 (28.16)

1,068 (16.73)

3,227 (19.92)

50000-74999 888 (11.19)

1,637 (8.13)

193 (3.02)

956 (5.90)

75000-99999 241 (3.04)

441 (2.19)

57 (0.89)

226 (1.40)

100000-149999 164 (2.07)

279 (1.39)

18 (0.28)

134 (0.83)

150000-199999 38 (0.38)

63 (0.31)

6 (0.09)

47 (0.29)

200000-249999 16 (0.20)

14 (0.07)

1 (0.02)

9 (0.06)

250000-299999 8 (0.10)

5 (0.02)

0 (0.00)

4 (0.02)

>299999 13 (0.16)

9 (0.04)

3 (0.05)

6 (0.04)

Totale 7,939 (55.44)

20,141 (55.42)

6,382 (44.56)

16,200 (44.58)

Nota: composizione dei campioni SHIW e MP, frequenze assolute e relative (in parentesi). Tabella 3.4. Distribuzione dei reddito per area geografica di residenza

Areageo Nord-Ovest Nord-Est Centro Sud Isole

Income (1000 lir) SHIW MP SHIW MP SHIW MP SHIW MP SHIW MP <15000 645

(18.64) 1,470 (19.12)

608 (19.57)

1,919 (20.21)

704 (23.09)

1,634 (23.54)

1,017 (32.30)

2,817 (31.09)

591 (38.01)

1,044 (33.08)

15000-29999 1,331 (38.46)

3,183 (41.40)

1,112 (35.79)

3,657 (38.52)

1,212 (39.75)

2,822 (40.66)

1,235 (39.22)

3,806 (42.00)

557 (35.82)

1,260 (39.92)

30000-49999 984 (28.43)

2,079 (27.04)

899 (28.93)

2,598 (27.36)

807 (26.47)

1,757 (25.32)

669 (21.24)

1,829 (20.19)

304 (19.55)

636 (20.15)

50000-74999 310 (8.96)

613 (7.97)

321 (10.33)

893 (9.40)

218 (7.15)

521 (7.51)

166 (5.27)

431 (4.76)

66 (4.24)

135 (4.28)

75000-99999 95 (2.74)

184 (2.39)

87 (2.80)

212 (2.23)

60 (1.97)

116 (1.67)

37 (1.17)

112 (1.24)

19 (1.22)

43 (1.36)

100000-149999 70 (2.02)

127 (1.65)

52 (1.67)

145 (1.53)

33 (1.08)

72 (1.04)

17 (0.54)

42 (0.43)

10 (0.64)

27 (0.86)

150000-199999 11 (0.32)

14 (0.18)

15 (0.48)

56 (0.59)

9 (0.30)

13 (0.19)

15 (0.16)

19 (0.21)

4 (0.26)

8 (0.25)

200000-249999 2 (0.06)

1 (0.01)

7 (0.23)

11 (0.12)

3 (0.10)

3 (0.04)

1 (0.03)

5 (0.06)

4 (0.26)

3 (0.10)

250000-299999 5 (0.14)

8 (0.10)

2 (0.10)

1 (0.01)

0 (0.00)

0 (0.00)

0 (0.00)

0 (0.00)

0 (0.00)

0 (0.00)

>299999 8 (0.23)

0.13 (0.13)

3 (0.10)

3 (0.03)

3 (0.10)

2 (0.13)

2 (0.06)

0 (0.00)

0 (0.00)

0 (0.00)

Totale 3,461 (24.17)

7,689 (21.16)

3,107 (21.70)

9,495 (26.13)

3,049 (21.49)

6,940 (19.10)

3,149 (21.99)

9,061 (24.93)

1,555 (10.86)

3,156 (8.68)

Nota: composizione dei campioni SHIW e MP, frequenze assolute e relative (in parentesi).

Page 20: Dipartimento di Politiche Pubbliche e Scelte Collettive ...polis.unipmn.it/pubbl/RePEc/uca/ucapdv/sisto63.pdf · possibili balancing scores, Rosembaum e Rubin (1983) suggeriscono

20

Tabella 3.5. Distribuzione dei reddito per tipologie di occupazione

Professione Occupato In cerca di nuova

occupazione In cerca di prima

occupazione In servizio di leva Casalinga Studente Ritirato Altra condizione

Income (1000 lir) SHIW MP SHIW MP SHIW MP SHIW MP SHIW MP SHIW MP SHIW MP SHIW MP <15000 1,017

(12.83) 3,185

(15.19) 193

(75.10) 420

(74.34) 58

(89.23) 80

(91.95) 6

(50.00) 0

(0.00) 581

(78.83) 1,128

(66.67) 196

(85.96) 320

(85.11) 894

(23.02) 2,845

(26.26) 620

(51.24) 906

(49.92) 15000-29999 3,223

(40.65) 9,005

(42.94) 50

(19.46) 105

(18.58) 6

(9.23) 3

(3.45) 1

(8.33) 0

(0.00) 114

(15.47) 402

(23.76) 24

(10.53) 43

(11.44) 1,585

(40.82) 4,536

(41.87) 444

(36.69) 634

(34.93) 30000-49999 2,499

(31.52) 5,961

(28.43) 10

(3.89) 23

(4.07) 2

(1.54) 4

(4.60) 4

(33.33) 2

(100.00) 22

( 2.99) 106

(6.26) 22

(2.63) 11

(2.93) 1,003

(25.83) 2,569

(23.71) 118

(9.75) 223

(12.29) 50000-74999 775

(9.77) 1,881 (8.97)

4 (1.56)

17 (3.01)

0 (0.00)

0 (0.00)

1 (8.33)

0 (0.00)

11 (1.49)

49 (2.90)

2 (0.88)

2 (0.53)

270 (6.95)

615 (5.68)

18 (1.49)

29 (1.60)

75000-99999 209 (2.64)

484 (2.31)

0 (0.00)

0 (0.00)

0 (0.00)

0 (0.00)

0 (0.00)

0 (0.00)

4 (0.54)

1 (0.06)

0 (0.00)

0 (0.00)

77 (1.98)

160 (1.48)

8 (0.66)

22 (1.21)

100000-149999 141 (1.78)

326 (1.55)

0 (0.00)

0 (0.00)

0 (0.00)

0 (0.00)

0 (0.00)

0 (0.00)

2 (0.27)

5 (0.30)

0 (0.00)

0 (0.00)

38 (0.98)

82 (0.76)

1 (0.08)

0 (0.00)

150000-199999 31 (0.39)

86 (0.41)

0 (0.00)

0 (0.00)

0 (0.00)

0 (0.00)

0 (0.00)

0 (0.00)

3 (0.41)

1 (0.06)

0 (0.00)

0 (0.00)

10 (0.26)

23 (0.21)

0 (0.00)

0 (0.00)

200000-249999 14 (0.18)

22 (0.10)

0 (0.00)

0 (0.00)

0 (0.00)

0 (0.00)

0 (0.00)

0 (0.00)

0 (0.00)

0 (0.00)

0 (0.00)

0 (0.00)

2 (0.05)

0 (0.00)

1 (0.08)

0 (0.00)

250000-299999 8 (0.10)

9 (0.04)

0 (0.00)

0 (0.00)

0 (0.00)

0 (0.00)

0 (0.00)

0 (0.00)

0 (0.00)

0 (0.00)

0 (0.00)

0 (0.00)

0 (0.00)

0 (0.00)

0 (0.00)

1 (0.06)

>299999 8 (0.10)

11 (0.05)

0 (0.00)

0 (0.00)

0 (0.00)

0 (0.00)

0 (0.00)

0 (0.00)

0 (0.00)

0 (0.00)

0 (0.00)

0 (0.00)

4 (0.10)

4 (0.04)

0 (0.00)

0 (0.00)

Totale 7,929 (55.37)

20,970 (57.70)

257 (1.77)

565 (1.55)

65 (0.45)

87 (0.24)

12 (0.08)

2 (0.01)

737 (5.15)

1,692 (4.66)

228 (1.59)

376 (1.03)

3,883 (27.11)

10,834 (29.81)

1210 (8.45)

1,815 (4.99)

Nota: composizione dei campioni SHIW e MP, frequenze assolute e relative (in parentesi).

Page 21: Dipartimento di Politiche Pubbliche e Scelte Collettive ...polis.unipmn.it/pubbl/RePEc/uca/ucapdv/sisto63.pdf · possibili balancing scores, Rosembaum e Rubin (1983) suggeriscono

21

Tabella 3.6. Correlazione tra reddito e variabili socio-economiche

SHIW MP

areageo -0.1350* -0.1217*

professione -0.1611* -0.1440*

apsett 0.1207* 0.0223*

cleta 0.0531* 0.0256*

parent -0.3562* -0.0858*

perc 0.1314* 0.1515*

qual -0.1105* -0.1436*

sett -0.1382* -0.1369*

sex -0.2580* -0.1062*

staciv -0.0968* -0.0929*

studio 0.3752* 0.1451*

Nota: * rappresenta significatività al 0.01

Page 22: Dipartimento di Politiche Pubbliche e Scelte Collettive ...polis.unipmn.it/pubbl/RePEc/uca/ucapdv/sisto63.pdf · possibili balancing scores, Rosembaum e Rubin (1983) suggeriscono

Working Papers The full text of the working papers is downloadable at http://polis.unipmn.it/

*Economics Series **Political Theory Series ε Al.Ex Series

2006 n.63* Andrea Sisto: Propensity Score matching: un'applicazione per la creazione di un database integrato ISTAT-Banca d'Italia

2005 n.62* P. Pellegrino: La politica sanitaria in Italia: dalla riforma legislativa alla riforma costituzionale

2005 n.61* Viola Compagnoni: Analisi dei criteri per la definizione di standard sanitari nazionali

2005 n.60ε Guido Ortona, Stefania Ottone and Ferruccio Ponzano: A simulative assessment of the Italian electoral system

2005 n.59ε Guido Ortona and Francesco Scacciati: Offerta di lavoro in presenza di tassazione: l'approccio sperimentale

2005 n.58* Stefania Ottone and Ferruccio Ponzano, An extension of the model of Inequity Aversion by Fehr and Schmidt

2005 n.57ε Stefania Ottone, Transfers and altruistic punishment in Solomon's Game experiments

2005 n. 56ε Carla Marchese and Marcello Montefiori, Mean voting rule and strategical behavior: an experiment

2005 n.55** Francesco Ingravalle, La sussidiarietà nei trattati e nelle istituzioni politiche dell'UE.

2005 n. 54* Rosella Levaggi and Marcello Montefiori, It takes three to tango: soft budget constraint and cream skimming in the hospital care market

2005 n.53* Ferruccio Ponzano, Competition among different levels of government: the re-election problem.

2005 n.52* Andrea Sisto and Roberto Zanola, Rationally addicted to cinema and TV? An empirical investigation of Italian consumers .

2005 n.51* Luigi Bernardi and Angela Fraschini, Tax system and tax reforms in India

2005 n.50* Ferruccio Ponzano, Optimal provision of public goods under imperfect intergovernmental competition.

Page 23: Dipartimento di Politiche Pubbliche e Scelte Collettive ...polis.unipmn.it/pubbl/RePEc/uca/ucapdv/sisto63.pdf · possibili balancing scores, Rosembaum e Rubin (1983) suggeriscono

2005 n.49* F.Amisano A.Cassone, Proprieta’ intellettuale e mercati: il ruolo della tecnologia e conseguenze microeconomiche

2005 n.48* Tapan Mitra e Fabio Privileggi, Cantor Type Attractors in Stochastic Growth Models

2005 n.47ε Guido Ortona, Voting on the Electoral System: an Experiment

2004 n.46ε Stefania Ottone, Transfers and altruistic Punishments in Third Party Punishment Game Experiments.

2004 n.45* Daniele Bondonio, Do business incentives increase employment in declining areas? Mean impacts versus impacts by degrees of economic distress.

2004 n.44** Joerg Luther, La valorizzazione del Museo provinciale della battaglia di Marengo: un parere di diritto pubblico

2004 n.43* Ferruccio Ponzano, The allocation of the income tax among different levels of government: a theoretical solution

2004 n.42* Albert Breton e Angela Fraschini, Intergovernmental equalization grants: some fundamental principles

2004 n.41* Andrea Sisto, Roberto Zanola, Rational Addiction to Cinema? A Dynamic Panel Analisis of European Countries

2004 n.40** Francesco Ingravalle, Stato, groβe Politik ed Europa nel pensiero politico di F. W. Nietzsche

2003 n.39ε Marie Edith Bissey, Claudia Canegallo, Guido Ortona and Francesco Scacciati, Competition vs. cooperation. An experimental inquiry

2003 n.38ε Marie-Edith Bissey, Mauro Carini, Guido Ortona, ALEX3: a simulation program to compare electoral systems

2003 n.37* Cinzia Di Novi, Regolazione dei prezzi o razionamento: l’efficacia dei due sistemi di allocazione nella fornitura di risorse scarse a coloro che ne hanno maggiore necessita’

2003 n. 36* Marilena Localtelli, Roberto Zanola, The Market for Picasso Prints: An Hybrid Model Approach

2003 n. 35* Marcello Montefiori, Hotelling competition on quality in the health care market.

2003 n. 34* Michela Gobbi, A Viable Alternative: the Scandinavian Model of “Social Democracy”

2002 n. 33* Mario Ferrero, Radicalization as a reaction to failure: an economic model of islamic extremism

2002 n. 32ε Guido Ortona, Choosing the electoral system – why not simply the best one?

Page 24: Dipartimento di Politiche Pubbliche e Scelte Collettive ...polis.unipmn.it/pubbl/RePEc/uca/ucapdv/sisto63.pdf · possibili balancing scores, Rosembaum e Rubin (1983) suggeriscono

2002 n. 31** Silvano Belligni, Francesco Ingravalle, Guido Ortona, Pasquale Pasquino, Michel Senellart, Trasformazioni della politica. Contributi al seminario di Teoria politica

2002 n. 30* Franco Amisano, La corruzione amministrativa in una burocrazia di tipo concorrenziale: modelli di analisi economica.

2002 n. 29* Marcello Montefiori, Libertà di scelta e contratti prospettici: l’asimmetria informativa nel mercato delle cure sanitarie ospedaliere

2002 n. 28* Daniele Bondonio, Evaluating the Employment Impact of Business Incentive

Programs in EU Disadvantaged Areas. A case from Northern Italy

2002 n. 27** Corrado Malandrino, Oltre il compromesso del Lussemburgo verso l’Europa federale. Walter Hallstein e la crisi della “sedia vuota”(1965-66)

2002 n. 26** Guido Franzinetti, Le Elezioni Galiziane al Reichsrat di Vienna, 1907-1911

2002 n. 25ε Marie-Edith Bissey and Guido Ortona, A simulative frame to study the integration of defectors in a cooperative setting

2001 n. 24* Ferruccio Ponzano, Efficiency wages and endogenous supervision technology

2001 n. 23* Alberto Cassone and Carla Marchese, Should the death tax die? And should it leave an inheritance?

2001 n. 22* Carla Marchese and Fabio Privileggi, Who participates in tax amnesties? Self-selection of risk-averse taxpayers

2001 n. 21* Claudia Canegallo, Una valutazione delle carriere dei giovani lavoratori atipici: la fedeltà aziendale premia?

2001 n. 20* Stefania Ottone, L'altruismo: atteggiamento irrazionale, strategia vincente o

amore per il prossimo?

2001 n. 19* Stefania Ravazzi, La lettura contemporanea del cosiddetto dibattito fra Hobbes e Hume

2001 n. 18* Alberto Cassone e Carla Marchese, Einaudi e i servizi pubblici, ovvero come contrastare i monopolisti predoni e la burocrazia corrotta

2001 n. 17* Daniele Bondonio, Evaluating Decentralized Policies: How to Compare the Performance of Economic Development Programs across Different Regions or States.

2000 n. 16* Guido Ortona, On the Xenophobia of non-discriminated Ethnic Minorities

2000 n. 15* Marilena Locatelli-Biey and Roberto Zanola, The Market for Sculptures: An Adjacent Year Regression Index

2000 n. 14* Daniele Bondonio, Metodi per la valutazione degli aiuti alle imprse con specifico target territoriale

Page 25: Dipartimento di Politiche Pubbliche e Scelte Collettive ...polis.unipmn.it/pubbl/RePEc/uca/ucapdv/sisto63.pdf · possibili balancing scores, Rosembaum e Rubin (1983) suggeriscono

2000 n. 13* Roberto Zanola, Public goods versus publicly provided private goods in a two-class economy

2000 n. 12** Gabriella Silvestrini, Il concetto di «governo della legge» nella tradizione repubblicana.

2000 n. 11** Silvano Belligni, Magistrati e politici nella crisi italiana. Democrazia dei

guardiani e neopopulismo

2000 n. 10* Rosella Levaggi and Roberto Zanola, The Flypaper Effect: Evidence from the

Italian National Health System

1999 n. 9* Mario Ferrero, A model of the political enterprise

1999 n. 8* Claudia Canegallo, Funzionamento del mercato del lavoro in presenza di informazione asimmetrica

1999 n. 7** Silvano Belligni, Corruzione, malcostume amministrativo e strategie etiche. Il ruolo dei codici.

Page 26: Dipartimento di Politiche Pubbliche e Scelte Collettive ...polis.unipmn.it/pubbl/RePEc/uca/ucapdv/sisto63.pdf · possibili balancing scores, Rosembaum e Rubin (1983) suggeriscono

1999 n. 6* Carla Marchese and Fabio Privileggi, Taxpayers Attitudes Towaer Risk and

Amnesty Partecipation: Economic Analysis and Evidence for the Italian Case.

1999 n. 5* Luigi Montrucchio and Fabio Privileggi, On Fragility of Bubbles in Equilibrium Asset Pricing Models of Lucas-Type

1999 n. 4** Guido Ortona, A weighted-voting electoral system that performs quite well.

1999 n. 3* Mario Poma, Benefici economici e ambientali dei diritti di inquinamento: il caso della riduzione dell’acido cromico dai reflui industriali.

1999 n. 2* Guido Ortona, Una politica di emergenza contro la disoccupazione semplice, efficace equasi efficiente.

1998 n. 1* Fabio Privileggi, Carla Marchese and Alberto Cassone, Risk Attitudes and the Shift of Liability from the Principal to the Agent

Page 27: Dipartimento di Politiche Pubbliche e Scelte Collettive ...polis.unipmn.it/pubbl/RePEc/uca/ucapdv/sisto63.pdf · possibili balancing scores, Rosembaum e Rubin (1983) suggeriscono

Department of Public Policy and Public Choice “Polis” The Department develops and encourages research in fields such as:

• theory of individual and collective choice; • economic approaches to political systems; • theory of public policy; • public policy analysis (with reference to environment, health care, work, family, culture,

etc.); • experiments in economics and the social sciences; • quantitative methods applied to economics and the social sciences; • game theory; • studies on social attitudes and preferences; • political philosophy and political theory; • history of political thought.

The Department has regular members and off-site collaborators from other private or public organizations.

Page 28: Dipartimento di Politiche Pubbliche e Scelte Collettive ...polis.unipmn.it/pubbl/RePEc/uca/ucapdv/sisto63.pdf · possibili balancing scores, Rosembaum e Rubin (1983) suggeriscono

Instructions to Authors

Please ensure that the final version of your manuscript conforms to the requirements listed below:

The manuscript should be typewritten single-faced and double-spaced with wide margins.

Include an abstract of no more than 100 words. Classify your article according to the Journal of Economic Literature classification system. Keep footnotes to a minimum and number them consecutively throughout the manuscript with superscript Arabic numerals. Acknowledgements and information on grants received can be given in a first footnote (indicated by an asterisk, not included in the consecutive numbering). Ensure that references to publications appearing in the text are given as follows: COASE (1992a; 1992b, ch. 4) has also criticized this bias.... and “...the market has an even more shadowy role than the firm” (COASE 1988, 7). List the complete references alphabetically as follows: Periodicals: KLEIN, B. (1980), “Transaction Cost Determinants of ‘Unfair’ Contractual Arrangements,” American Economic Review, 70(2), 356-362. KLEIN, B., R. G. CRAWFORD and A. A. ALCHIAN (1978), “Vertical Integration, Appropriable Rents, and the Competitive Contracting Process,” Journal of Law and Economics, 21(2), 297-326. Monographs: NELSON, R. R. and S. G. WINTER (1982), An Evolutionary Theory of Economic Change, 2nd ed., Harvard University Press: Cambridge, MA. Contributions to collective works: STIGLITZ, J. E. (1989), “Imperfect Information in the Product Market,” pp. 769-847, in R. SCHMALENSEE and R. D. WILLIG (eds.), Handbook of Industrial Organization, Vol. I, North Holland: Amsterdam-London-New York-Tokyo. Working papers: WILLIAMSON, O. E. (1993), “Redistribution and Efficiency: The Remediableness Standard,”

Working paper, Center for the Study of Law and Society, University of California, Berkeley.