una “soluzione d’angolo” y1y1 y2y2 0 b di solito la scelta del consumatore è identificata dal...
TRANSCRIPT
Una “soluzione d’angolo”
y1
y2
0
B
Di solito la scelta del consumatore è identificata dal punto di tangenza tra
retta del bilancio e curva di indifferenza. Ma non
sempre. Nella figura, la tangenza sarebbe
nel punto B,in cui y2 < 0. Ma un consumo
negativoè impossibile.Il paniere preferito sulla
retta del bilancio è A,Una corner
solution
A
in cui y2 = 0.
Il modello di Regressione
2
'
'
i
ii
iii
yV
xyE
xy
Ricordando che:
TRONCAMENTO : E(x/x>a) = + (a) e V(x/x>a) = ²[1- (a)]
CENSURA:
)(1)(1)(
)()(1)()(22
cens
cens
yVar
ayE
ATTENZIONE notazione importantissima:
Finora abbiamo considerato distribuzioni con un punto di troncamento a che viene poi standardizzato sottraendo la media e dividendo per
Quando consideriamo i modelli di regressione
1. Il punto di troncamento rimane unico2. Lo scarto rimane unico
Ma….
3. Il valor medio cambia, infatti sappiamo che E(yi) = xi cioè è diverso per ciascun soggetto
QUINDI il punto (UNICO) di troncamento ha un valore standardizzato DIVERSO per ciascun individuo e quindi avremo:
iiii
i
ii
ii
xa
2
)(1
)('
Regressione troncata:
iii
iiii
i
iii
ayyV
xayyE
ay
xy
1/
'/
'
2
iiiicens
iiicensi
iii
ii
iii
yVar
xyE
ayseyy
aysey
xy
22
**
*
*
11
'
0
00
'
Regressione censurata: modello modello Tobin o Tobit (censura al punto 0)
Quindi OLS distorti e inconsistenti
Regressione troncata: verosimiglianza
Regressione censurata: verosimiglianza
i
i
iii
xa
xyL
'1ln
'1
)ln(2)2ln(2
1)ln( 2
2
0
0
2
2
'1ln
'1
)ln(2)2ln(2
1)ln(
i
i
y
i
yii
xa
xyL
Regressione troncata: effetto marginale:
Il fattore 1- (che deriva dalla varianza troncata) è compreso tra 0 e 1 quindi per ciascuna variabile l’effetto marginale è MINORE del corrispondente coefficiente, si verifica una sorta di ATTENUAZIONE dell’effetto
Questo avviene nella sottopopolazione NON troncata, naturalmente a volte siamo interessati a tutta la popolazione e quindi guarderemo semplicemente al coefficiente β che rappresenta l’effetto marginale nell’intera popolazione
ii
ii
i
i
x
ayy
x
y
1/
Un risultato utile: abbiamo visto che
Questo implica che: distorsione
La varianza contiene le x (incluse nei i) quindi è ETEROSCHEDASTICO
iii
iiii
i
iii
ayyV
xayyE
ay
xy
1/
'/
'
2
iiiii
i
iiiiiiii
V
ma
E
con
xayyEayy
11
0
'//
222
Alcune domande fondamentali:
• Quale variabile è di interesse (cosa vogliamoprevedere)?– y*? (I non censurati) Probabilmente NO – di solito non rilevante– y? (la distribuzione latente) Di solito SI, il valore per una unità
scelta a caso dalla popolazione– y | y>0? Forse. Dipende da ciò che ci interessa
• Qual’è il residuo?– (y – previsto)? Probabilmente no, come consideriamo
gli zeri?– (qualcosa - x) ? Probabilmente no. x Non è la media.
• Quindi quali sono gli effetti marginali e le medie condizionate alle x?
Regressione censurata: effetto marginale con censura a sx nel punto 0
Che può essere scomposta in due parti:
Si vede così che un cambiamento nelle x ha un DOPPIO effetto:1. Condiziona la media della parte NON censurata2. Modifica la prob. di essere censurati
ii
iii
i
i
ii
i
x
yxyE
x
x
xyE
x
xyEi
1)0;/(
')/(
)/( *
i
iii
i
ii
i
iiiiii
ii
ii
x
yprobxyE
x
xyEyob
x
xyE
)0()/(
)/()0(Pr
1
)/(
**
2
In altri termini l’effetto marginale non è costante, quindi la lettura dei coefficienti del modello NON è sufficiente.
L’effetto sulle Y di una variazione delle X DIPENDE dal valore delle X, quindi, ad esempio, è diversa per ogni individuo (perché ha un vettore di X diverso)
Se vogliamo una indicazione di sintesi rappresentiamo l’effetto delle X nel “punto medio” o per “l’individuo medio”.
Cioè sostituiamo nelle formule di calcolo
Se il modello ha più esplicativedue possibilità:1. valutazione effettuata nel punto medio per UN coefficiente, e
per un valore pari a 0 per le altre variabili2. Valutazione nei punti medi di tutte le variabili, questo ultimo
processo equivale a calcolare la media dei valori stimati individuali, modificando una sola variabile indipendente
Con lo stesso principio è possibile misurare l’effetto di modificazioni delle variabili per tipologie di unità .
xconxi ''
Lo stesso principio si utilizza per il calcolo dei valori previsti e dei residui:
Il metodo di calcolo dei valori previsti e quindi dei residui Poiché il modello precede una “mistura” il metodo deve simultaneamente rendere conto della parte censurata (Ripartizione) e della parte ossservata:
Naturalmente dipende dalla distribuzione ipotizzata a priori:
Per residui normali è:
In sostanza avremo un y=0 per coloro che date le x non superano la soglia stimata di censura
Esempio di stima:
modello per le ore lavorate da un campione di donne (USA)
Quester e Greene (1982)
Obiettivo: verificare se le le donne il cui matrimonio sta perdissolversi, tendono a passare più o meno ore al lavoro
Variabile MLEstima
EffettoMarginale
Punto medio
OLS OLS / % non censurati
Figlipiccoli
-824.19 -376.53 -352.63 -766.59
Titolostudio
22.59 10.32 11.47 24.93
Salario 286.39 130.93 123.95 269.46
Secondo matrimonio
25.33 11.57 13.14 28.57
Bassa prob.divorzio
481.02 219.75 219.22 476.57
Alta prob.divorzio
578.66 264.36 244.17 530.80
Esempio 2: Acquisto di carne = f(reddito)Dati artificiali, censura artificiale
addetti sportelli Osservati addetti sportelli Osservati777 37 0 1314 125 0636 43 0 1605 149 0458 46 0 2280 164 0605 46 0 2674 194 0581 48 0 3114 207 0604 49 0 2299 211 0577 55 0 3161 234 0603 55 0 3988 246 0775 56 0 5890 275 0660 56 0 4299 310 0698 61 0 4492 311 0764 62 0 4853 312 0630 68 0 3857 377 0702 72 0 2772 387 0659 79 0 5081 401 401
1120 81 0 6490 430 430789 81 0 14437 648 648
1312 88 0 7832 654 6541510 89 0 11179 672 672
479 89 0 19885 675 6751147 107 0 13905 810 8101305 121 0 21340 1181 1181
20612 1286 1286
troncata censurata OLS con zeri
Ols "Vero" OLS solo Osservati
Log L -257,1 -173,8 -206,3 -198,9 -116,4
AIC 520,2 353,6 418,5 403,8 238,9
Intercept -115,1 -72,9 54,3 13,7 101,9
Se 60,1 36,7 16,7 19,0 33,9
t -1,9 -2,0 3,3 0,7 3,0
sig(t) 0,0553 0,0468 0,0022 0,4765 0,0063
Reddito 0,06236 0,06004 0,05037 0,05343 0,04675
Se 0,00500 0,00452 0,00243 0,00277 0,00369
t 12,5 13,3 20,7 19,3 12,7
sig(t) <,0001 <,0001 <,0001 <,0001 <,0001
_Sigma 130,459 153,929 89,833 102,377 114,325
Esempio 2: Sportelli bancari = f(addetti)Dati effettivi, censura artificiale
0 5000 10000 15000 20000 25000
-200
0
200
400
600
800
1000
1200
1400
sportelli
Osservati
OLS vero
OLS con zeri
Troncati
censurati
Esempio 2: Sportelli bancari = f(addetti)Zoom sulla parte troncata/censurata
0 500 1000 1500 2000 2500 3000 3500 4000 4500 5000
-200
-100
0
100
200
300
400
spesa
Osservati
OLS vero
OLS con zeri
Troncati
censurati
0 200 400 600 800 1000 1200 1400
-200
0
200
400
600
800
1000
1200
1400
Osservati (censurati) -previsti
OLS vero
OLS con zeri
Troncati
censurati
equi
Osservati censurati
pre
vist
i
Zoom sulla censura
-1 -0.8 -0.6 -0.4 -0.2 0 0.2 0.4 0.6 0.8 1
-100
-80
-60
-40
-20
0
20
40
60
80
100
Osservati (censurati) -previsti
OLS vero
OLS con zeri
Troncati
censurati
Osservati censurati
pre
vist
i
0 200 400 600 800 1000 1200 1400
-200
0
200
400
600
800
1000
1200
1400
osservati (veri) - previsti
OLS vero
OLS con zeri
Troncati
censurati
equi
Osservati non censurati
Pre
vist
i
30 40 50 60 70 80 90 100
-100
-80
-60
-40
-20
0
20
40
60
80
100
osservati (veri) - previsti
OLS vero
OLS con zeri
Troncati
censurati
equi
Osservati non censurati
Pre
vist
i
residui
-600
-400
-200
0
200
400
600
0 5000 10000 15000 20000 25000
ols
ols-zeri
trunc
tobin
Eteroschedasticità
Problema, in generale risolto sostituendo nella MLE
Naturalmente è necessario specificare una “forma per l’eteroschedasticità
Ad esempio:
Non normalità stimatore robusto: LAD (Least Absolute Deviation) estimatorMolto complessoTest di chester e Irish (1987) sui residui generalizzati
Stima con dati panel = problema ancora aperto
Problema principale sono i processi “double hurdle” con doppia decisione
Sample selection models
22icon
222 exp ii w