una “soluzione d’angolo” y1y1 y2y2 0 b di solito la scelta del consumatore è identificata dal...

Una “soluzione d’angolo”

y1

y2

0

B

Di solito la scelta del consumatore è identificata dal punto di tangenza tra

retta del bilancio e curva di indifferenza. Ma non

sempre. Nella figura, la tangenza sarebbe

nel punto B,in cui y2 < 0. Ma un consumo

negativoè impossibile.Il paniere preferito sulla

retta del bilancio è A,Una corner

solution

A

in cui y2 = 0.

Il modello di Regressione

2

'

'

i

ii

iii

yV

xyE

xy

Ricordando che:

TRONCAMENTO : E(x/x>a) = + (a) e V(x/x>a) = ²[1- (a)]

CENSURA:

)(1)(1)(

)()(1)()(22

cens

cens

yVar

ayE

ATTENZIONE notazione importantissima:

Finora abbiamo considerato distribuzioni con un punto di troncamento a che viene poi standardizzato sottraendo la media e dividendo per

Quando consideriamo i modelli di regressione

1. Il punto di troncamento rimane unico2. Lo scarto rimane unico

Ma….

3. Il valor medio cambia, infatti sappiamo che E(yi) = xi cioè è diverso per ciascun soggetto

QUINDI il punto (UNICO) di troncamento ha un valore standardizzato DIVERSO per ciascun individuo e quindi avremo:

iiii

i

ii

ii

xa

2

)(1

)('

Regressione troncata:

iii

iiii

i

iii

ayyV

xayyE

ay

xy

1/

'/

'

2

iiiicens

iiicensi

iii

ii

iii

yVar

xyE

ayseyy

aysey

xy

22

**

*

*

11

'

0

00

'

Regressione censurata: modello modello Tobin o Tobit (censura al punto 0)

Quindi OLS distorti e inconsistenti

Regressione troncata: verosimiglianza

Regressione censurata: verosimiglianza

i

i

iii

xa

xyL

'1ln

'1

)ln(2)2ln(2

1)ln( 2

2

0

0

2

2

'1ln

'1

)ln(2)2ln(2

1)ln(

i

i

y

i

yii

xa

xyL

Regressione troncata: effetto marginale:

Il fattore 1- (che deriva dalla varianza troncata) è compreso tra 0 e 1 quindi per ciascuna variabile l’effetto marginale è MINORE del corrispondente coefficiente, si verifica una sorta di ATTENUAZIONE dell’effetto

Questo avviene nella sottopopolazione NON troncata, naturalmente a volte siamo interessati a tutta la popolazione e quindi guarderemo semplicemente al coefficiente β che rappresenta l’effetto marginale nell’intera popolazione

ii

ii

i

i

x

ayy

x

y

1/

Un risultato utile: abbiamo visto che

Questo implica che: distorsione

La varianza contiene le x (incluse nei i) quindi è ETEROSCHEDASTICO

iii

iiii

i

iii

ayyV

xayyE

ay

xy

1/

'/

'

2

iiiii

i

iiiiiiii

V

ma

E

con

xayyEayy

11

0

'//

222

Alcune domande fondamentali:

• Quale variabile è di interesse (cosa vogliamoprevedere)?– y*? (I non censurati) Probabilmente NO – di solito non rilevante– y? (la distribuzione latente) Di solito SI, il valore per una unità

scelta a caso dalla popolazione– y | y>0? Forse. Dipende da ciò che ci interessa

• Qual’è il residuo?– (y – previsto)? Probabilmente no, come consideriamo

gli zeri?– (qualcosa - x) ? Probabilmente no. x Non è la media.

• Quindi quali sono gli effetti marginali e le medie condizionate alle x?

Regressione censurata: effetto marginale con censura a sx nel punto 0

Che può essere scomposta in due parti:

Si vede così che un cambiamento nelle x ha un DOPPIO effetto:1. Condiziona la media della parte NON censurata2. Modifica la prob. di essere censurati

ii

iii

i

i

ii

i

x

yxyE

x

x

xyE

x

xyEi

1)0;/(

')/(

)/( *

i

iii

i

ii

i

iiiiii

ii

ii

x

yprobxyE

x

xyEyob

x

xyE

)0()/(

)/()0(Pr

1

)/(

**

2

In altri termini l’effetto marginale non è costante, quindi la lettura dei coefficienti del modello NON è sufficiente.

L’effetto sulle Y di una variazione delle X DIPENDE dal valore delle X, quindi, ad esempio, è diversa per ogni individuo (perché ha un vettore di X diverso)

Se vogliamo una indicazione di sintesi rappresentiamo l’effetto delle X nel “punto medio” o per “l’individuo medio”.

Cioè sostituiamo nelle formule di calcolo

Se il modello ha più esplicativedue possibilità:1. valutazione effettuata nel punto medio per UN coefficiente, e

per un valore pari a 0 per le altre variabili2. Valutazione nei punti medi di tutte le variabili, questo ultimo

processo equivale a calcolare la media dei valori stimati individuali, modificando una sola variabile indipendente

Con lo stesso principio è possibile misurare l’effetto di modificazioni delle variabili per tipologie di unità .

xconxi ''

Lo stesso principio si utilizza per il calcolo dei valori previsti e dei residui:

Il metodo di calcolo dei valori previsti e quindi dei residui Poiché il modello precede una “mistura” il metodo deve simultaneamente rendere conto della parte censurata (Ripartizione) e della parte ossservata:

Naturalmente dipende dalla distribuzione ipotizzata a priori:

Per residui normali è:

In sostanza avremo un y=0 per coloro che date le x non superano la soglia stimata di censura

Esempio di stima:

modello per le ore lavorate da un campione di donne (USA)

Quester e Greene (1982)

Obiettivo: verificare se le le donne il cui matrimonio sta perdissolversi, tendono a passare più o meno ore al lavoro

Variabile MLEstima

EffettoMarginale

Punto medio

OLS OLS / % non censurati

Figlipiccoli

-824.19 -376.53 -352.63 -766.59

Titolostudio

22.59 10.32 11.47 24.93

Salario 286.39 130.93 123.95 269.46

Secondo matrimonio

25.33 11.57 13.14 28.57

Bassa prob.divorzio

481.02 219.75 219.22 476.57

Alta prob.divorzio

578.66 264.36 244.17 530.80

Esempio 2: Acquisto di carne = f(reddito)Dati artificiali, censura artificiale

addetti sportelli Osservati addetti sportelli Osservati777 37 0 1314 125 0636 43 0 1605 149 0458 46 0 2280 164 0605 46 0 2674 194 0581 48 0 3114 207 0604 49 0 2299 211 0577 55 0 3161 234 0603 55 0 3988 246 0775 56 0 5890 275 0660 56 0 4299 310 0698 61 0 4492 311 0764 62 0 4853 312 0630 68 0 3857 377 0702 72 0 2772 387 0659 79 0 5081 401 401

1120 81 0 6490 430 430789 81 0 14437 648 648

1312 88 0 7832 654 6541510 89 0 11179 672 672

479 89 0 19885 675 6751147 107 0 13905 810 8101305 121 0 21340 1181 1181

20612 1286 1286

troncata censurata OLS con zeri

Ols "Vero" OLS solo Osservati

Log L -257,1 -173,8 -206,3 -198,9 -116,4

AIC 520,2 353,6 418,5 403,8 238,9

Intercept -115,1 -72,9 54,3 13,7 101,9

Se 60,1 36,7 16,7 19,0 33,9

t -1,9 -2,0 3,3 0,7 3,0

sig(t) 0,0553 0,0468 0,0022 0,4765 0,0063

Reddito 0,06236 0,06004 0,05037 0,05343 0,04675

Se 0,00500 0,00452 0,00243 0,00277 0,00369

t 12,5 13,3 20,7 19,3 12,7

sig(t) <,0001 <,0001 <,0001 <,0001 <,0001

_Sigma 130,459 153,929 89,833 102,377 114,325

Esempio 2: Sportelli bancari = f(addetti)Dati effettivi, censura artificiale

0 5000 10000 15000 20000 25000

-200

0

200

400

600

800

1000

1200

1400

sportelli

Osservati

OLS vero

OLS con zeri

Troncati

censurati

Esempio 2: Sportelli bancari = f(addetti)Zoom sulla parte troncata/censurata

0 500 1000 1500 2000 2500 3000 3500 4000 4500 5000

-200

-100

0

100

200

300

400

spesa

Osservati

OLS vero

OLS con zeri

Troncati

censurati

0 200 400 600 800 1000 1200 1400

-200

0

200

400

600

800

1000

1200

1400

Osservati (censurati) -previsti

OLS vero

OLS con zeri

Troncati

censurati

equi

Osservati censurati

pre

vist

i

Zoom sulla censura

-1 -0.8 -0.6 -0.4 -0.2 0 0.2 0.4 0.6 0.8 1

-100

-80

-60

-40

-20

0

20

40

60

80

100

Osservati (censurati) -previsti

OLS vero

OLS con zeri

Troncati

censurati

Osservati censurati

pre

vist

i

0 200 400 600 800 1000 1200 1400

-200

0

200

400

600

800

1000

1200

1400

osservati (veri) - previsti

OLS vero

OLS con zeri

Troncati

censurati

equi

Osservati non censurati

Pre

vist

i

30 40 50 60 70 80 90 100

-100

-80

-60

-40

-20

0

20

40

60

80

100

osservati (veri) - previsti

OLS vero

OLS con zeri

Troncati

censurati

equi

Osservati non censurati

Pre

vist

i

residui

-600

-400

-200

0

200

400

600

0 5000 10000 15000 20000 25000

ols

ols-zeri

trunc

tobin

Eteroschedasticità

Problema, in generale risolto sostituendo nella MLE

Naturalmente è necessario specificare una “forma per l’eteroschedasticità

Ad esempio:

Non normalità stimatore robusto: LAD (Least Absolute Deviation) estimatorMolto complessoTest di chester e Irish (1987) sui residui generalizzati

Stima con dati panel = problema ancora aperto

Problema principale sono i processi “double hurdle” con doppia decisione

Sample selection models

22icon

222 exp ii w

una “soluzione d’angolo” y1y1 y2y2 0 b di solito la scelta del consumatore è identificata dal...

Documents