unanalisi empirica università degli studi dellinsubria - varese
TRANSCRIPT
Un’analisi empirica
Università degli Studi dell’Insubria - Varese
2
Obiettivo dell’analisi
• Ottenere una stima della probabilità di insolvenza di un gruppo di imprese
• Fornire uno strumento PRELIMINARE di valutazione per le banche della probabilità di insolvenza dei propri clienti
3
Fonte dei Dati
• Base Informativa Pubblica su cd-rom (BIPCDROM) della Banca d’Italia 2000
• Banca dati OECD presente all’Università degli Studi dell’Insubria di Varese
4
Organizzazione del lavoro
• Periodo di osservazione: 31/12/1985 -> 31/12/2000 = 16 tassi di insolvenza annuali
• Selezione delle variabili economiche congiunturali (fonte: OECD)
• Settori economici e selezione degli stessi
• Adattamento dei dati
5
Analisi effettuate
• Totalità dei settori economici e classi di grandezza
• Classi di grandezza del credito (3 classi)
• Selezione settori economici
• Previsione futura probabilità di default
6
Principali Strumenti Statistici
• Programma R -> sito www.r-project.org
• Modello di regressione lineare generalizzata -> Modello logistico
• Coefficiente di correlazione lineare (ρ)
• Coefficiente di determinazione (R²)
• Akaike Information Criterion (AIC)
• Distanza di Cook
7
Variabili Esplicative
• Tasso di Disoccupazione (TU)
• Tasso di crescita dell’economia (GDP)
• Indice delle vendite del settore industriale e manifatturiero
8
GDP italia
600650700750800850900950
100010501100
anni
GDP italia
dLn GDP
-0,002-0,001
00,0010,0020,0030,0040,0050,0060,007
1984
1985
1986
1987
1988
1989
1990
1991
1992
1993
1994
1995
1996
1997
1998
1999
2000
Anni
dlng
dp
TASSO di DISOCCUPAZIONE
9
9,5
10
10,5
11
11,5
12
12,5
1984
1985
1986
1987
1988
1989
1990
1991
1992
1993
1994
1995
1996
1997
1998
1999
2000
2001
anni
tass
o di
socc
upaz
ione
dln Tasso disoccupazione
-0,06-0,05-0,04-0,03-0,02-0,01
00,010,020,030,040,05
1984
1985
1986
1987
1988
1989
1990
1991
1992
1993
1994
1995
1996
1997
1998
1999
2000
anni
dlnT
u
9
RELAZIONE % DEF. dln(Tasso di disoccupazione)
y = 16,459x + 11,169
R2 = 0,2785
8
9
10
11
12
13
-0,06 -0,04 -0,02 0 0,02 0,04 0,06
dln(Tasso di Disoccupazione)
%DE
F
RELAZIONE % DEF. DLOG(GDP)
y = -0,0164x + 5,4891
R2 = 0,244
1,500
2,000
2,500
3,000
3,500
4,000
4,500
-0,002 0 0,002 0,004 0,006 0,008
Dlog(GDP)
% D
EF
10
Totalità dei settori economiciAnno TU GDP Imp.default Imp.tot. Prob.default
1984 10,1 730,91985 10,1 752,6 6837 246528 1,8407%1986 11,1 771,6 8001 285563 2,0965%1987 12 794,7 8201 315997 2,3648%1988 12 826,1 7773 355486 2,7032%1989 12 849,8 8268 396220 3,9412%1990 11,4 866,6 9459 438955 3,0133%1991 10,9 878,6 11958 488948 3,2738%
11
Anno TU GDP Imp.default Imp.tot. Prob.default
1992 10,6 885,3 14379 523833 3,4405%1993 10,1 877,5 19261 559826 2,7450%1994 11,1 896,8 18718 571750 2,4457%1995 11,6 923,1 18044 598816 2,1549%1996 11,6 933,1 17485 443644 2,0867%1997 11,7 952,1 11442 423273 2,1866%1998 11,8 969,1 10387 439239 2,5953%1999 11,4 984,6 9642 459903 2,8018%2000 10,6 1012,8 9129 495961 2,7733%2001 9,5 1030,8
12
Output modello Logit con le variabili originarie (1° modello)
Variabili Coefficienti StimatiIntercetta -2.4343282β1 (gdp) -0.0004103β2 (tu) -0.0703755
Null deviance 8379.2 (15 gradi di libertà)Residual deviance 7878.7 (13 gradi di libertà)AIC 8062.8R ² 0,0597312I p-value calcolati da R sono tutti molto significativi : < 2e-16
13
Grafico output 1° modello
14
Output modello Logit con logaritmo delle variabili originarie
(2° modello)
Variabili Coefficienti stimati P-valueIntercetta 0.34552 0.125β1 (lngdp) -0.30177 <2e-16 ***β2 (lntu) -0.78074 <2e-16 ***
Null deviance 8379.2 (15 gradi di libertà)Residual deviance 7917.2 (13 gradi di libertà)AIC 8101.3R² 0,0551365Significato dei codici: 0 `***' 0.001 `**' 0.01 `*' 0.05 `.' 0.1 ` ' 1
15
Output modello Logit con il differenziale del logaritmo delle variabili originarie (3° modello)
Variabili Coefficienti StimatiIntercetta -3.327401β1 (dlngdp) -98.540313β2 (dlntu) 7.144825
Null deviance 8379.2 (15 gradi di libertà)Residual deviance 3038.3 (13 gradi di libertà)AIC 3222.4R² 0,6373998I p-value calcolati da R sono tutti molto significativi : < 2e-16
16
Grafico output 3° modello
17
Perché scelgo il terzo modello?
• P-value sono tutti significativi
• AIC è il più basso quindi il modello mi fornisce il maggior numero di informazioni
• R² é più elevato rispetto agli altri modelli
18
Miglioriamo il terzo modello:
Eliminando delle osservazioni anomale
Distanza di Cook
19
Distanza di Cook
dove: = valore previsto di quando l’i-esimo caso è
escluso dal modello; = i-esimo valore predetto dalla regressione;n = numero dei casi;p = numero di variabili presenti nel modello;s² = varianza stimata dei residui.
2
1
2
1
ˆˆ
sp
yy
C
n
jj
ij
i
ijy
jy
jy
20
Grafico distanza di Cook
21
Grafici a confronto
Prima Dopo
22
Output modello Logit con il differenziale del logaritmo delle variabili originarie
eliminando la dodicesima osservazione
Variabili Coefficienti StimatiIntercetta -3.383952β1 (dlngdp) -86.989920β2 (dlntu) 6.820930
Null deviance 5839.9 (15 gradi di libertà)Residual deviance 1586.9 (13 gradi di libertà)AIC 1759.4R² 0.72826589I p-value calcolati da R sono tutti molto significativi : < 2e-16
23
Classi di grandezza del credito
AIC R²
Crediti inferiori
a 250.000 €3.720,2 0,3799539
250.000 € < Crediti < 516.457 € 813,7 0,7301758
Crediti superiori
a 516.457 € 809,27 0,7316210
24
Grafico 2ª classe di grandezza
25
Settori
AIC R²
Prodotti tessili, cuoio, calzature, abbigliamento 361,96 0,3577312
Edilizia e opere pubbliche 1.069,1 0,4451295
Trasporti e comunicazioni 276,72 0,6464396
26
Aggiunta di una variabile esplicativa Settore dei prodotti tessili, cuoio, calzature e
abbigliamentoVariabili Coefficienti Stimati P-valueIntercetta -3.18458 <2e-16 ***β1 (dlngdp) -70.28282 <2e-16 ***β2 (dlntu) 0.93068 0.0454 *β3 (dlnindvendite) 2.30350 0.0431 *
Null deviance 342.38 (15 gradi di libertà)Residual deviance 215.82 (12 gradi di libertà)AIC 359.87 (prima 361.96)R² 0.3696478 (prima 0,3577312)
Significato dei codici: 0 `***' 0.001 `**' 0.01 `*' 0.05 `.' 0.1 ` ' 1
27
Previsione imprese insolventianno 2000
• Ci riferiamo al modello logit che usa il differenziale del logaritmo della variabili originarie escludendo l’ultimo anno di rilevazione
• Stimiamo il modello• Utilizziamo la funzione logistica • Sostituiamo all’interno della stessa i coefficienti stimati• Otteniamo la stima della probabilità di insolvenza• Moltiplichiamo tale valore per il numero di imprese nel 2000• Ottengo stima numero di imprese che dovrebbero risultare
insolventi nel 2000• Confronto con il numero reale osservato nel 2000• Conclusioni
28
Stima
Variabili Coefficienti Stimati
Intercetta -3.331390
β1 (dlngdp) -96.034925
β2 (dlntu) 6.899293
tudgdpd
tudgdpd
lnlnexp1
lnlnexp
321
321
29
0.01924412
0.0299-*6.89930.0041*96.0349-3.3314-exp1
0.0299-*6.89930.0041*96.0349-3.3314-exp
0.01924412*495961 = 9544
Non differisce eccessivamente dal risultato realmente ottenuto nel 2000 -
> 9129
Stima
30
Conclusioni
• Il modello applicato ha prodotto risultati molto soddisfacenti
• Ulteriori sviluppi del modello : utilizzo delle variabili esplicative di bilancio delle imprese
• Ulteriori affinamenti e verifiche qualità dei dati e trattamento delle variabili esplicative