unanalisi empirica università degli studi dellinsubria - varese

Un’analisi empirica

Università degli Studi dell’Insubria - Varese

2

Obiettivo dell’analisi

• Ottenere una stima della probabilità di insolvenza di un gruppo di imprese

• Fornire uno strumento PRELIMINARE di valutazione per le banche della probabilità di insolvenza dei propri clienti

3

Fonte dei Dati

• Base Informativa Pubblica su cd-rom (BIPCDROM) della Banca d’Italia 2000

• Banca dati OECD presente all’Università degli Studi dell’Insubria di Varese

4

Organizzazione del lavoro

• Periodo di osservazione: 31/12/1985 -> 31/12/2000 = 16 tassi di insolvenza annuali

• Selezione delle variabili economiche congiunturali (fonte: OECD)

• Settori economici e selezione degli stessi

• Adattamento dei dati

5

Analisi effettuate

• Totalità dei settori economici e classi di grandezza

• Classi di grandezza del credito (3 classi)

• Selezione settori economici

• Previsione futura probabilità di default

6

Principali Strumenti Statistici

• Programma R -> sito www.r-project.org

• Modello di regressione lineare generalizzata -> Modello logistico

• Coefficiente di correlazione lineare (ρ)

• Coefficiente di determinazione (R²)

• Akaike Information Criterion (AIC)

• Distanza di Cook

http://www.r-project.org/

7

Variabili Esplicative

• Tasso di Disoccupazione (TU)

• Tasso di crescita dell’economia (GDP)

• Indice delle vendite del settore industriale e manifatturiero

8

GDP italia

600650700750800850900950

100010501100

anni

GDP italia

dLn GDP

-0,002-0,001

00,0010,0020,0030,0040,0050,0060,007

1984

1985

1986

1987

1988

1989

1990

1991

1992

1993

1994

1995

1996

1997

1998

1999

2000

Anni

dlng

dp

TASSO di DISOCCUPAZIONE

9

9,5

10

10,5

11

11,5

12

12,5

1984

1985

1986

1987

1988

1989

1990

1991

1992

1993

1994

1995

1996

1997

1998

1999

2000

2001

anni

tass

o di

socc

upaz

ione

dln Tasso disoccupazione

-0,06-0,05-0,04-0,03-0,02-0,01

00,010,020,030,040,05

1984

1985

1986

1987

1988

1989

1990

1991

1992

1993

1994

1995

1996

1997

1998

1999

2000

anni

dlnT

u

9

RELAZIONE % DEF. dln(Tasso di disoccupazione)

y = 16,459x + 11,169

R2 = 0,2785

8

9

10

11

12

13

-0,06 -0,04 -0,02 0 0,02 0,04 0,06

dln(Tasso di Disoccupazione)

%DE

F

RELAZIONE % DEF. DLOG(GDP)

y = -0,0164x + 5,4891

R2 = 0,244

1,500

2,000

2,500

3,000

3,500

4,000

4,500

-0,002 0 0,002 0,004 0,006 0,008

Dlog(GDP)

% D

EF

10

Totalità dei settori economiciAnno TU GDP Imp.default Imp.tot. Prob.default

1984 10,1 730,91985 10,1 752,6 6837 246528 1,8407%1986 11,1 771,6 8001 285563 2,0965%1987 12 794,7 8201 315997 2,3648%1988 12 826,1 7773 355486 2,7032%1989 12 849,8 8268 396220 3,9412%1990 11,4 866,6 9459 438955 3,0133%1991 10,9 878,6 11958 488948 3,2738%

11

Anno TU GDP Imp.default Imp.tot. Prob.default

1992 10,6 885,3 14379 523833 3,4405%1993 10,1 877,5 19261 559826 2,7450%1994 11,1 896,8 18718 571750 2,4457%1995 11,6 923,1 18044 598816 2,1549%1996 11,6 933,1 17485 443644 2,0867%1997 11,7 952,1 11442 423273 2,1866%1998 11,8 969,1 10387 439239 2,5953%1999 11,4 984,6 9642 459903 2,8018%2000 10,6 1012,8 9129 495961 2,7733%2001 9,5 1030,8

12

Output modello Logit con le variabili originarie (1° modello)

Variabili Coefficienti StimatiIntercetta -2.4343282β1 (gdp) -0.0004103β2 (tu) -0.0703755

Null deviance 8379.2 (15 gradi di libertà)Residual deviance 7878.7 (13 gradi di libertà)AIC 8062.8R ² 0,0597312I p-value calcolati da R sono tutti molto significativi : < 2e-16

13

Grafico output 1° modello

14

Output modello Logit con logaritmo delle variabili originarie

(2° modello)

Variabili Coefficienti stimati P-valueIntercetta 0.34552 0.125β1 (lngdp) -0.30177 <2e-16 ***β2 (lntu) -0.78074 <2e-16 ***

Null deviance 8379.2 (15 gradi di libertà)Residual deviance 7917.2 (13 gradi di libertà)AIC 8101.3R² 0,0551365Significato dei codici: 0 `***' 0.001 `**' 0.01 `*' 0.05 `.' 0.1 ` ' 1

15

Output modello Logit con il differenziale del logaritmo delle variabili originarie (3° modello)

Variabili Coefficienti StimatiIntercetta -3.327401β1 (dlngdp) -98.540313β2 (dlntu) 7.144825

Null deviance 8379.2 (15 gradi di libertà)Residual deviance 3038.3 (13 gradi di libertà)AIC 3222.4R² 0,6373998I p-value calcolati da R sono tutti molto significativi : < 2e-16

16

Grafico output 3° modello

17

Perché scelgo il terzo modello?

• P-value sono tutti significativi

• AIC è il più basso quindi il modello mi fornisce il maggior numero di informazioni

• R² é più elevato rispetto agli altri modelli

18

Miglioriamo il terzo modello:

Eliminando delle osservazioni anomale

Distanza di Cook

19

Distanza di Cook

dove: = valore previsto di quando l’i-esimo caso è

escluso dal modello; = i-esimo valore predetto dalla regressione;n = numero dei casi;p = numero di variabili presenti nel modello;s² = varianza stimata dei residui.

2

1

2

1

ˆˆ

sp

yy

C

n

jj

ij

i

ijy

jy

jy

20

Grafico distanza di Cook

21

Grafici a confronto

Prima Dopo

22

Output modello Logit con il differenziale del logaritmo delle variabili originarie

eliminando la dodicesima osservazione

Variabili Coefficienti StimatiIntercetta -3.383952β1 (dlngdp) -86.989920β2 (dlntu) 6.820930

Null deviance 5839.9 (15 gradi di libertà)Residual deviance 1586.9 (13 gradi di libertà)AIC 1759.4R² 0.72826589I p-value calcolati da R sono tutti molto significativi : < 2e-16

23

Classi di grandezza del credito

AIC R²

Crediti inferiori

a 250.000 €3.720,2 0,3799539

250.000 € < Crediti < 516.457 € 813,7 0,7301758

Crediti superiori

a 516.457 € 809,27 0,7316210

24

Grafico 2ª classe di grandezza

25

Settori

AIC R²

Prodotti tessili, cuoio, calzature, abbigliamento 361,96 0,3577312

Edilizia e opere pubbliche 1.069,1 0,4451295

Trasporti e comunicazioni 276,72 0,6464396

26

Aggiunta di una variabile esplicativa Settore dei prodotti tessili, cuoio, calzature e

abbigliamentoVariabili Coefficienti Stimati P-valueIntercetta -3.18458 <2e-16 ***β1 (dlngdp) -70.28282 <2e-16 ***β2 (dlntu) 0.93068 0.0454 *β3 (dlnindvendite) 2.30350 0.0431 *

Null deviance 342.38 (15 gradi di libertà)Residual deviance 215.82 (12 gradi di libertà)AIC 359.87 (prima 361.96)R² 0.3696478 (prima 0,3577312)

Significato dei codici: 0 `***' 0.001 `**' 0.01 `*' 0.05 `.' 0.1 ` ' 1

27

Previsione imprese insolventianno 2000

• Ci riferiamo al modello logit che usa il differenziale del logaritmo della variabili originarie escludendo l’ultimo anno di rilevazione

• Stimiamo il modello• Utilizziamo la funzione logistica • Sostituiamo all’interno della stessa i coefficienti stimati• Otteniamo la stima della probabilità di insolvenza• Moltiplichiamo tale valore per il numero di imprese nel 2000• Ottengo stima numero di imprese che dovrebbero risultare

insolventi nel 2000• Confronto con il numero reale osservato nel 2000• Conclusioni

28

Stima

Variabili Coefficienti Stimati

Intercetta -3.331390

β1 (dlngdp) -96.034925

β2 (dlntu) 6.899293

tudgdpd

tudgdpd

lnlnexp1

lnlnexp

321

321

29

0.01924412

0.0299-*6.89930.0041*96.0349-3.3314-exp1

0.0299-*6.89930.0041*96.0349-3.3314-exp

0.01924412*495961 = 9544

Non differisce eccessivamente dal risultato realmente ottenuto nel 2000 -

> 9129

Stima

30

Conclusioni

• Il modello applicato ha prodotto risultati molto soddisfacenti

• Ulteriori sviluppi del modello : utilizzo delle variabili esplicative di bilancio delle imprese

• Ulteriori affinamenti e verifiche qualità dei dati e trattamento delle variabili esplicative

unanalisi empirica università degli studi dellinsubria - varese

Documents