10.14 precipitazioni - chi quadro

Le precipitazioni estreme Chi quadro

Riccardo Rigon

Kan

din

ski

-Com

posi

tion

VI

(Il

dil

uvi

o)-

19

13

R. Rigon

Il �2

Se una variabile X è distribuita secondo un curva normale a media nulla e

varianza unitaria, allora la variabile

e’ distribuita secondo la distribuzione del “Chi quadrato” (come fu provato

da Ernst Abbe, 1840-1905) e si indica con

che è una distribuzione monoparametrica della famiglia della distribuzione

Gamma. L’unico parametro è chiamato “gradi di libertà”

!2

Ancora sul test di Pearson

R. Rigon

La distribuzione, in effetti, è:

E la sua cumulata:

dove è la funzione “gamma” incompleta�()

Il �2

from Wikipedia

!3


R. Rigon

La funzione gamma incompleta

La funzione Gamma

4


R. Rigon

Il �2

from Wikipedia

!5


R. Rigon

Il valore atteso della distribuzione è pari al numero di gradi di libertà

Il �2

La varianza è pari a due volte il numero di gradi di libertà

E(�k) = k

V ar(�k) = 2k

from Wikipedia

!6

La moda è pari a


R. Rigon

In generale il è usato in statistica (dopo il lavoro di Pearson e Fisher) per

stimare la bontà di una inferenza, ed in particolare l’uguguglianza di una

distribuzione di dati con una distribuzione di riferimento (ipotesi zero). Il

test ha la forma generale

Il �2

�2

from Wikipedia

!7


R. Rigon

Il �2

Assumendo che la radice della variabile rappresentata nella sommatoria sia

distribuita gaussianamente, allora ci si aspetta che la variabile somma dei

quadrati sia distribuita secondo il con un grado di libertà pari al numero

di addendi diminuito di 1.

�2

from Wikipedia

!8

In altre parole, nell’ipotesi di ripetere un numero illimitato di volte

l’esperimento che ha prodotto i dati, ci si aspetta che la distribuzione

degli X2 , ottenuta dalla ripetizione dell’esperimento, sia un con

k-1 gradi di libertà.


R. Rigon

Ovvero

Se i dati riproducono perfettamente l’ipotesi,

Il valore atteso dell’errore però pari al numero di gradi di libertà, k.

Un certo numero di campioni “sfortunati” avrà un elevato

9


R. Rigon

Ovvero

Ci sono due modi per ottenere un valore elevato di X2:

•se i dati provengono dalla distribuzione ipotizzata, ma il campione è

relativamente raro

•se i dati NON sono rari MA provengono da un’altra distribuzione 10


R. Rigon

Il ha importanza perchè possiamo fare due ipotesi mutuamente esclusive. L’ipotesi zero:

Il �2

�2

from Wikipedia

E il suo contrario, l’ ipotesi alternativa:

che campione e popolazione abbiano la medesima distribuzione

che campione e popolazione NON abbiano la medesima distribuzione

!11


R. Rigon

Non c’è possibilità di distinguere un caso dall’altro

L’analisi statistica NON è in grado di distinguere il falso dal

vero con certezza

Però ci si può accordare che, per esempio, il nostro campione ha una

differenza dal campione di riferimento (misurata secondo Pearson),

ovvero un X2, che si rivela più di una volta su venti su possibili

ripetizioni dell’esperimento probabilistico (un periodo di ritorno di venti

tentativi) non possiamo rigettare (falsificare statisticamente) l’ipotesi che

i nostri dati provengano dalla distribuzione ipotizzata.

Dunque l’ipotesi zero si accetta e si rigetta l’ipotesi alternativa, con una

confidenza, nel caso descritto, di 1/20=0.05

12


R. Rigon

L’accettazione dell’ipotesi zero

E’ dunque legata ad una scelta soggettiva (il margine di confidenza), assegnato

secondo un criterio assunto come “ragionevole”.

Per questo si usa tradizionalmente la dizione: “non si può rigettare”, invece di “si

accetta”.

A ben vedere però, la questione di come si dice, non è veramente sostanziale.

Il criterio per quanto soggettivo è organizzato quantitativamente, e dà risultati

ripetibili.

13


R. Rigon

In pratica

Si assegna il grado di confidenza, c e si inverte la probabilità

ovvero:

14


R. Rigon

Se

Si rigetta l’ipotesi zero

Viceversa

si accetta (nel gergo statistico: non si può rigettare)

15


R. Rigon

Corollario

Avendo a disposizione più ipotesi zero valide

Si accetta

Quella con più piccolo

Che corrisponde ad eventi non rigettati (accettati!) con maggior grado di

confidenza.

16


10.14 precipitazioni - chi quadro

Education