10.14 precipitazioni - chi quadro
TRANSCRIPT
Le precipitazioni estreme Chi quadro
Riccardo Rigon
Kan
din
ski
-Com
posi
tion
VI
(Il
dil
uvi
o)-
19
13
R. Rigon
Il �2
Se una variabile X è distribuita secondo un curva normale a media nulla e
varianza unitaria, allora la variabile
e’ distribuita secondo la distribuzione del “Chi quadrato” (come fu provato
da Ernst Abbe, 1840-1905) e si indica con
che è una distribuzione monoparametrica della famiglia della distribuzione
Gamma. L’unico parametro è chiamato “gradi di libertà”
!2
Ancora sul test di Pearson
R. Rigon
La distribuzione, in effetti, è:
E la sua cumulata:
dove è la funzione “gamma” incompleta�()
Il �2
from Wikipedia
!3
Ancora sul test di Pearson
R. Rigon
La funzione gamma incompleta
La funzione Gamma
4
Ancora sul test di Pearson
R. Rigon
Il �2
from Wikipedia
!5
Ancora sul test di Pearson
R. Rigon
Il valore atteso della distribuzione è pari al numero di gradi di libertà
Il �2
La varianza è pari a due volte il numero di gradi di libertà
E(�k) = k
V ar(�k) = 2k
from Wikipedia
!6
La moda è pari a
Ancora sul test di Pearson
R. Rigon
In generale il è usato in statistica (dopo il lavoro di Pearson e Fisher) per
stimare la bontà di una inferenza, ed in particolare l’uguguglianza di una
distribuzione di dati con una distribuzione di riferimento (ipotesi zero). Il
test ha la forma generale
Il �2
�2
from Wikipedia
!7
Ancora sul test di Pearson
R. Rigon
Il �2
Assumendo che la radice della variabile rappresentata nella sommatoria sia
distribuita gaussianamente, allora ci si aspetta che la variabile somma dei
quadrati sia distribuita secondo il con un grado di libertà pari al numero
di addendi diminuito di 1.
�2
from Wikipedia
!8
In altre parole, nell’ipotesi di ripetere un numero illimitato di volte
l’esperimento che ha prodotto i dati, ci si aspetta che la distribuzione
degli X2 , ottenuta dalla ripetizione dell’esperimento, sia un con
k-1 gradi di libertà.
Ancora sul test di Pearson
R. Rigon
Ovvero
Se i dati riproducono perfettamente l’ipotesi,
Il valore atteso dell’errore però pari al numero di gradi di libertà, k.
Un certo numero di campioni “sfortunati” avrà un elevato
9
Ancora sul test di Pearson
R. Rigon
Ovvero
Ci sono due modi per ottenere un valore elevato di X2:
•se i dati provengono dalla distribuzione ipotizzata, ma il campione è
relativamente raro
•se i dati NON sono rari MA provengono da un’altra distribuzione 10
Ancora sul test di Pearson
R. Rigon
Il ha importanza perchè possiamo fare due ipotesi mutuamente esclusive. L’ipotesi zero:
Il �2
�2
from Wikipedia
E il suo contrario, l’ ipotesi alternativa:
che campione e popolazione abbiano la medesima distribuzione
che campione e popolazione NON abbiano la medesima distribuzione
!11
Ancora sul test di Pearson
R. Rigon
Non c’è possibilità di distinguere un caso dall’altro
L’analisi statistica NON è in grado di distinguere il falso dal
vero con certezza
Però ci si può accordare che, per esempio, il nostro campione ha una
differenza dal campione di riferimento (misurata secondo Pearson),
ovvero un X2, che si rivela più di una volta su venti su possibili
ripetizioni dell’esperimento probabilistico (un periodo di ritorno di venti
tentativi) non possiamo rigettare (falsificare statisticamente) l’ipotesi che
i nostri dati provengano dalla distribuzione ipotizzata.
Dunque l’ipotesi zero si accetta e si rigetta l’ipotesi alternativa, con una
confidenza, nel caso descritto, di 1/20=0.05
12
Ancora sul test di Pearson
R. Rigon
L’accettazione dell’ipotesi zero
E’ dunque legata ad una scelta soggettiva (il margine di confidenza), assegnato
secondo un criterio assunto come “ragionevole”.
Per questo si usa tradizionalmente la dizione: “non si può rigettare”, invece di “si
accetta”.
A ben vedere però, la questione di come si dice, non è veramente sostanziale.
Il criterio per quanto soggettivo è organizzato quantitativamente, e dà risultati
ripetibili.
13
Ancora sul test di Pearson
R. Rigon
In pratica
Si assegna il grado di confidenza, c e si inverte la probabilità
ovvero:
14
Ancora sul test di Pearson
R. Rigon
Se
Si rigetta l’ipotesi zero
Viceversa
si accetta (nel gergo statistico: non si può rigettare)
15
Ancora sul test di Pearson
R. Rigon
Corollario
Avendo a disposizione più ipotesi zero valide
Si accetta
Quella con più piccolo
Che corrisponde ad eventi non rigettati (accettati!) con maggior grado di
confidenza.
16
Ancora sul test di Pearson