10.14 precipitazioni - chi quadro

16
Le precipitazioni estreme Chi quadro Riccardo Rigon Kandinski -Composition VI (Il diluvio)- 1913

Upload: riccardo-rigon

Post on 18-Jul-2015

233 views

Category:

Education


3 download

TRANSCRIPT

Page 1: 10.14   precipitazioni - chi quadro

Le precipitazioni estreme Chi quadro

Riccardo Rigon

Kan

din

ski

-Com

posi

tion

VI

(Il

dil

uvi

o)-

19

13

Page 2: 10.14   precipitazioni - chi quadro

R. Rigon

Il �2

Se una variabile X è distribuita secondo un curva normale a media nulla e

varianza unitaria, allora la variabile

e’ distribuita secondo la distribuzione del “Chi quadrato” (come fu provato

da Ernst Abbe, 1840-1905) e si indica con

che è una distribuzione monoparametrica della famiglia della distribuzione

Gamma. L’unico parametro è chiamato “gradi di libertà”

!2

Ancora sul test di Pearson

Page 3: 10.14   precipitazioni - chi quadro

R. Rigon

La distribuzione, in effetti, è:

E la sua cumulata:

dove è la funzione “gamma” incompleta�()

Il �2

from Wikipedia

!3

Ancora sul test di Pearson

Page 4: 10.14   precipitazioni - chi quadro

R. Rigon

La funzione gamma incompleta

La funzione Gamma

4

Ancora sul test di Pearson

Page 5: 10.14   precipitazioni - chi quadro

R. Rigon

Il �2

from Wikipedia

!5

Ancora sul test di Pearson

Page 6: 10.14   precipitazioni - chi quadro

R. Rigon

Il valore atteso della distribuzione è pari al numero di gradi di libertà

Il �2

La varianza è pari a due volte il numero di gradi di libertà

E(�k) = k

V ar(�k) = 2k

from Wikipedia

!6

La moda è pari a

Ancora sul test di Pearson

Page 7: 10.14   precipitazioni - chi quadro

R. Rigon

In generale il è usato in statistica (dopo il lavoro di Pearson e Fisher) per

stimare la bontà di una inferenza, ed in particolare l’uguguglianza di una

distribuzione di dati con una distribuzione di riferimento (ipotesi zero). Il

test ha la forma generale

Il �2

�2

from Wikipedia

!7

Ancora sul test di Pearson

Page 8: 10.14   precipitazioni - chi quadro

R. Rigon

Il �2

Assumendo che la radice della variabile rappresentata nella sommatoria sia

distribuita gaussianamente, allora ci si aspetta che la variabile somma dei

quadrati sia distribuita secondo il con un grado di libertà pari al numero

di addendi diminuito di 1.

�2

from Wikipedia

!8

In altre parole, nell’ipotesi di ripetere un numero illimitato di volte

l’esperimento che ha prodotto i dati, ci si aspetta che la distribuzione

degli X2 , ottenuta dalla ripetizione dell’esperimento, sia un con

k-1 gradi di libertà.

Ancora sul test di Pearson

Page 9: 10.14   precipitazioni - chi quadro

R. Rigon

Ovvero

Se i dati riproducono perfettamente l’ipotesi,

Il valore atteso dell’errore però pari al numero di gradi di libertà, k.

Un certo numero di campioni “sfortunati” avrà un elevato

9

Ancora sul test di Pearson

Page 10: 10.14   precipitazioni - chi quadro

R. Rigon

Ovvero

Ci sono due modi per ottenere un valore elevato di X2:

•se i dati provengono dalla distribuzione ipotizzata, ma il campione è

relativamente raro

•se i dati NON sono rari MA provengono da un’altra distribuzione 10

Ancora sul test di Pearson

Page 11: 10.14   precipitazioni - chi quadro

R. Rigon

Il ha importanza perchè possiamo fare due ipotesi mutuamente esclusive. L’ipotesi zero:

Il �2

�2

from Wikipedia

E il suo contrario, l’ ipotesi alternativa:

che campione e popolazione abbiano la medesima distribuzione

che campione e popolazione NON abbiano la medesima distribuzione

!11

Ancora sul test di Pearson

Page 12: 10.14   precipitazioni - chi quadro

R. Rigon

Non c’è possibilità di distinguere un caso dall’altro

L’analisi statistica NON è in grado di distinguere il falso dal

vero con certezza

Però ci si può accordare che, per esempio, il nostro campione ha una

differenza dal campione di riferimento (misurata secondo Pearson),

ovvero un X2, che si rivela più di una volta su venti su possibili

ripetizioni dell’esperimento probabilistico (un periodo di ritorno di venti

tentativi) non possiamo rigettare (falsificare statisticamente) l’ipotesi che

i nostri dati provengano dalla distribuzione ipotizzata.

Dunque l’ipotesi zero si accetta e si rigetta l’ipotesi alternativa, con una

confidenza, nel caso descritto, di 1/20=0.05

12

Ancora sul test di Pearson

Page 13: 10.14   precipitazioni - chi quadro

R. Rigon

L’accettazione dell’ipotesi zero

E’ dunque legata ad una scelta soggettiva (il margine di confidenza), assegnato

secondo un criterio assunto come “ragionevole”.

Per questo si usa tradizionalmente la dizione: “non si può rigettare”, invece di “si

accetta”.

A ben vedere però, la questione di come si dice, non è veramente sostanziale.

Il criterio per quanto soggettivo è organizzato quantitativamente, e dà risultati

ripetibili.

13

Ancora sul test di Pearson

Page 14: 10.14   precipitazioni - chi quadro

R. Rigon

In pratica

Si assegna il grado di confidenza, c e si inverte la probabilità

ovvero:

14

Ancora sul test di Pearson

Page 15: 10.14   precipitazioni - chi quadro

R. Rigon

Se

Si rigetta l’ipotesi zero

Viceversa

si accetta (nel gergo statistico: non si può rigettare)

15

Ancora sul test di Pearson

Page 16: 10.14   precipitazioni - chi quadro

R. Rigon

Corollario

Avendo a disposizione più ipotesi zero valide

Si accetta

Quella con più piccolo

Che corrisponde ad eventi non rigettati (accettati!) con maggior grado di

confidenza.

16

Ancora sul test di Pearson