il test del chi-quadrato prof.ssa montomoli - univ. di pavia prof.ssa zanolin – univ. di verona
TRANSCRIPT
![Page 1: Il test del Chi-quadrato Prof.ssa Montomoli - Univ. di Pavia Prof.ssa Zanolin – Univ. di Verona](https://reader036.vdocuments.net/reader036/viewer/2022062512/5542eb6b497959361e8d742e/html5/thumbnails/1.jpg)
Il test del Chi-quadrato
Prof.ssa Montomoli - Univ. di PaviaProf.ssa Zanolin – Univ. di Verona
![Page 2: Il test del Chi-quadrato Prof.ssa Montomoli - Univ. di Pavia Prof.ssa Zanolin – Univ. di Verona](https://reader036.vdocuments.net/reader036/viewer/2022062512/5542eb6b497959361e8d742e/html5/thumbnails/2.jpg)
Il rischio di contrarre epatite C è associato all’avere un tatuaggio?
Test d’ipotesi
Cosa vuol dire ASSOCIAZIONE tra due variabili?
![Page 3: Il test del Chi-quadrato Prof.ssa Montomoli - Univ. di Pavia Prof.ssa Zanolin – Univ. di Verona](https://reader036.vdocuments.net/reader036/viewer/2022062512/5542eb6b497959361e8d742e/html5/thumbnails/3.jpg)
Due variabili sono associate soltanto quando sono correlate tra loro in modo maggiore o minore di quanto si verifichi per
solo effetto del caso
I tatuaggi devono essere presenti con frequenza maggiore (o minore) nei soggetti con epatite C rispetto ai soggetti senza epatite
quindi è necessario studiare anche soggetti senza epatite (controlli)
poi confrontarli con i soggetti con epatite
… ed infine decidere se la differenza tra gruppi può essere dovuta al caso
CON UN TEST STATISTICO
![Page 4: Il test del Chi-quadrato Prof.ssa Montomoli - Univ. di Pavia Prof.ssa Zanolin – Univ. di Verona](https://reader036.vdocuments.net/reader036/viewer/2022062512/5542eb6b497959361e8d742e/html5/thumbnails/4.jpg)
Se è vero che il caso può influenzare i risultati, come posso dimostrare l'esistenza di associazioni ed essere
ragionevolmente sicuro che le differenze osservate non sono dovute al caso?
La statistica consente di escludere (con un certo grado di probabilità, ma mai con assoluta certezza) che una eventuale
associazione sia dovuta appunto al caso
![Page 5: Il test del Chi-quadrato Prof.ssa Montomoli - Univ. di Pavia Prof.ssa Zanolin – Univ. di Verona](https://reader036.vdocuments.net/reader036/viewer/2022062512/5542eb6b497959361e8d742e/html5/thumbnails/5.jpg)
![Page 6: Il test del Chi-quadrato Prof.ssa Montomoli - Univ. di Pavia Prof.ssa Zanolin – Univ. di Verona](https://reader036.vdocuments.net/reader036/viewer/2022062512/5542eb6b497959361e8d742e/html5/thumbnails/6.jpg)
Il rischio di contrarre epatite C è associato all’avere un tatuaggio?
I dati sono riassunti nella tabella di contingenza
Test d’ipotesi
Epatite C
Si No totale
Tatuaggio 25 88 113
No tatuaggio 22 491 513
totale 47 579 626
![Page 7: Il test del Chi-quadrato Prof.ssa Montomoli - Univ. di Pavia Prof.ssa Zanolin – Univ. di Verona](https://reader036.vdocuments.net/reader036/viewer/2022062512/5542eb6b497959361e8d742e/html5/thumbnails/7.jpg)
0
5
10
15
20
25
No tatuaggio Tatuaggio
Proporzione di soggetti con epatite
![Page 8: Il test del Chi-quadrato Prof.ssa Montomoli - Univ. di Pavia Prof.ssa Zanolin – Univ. di Verona](https://reader036.vdocuments.net/reader036/viewer/2022062512/5542eb6b497959361e8d742e/html5/thumbnails/8.jpg)
Test d’ipotesi
Supponi che, in realtà, NON esistano differenze nella frequenza di epatite tra i tatuati e i non tatuati.
Che probabilità c'è di osservare - in uno studio di dimensioni simili a questo - differenze nella frequenza di epatite diverse da quelle che hai
osservato?
La risposta a questa domanda dipende da quanto i dati ottenuti si discostano dai dati che
«sarebbe lecito attendersi se la frequenza di epatite C fosse influenzata soltanto dalla variazione casuale».
![Page 9: Il test del Chi-quadrato Prof.ssa Montomoli - Univ. di Pavia Prof.ssa Zanolin – Univ. di Verona](https://reader036.vdocuments.net/reader036/viewer/2022062512/5542eb6b497959361e8d742e/html5/thumbnails/9.jpg)
TEST D’INDIPENDENZA
Le due variabili (epatite e tatuaggio) sono indipendenti?
Questa è l’IPOTESI NULLA H0 da verificare
Se H0 è rifiutata: le due variabili
NON SONO INDIPENDENTI
Test d’ipotesi
![Page 10: Il test del Chi-quadrato Prof.ssa Montomoli - Univ. di Pavia Prof.ssa Zanolin – Univ. di Verona](https://reader036.vdocuments.net/reader036/viewer/2022062512/5542eb6b497959361e8d742e/html5/thumbnails/10.jpg)
1.Si distribuiscono i soggetti nelle celle della tabella
2.Si calcolano le frequenze attese sotto l’H0 che le due variabili siano indipendenti (per ogni cella della tabella)3.Si paragonano le frequenze attese e le frequenze osservate4.Si valuta la discrepanza fra frequenze ATTESE e OSSERVATE Come decidere se la discrepanza è piccola o
grande? tramite il TEST STATISTICO
Test d’ipotesi
![Page 11: Il test del Chi-quadrato Prof.ssa Montomoli - Univ. di Pavia Prof.ssa Zanolin – Univ. di Verona](https://reader036.vdocuments.net/reader036/viewer/2022062512/5542eb6b497959361e8d742e/html5/thumbnails/11.jpg)
P (epatite) =
P(epatite |tatuaggio) =
P(epatite |no tatoo) =
5.8626
47113
075.0626
47
Test d’ipotesi
5.38626
47513
Epatite C
Si No totale
Tatuaggio 113
No tatuaggio 513
totale 47 579 626
8.5
38.5
104.5
474.5
![Page 12: Il test del Chi-quadrato Prof.ssa Montomoli - Univ. di Pavia Prof.ssa Zanolin – Univ. di Verona](https://reader036.vdocuments.net/reader036/viewer/2022062512/5542eb6b497959361e8d742e/html5/thumbnails/12.jpg)
PRINCIPIO del PRODOTTOper eventi indipendenti
P(A e B) = P(A B) = P(A)P(B)
Indipendenza: due eventi si diconoindipendenti quando il verificarsidell’uno non influenza il verificarsidell’altro
es. elevati livelli di glicemia e ulcera,probabilità di pescare una pallina di undeterminato colore da un’urna conreimbussolamento
![Page 13: Il test del Chi-quadrato Prof.ssa Montomoli - Univ. di Pavia Prof.ssa Zanolin – Univ. di Verona](https://reader036.vdocuments.net/reader036/viewer/2022062512/5542eb6b497959361e8d742e/html5/thumbnails/13.jpg)
n11 ni1 nk1
n1j nij nkj
n1t nit nkt
1
.
.
j
.
t
1…………………i……………k
Y
X
k
iijj nn
1
.
Marginali di riga
t
jiji nn
1
.
k
i
t
jijnn
1 1
..Marginali di colonna
Nomenclatura di una tabella di contingenza(dot notation)
pi. viene stimato da ni./n..
p.j viene stimato da n.j/n..
![Page 14: Il test del Chi-quadrato Prof.ssa Montomoli - Univ. di Pavia Prof.ssa Zanolin – Univ. di Verona](https://reader036.vdocuments.net/reader036/viewer/2022062512/5542eb6b497959361e8d742e/html5/thumbnails/14.jpg)
Pij=Pi.·P.j
Sotto l’ipotesi di indipendenza la probabilità di una qualsiasi combinazione delle modalità delle due
variabili è data da:
Probabilità congiunta
Prodotto delle marginali
Eij=Pi.·P.j·N
Gli attesi nella cella ij-ma, sotto l’ipotesi di indipendenza, saranno quindi
Probabilità congiunta
Prodotto delle marginali
N° totale di soggetti
![Page 15: Il test del Chi-quadrato Prof.ssa Montomoli - Univ. di Pavia Prof.ssa Zanolin – Univ. di Verona](https://reader036.vdocuments.net/reader036/viewer/2022062512/5542eb6b497959361e8d742e/html5/thumbnails/15.jpg)
CALCOLO DEL TEST 2
N
i i
ii
E
EO
1
22 )(
frequenza attesafrequenza osservata
Test d’ipotesi
![Page 16: Il test del Chi-quadrato Prof.ssa Montomoli - Univ. di Pavia Prof.ssa Zanolin – Univ. di Verona](https://reader036.vdocuments.net/reader036/viewer/2022062512/5542eb6b497959361e8d742e/html5/thumbnails/16.jpg)
FREQUENZE ATTESE
FREQUENZE OSSERVATETest d’ipotesi
Epatite C
Si No totale
Tatuaggio 25 88 113
No tatuaggio 22 491 513
totale 47 579 626
Epatite C
Si No totale
Tatuaggio 8.5 104.5 113
No tatuaggio 38.5 474.5 513
totale 47 579 626
![Page 17: Il test del Chi-quadrato Prof.ssa Montomoli - Univ. di Pavia Prof.ssa Zanolin – Univ. di Verona](https://reader036.vdocuments.net/reader036/viewer/2022062512/5542eb6b497959361e8d742e/html5/thumbnails/17.jpg)
42.425.474
)5.474491(
5.104
)5.10488(
5.38
)5.3822(.
5.8
)5.825( 2222
2
Si calcola il test sostituendo le frequenze osservate ed attese nella formula del 2:
Test d’ipotesi
È evidente che il chi-quadrato aumenta con l'aumentare della differenza dei dati posti a raffronto.
Se esso supera certi valori prefissati la differenza viene ritenuta significativa; in caso contrario, non si può
affermare l'esistenza di una significativa differenza tra i due eventi considerati.
![Page 18: Il test del Chi-quadrato Prof.ssa Montomoli - Univ. di Pavia Prof.ssa Zanolin – Univ. di Verona](https://reader036.vdocuments.net/reader036/viewer/2022062512/5542eb6b497959361e8d742e/html5/thumbnails/18.jpg)
0 2 4 6 8 10 12 14chi-quadrato
den
sità
di
pro
bab
ilit
à
1 g.l.
2 g.l.
5 g.l.10 g.l.
15 g.l.
g.l. = gradi di libertà
La distribuzione di probabilità 2 dipende dal numero di gradi di libertà (g.l.)
il numero di gradi di libertà di una tabella e del 2 calcolato su di essa è
uguale a
(numero righe - 1) x (numero colonne -1)
![Page 19: Il test del Chi-quadrato Prof.ssa Montomoli - Univ. di Pavia Prof.ssa Zanolin – Univ. di Verona](https://reader036.vdocuments.net/reader036/viewer/2022062512/5542eb6b497959361e8d742e/html5/thumbnails/19.jpg)
![Page 20: Il test del Chi-quadrato Prof.ssa Montomoli - Univ. di Pavia Prof.ssa Zanolin – Univ. di Verona](https://reader036.vdocuments.net/reader036/viewer/2022062512/5542eb6b497959361e8d742e/html5/thumbnails/20.jpg)
0 1 2 3 4 5 6
chi-quadrato
den
sità
di p
rob
abili
tà
1 grado di libertà
regione di accettazione dell'ipotesi nulla regione di rifiuto
0,118
2 osservato > soglia critica42,42 3,84
Rifiuto H0
N.B. Il test del chi-quadrato è sempre a una coda.
![Page 21: Il test del Chi-quadrato Prof.ssa Montomoli - Univ. di Pavia Prof.ssa Zanolin – Univ. di Verona](https://reader036.vdocuments.net/reader036/viewer/2022062512/5542eb6b497959361e8d742e/html5/thumbnails/21.jpg)
Output di un programma statistico
Test d’ipotesi
| col row | 1 2 | Total-----------+----------------------+---------- 1 | 25 88 | 113 2 | 22 491 | 513 -----------+----------------------+---------- Total | 47 579 | 626
Pearson chi2(1) = 42.4189 Pr = 0.000
![Page 22: Il test del Chi-quadrato Prof.ssa Montomoli - Univ. di Pavia Prof.ssa Zanolin – Univ. di Verona](https://reader036.vdocuments.net/reader036/viewer/2022062512/5542eb6b497959361e8d742e/html5/thumbnails/22.jpg)
P < 0.00001
Rifiuto l’ipotesi nulla di indipendenza delle due variabili
CONCLUSIONI
i dati della tabella sono improbabili, se è vera l’ipotesi che epatite C e tatuaggi sono indipendenti
esiste una relazione tra epatite C e tatuaggi
Test d’ipotesi
![Page 23: Il test del Chi-quadrato Prof.ssa Montomoli - Univ. di Pavia Prof.ssa Zanolin – Univ. di Verona](https://reader036.vdocuments.net/reader036/viewer/2022062512/5542eb6b497959361e8d742e/html5/thumbnails/23.jpg)
Situazione reale
Conclusioni
Epatite e tatuaggi sono indipendenti
H0 VERA
Epatite e tatuaggi NON sono indipendenti
H0 FALSA
Epatite e tatuaggi sono indipendenti
RIFIUTO H0
aerrore di I tipo OK
Epatite e tatuaggi NON sono indipendenti
NON RIFIUTO H0 OK
berrore di II tipo
Test d’ipotesi
![Page 24: Il test del Chi-quadrato Prof.ssa Montomoli - Univ. di Pavia Prof.ssa Zanolin – Univ. di Verona](https://reader036.vdocuments.net/reader036/viewer/2022062512/5542eb6b497959361e8d742e/html5/thumbnails/24.jpg)
0 1
Ala Ala/CentroCentro GuardiaGuardia/Ala Play/Guardia
Playmaker
Graphs by straniero
italiani stranieri
Ruolo per nazionalità
Esiste una differente distribuzione del ruolo di gioco tra italiani e stranieri?
Test d’ipotesi
![Page 25: Il test del Chi-quadrato Prof.ssa Montomoli - Univ. di Pavia Prof.ssa Zanolin – Univ. di Verona](https://reader036.vdocuments.net/reader036/viewer/2022062512/5542eb6b497959361e8d742e/html5/thumbnails/25.jpg)
Ruolo per nazionalità | straniero ruolo | 0 1 | Total-------------+----------------------+---------- Ala | 37 29 | 66 Ala/Centro | 14 14 | 28 Centro | 15 16 | 31 Guardia | 21 17 | 38 Guardia/Ala | 4 6 | 10 Play/Guardia | 8 9 | 17 Playmaker | 34 13 | 47 -------------+----------------------+---------- Total | 133 104 | 237
Pearson chi2(6) = 7.8336 Pr = 0.251
Le due variabili (ruolo e nazionalità) sono indipendenti.
La distribuzione del ruolo non è diversa per nazionalità
Test d’ipotesi
![Page 26: Il test del Chi-quadrato Prof.ssa Montomoli - Univ. di Pavia Prof.ssa Zanolin – Univ. di Verona](https://reader036.vdocuments.net/reader036/viewer/2022062512/5542eb6b497959361e8d742e/html5/thumbnails/26.jpg)
Ipotesi: i giocatori stranieri vengono acquistatiper ricoprire il ruolo di centro
| straniero ruolo | 0 1 | Total-------------+----------------------+---------- Centro | 15 16 | 31 Playmaker | 34 13 | 47 -------------+----------------------+---------- Total | 49 29 | 78
Pearson chi2(1) = 4.5887 Pr = 0.032
Le due variabili (ruolo e nazionalità) non sono indipendenti.
Test d’ipotesi