i nterpretazione dei fenomeni in ambito sanitario : dal campione alla popolazione e sercitazioni di...
TRANSCRIPT
![Page 1: I NTERPRETAZIONE DEI FENOMENI IN AMBITO SANITARIO : DAL CAMPIONE ALLA POPOLAZIONE E SERCITAZIONI DI I NFERENZA S TATISTICA Boscaro Gianni & Brugnaro Luca](https://reader035.vdocuments.net/reader035/viewer/2022062418/5542eb50497959361e8c01a4/html5/thumbnails/1.jpg)
INTERPRETAZIONE DEI FENOMENI IN AMBITO SANITARIO: DAL CAMPIONE ALLA
POPOLAZIONE
ESERCITAZIONI DI INFERENZA STATISTICA
Boscaro Gianni & Brugnaro Luca
![Page 2: I NTERPRETAZIONE DEI FENOMENI IN AMBITO SANITARIO : DAL CAMPIONE ALLA POPOLAZIONE E SERCITAZIONI DI I NFERENZA S TATISTICA Boscaro Gianni & Brugnaro Luca](https://reader035.vdocuments.net/reader035/viewer/2022062418/5542eb50497959361e8c01a4/html5/thumbnails/2.jpg)
FOCUS SULLA RELAZIONE: ESEMPI PRATICI
2
![Page 3: I NTERPRETAZIONE DEI FENOMENI IN AMBITO SANITARIO : DAL CAMPIONE ALLA POPOLAZIONE E SERCITAZIONI DI I NFERENZA S TATISTICA Boscaro Gianni & Brugnaro Luca](https://reader035.vdocuments.net/reader035/viewer/2022062418/5542eb50497959361e8c01a4/html5/thumbnails/3.jpg)
LA DISTRIBUZIONE NORMALE E IL TEST Z: IPOTESI INIZIALI indipendenza dei dati e identicamente distribuiti (iid), dipende dal disegno di studio ;
distribuzione normale dei dati (vedi test sulla normalità)
presenza solo di errori campionari (con distribuzione pari ad una normale con media 0 e deviazione std. pari )
assenza di errori sistematici deviazione standard della distribuzione nota pari a sigma
3
![Page 4: I NTERPRETAZIONE DEI FENOMENI IN AMBITO SANITARIO : DAL CAMPIONE ALLA POPOLAZIONE E SERCITAZIONI DI I NFERENZA S TATISTICA Boscaro Gianni & Brugnaro Luca](https://reader035.vdocuments.net/reader035/viewer/2022062418/5542eb50497959361e8c01a4/html5/thumbnails/4.jpg)
DISTRIBUZIONE NORMALE : ESEMPIO1
4
La differenza osservata tra le due medie è statisticamente significativa (alfa=0.01) ?
![Page 5: I NTERPRETAZIONE DEI FENOMENI IN AMBITO SANITARIO : DAL CAMPIONE ALLA POPOLAZIONE E SERCITAZIONI DI I NFERENZA S TATISTICA Boscaro Gianni & Brugnaro Luca](https://reader035.vdocuments.net/reader035/viewer/2022062418/5542eb50497959361e8c01a4/html5/thumbnails/5.jpg)
5
ESEMPIO 1: SISTEMA DI IPOTESI
![Page 6: I NTERPRETAZIONE DEI FENOMENI IN AMBITO SANITARIO : DAL CAMPIONE ALLA POPOLAZIONE E SERCITAZIONI DI I NFERENZA S TATISTICA Boscaro Gianni & Brugnaro Luca](https://reader035.vdocuments.net/reader035/viewer/2022062418/5542eb50497959361e8c01a4/html5/thumbnails/6.jpg)
ESEMPIO 1: RISOLUZIONE E CALCOLI
sotto H0
6Si respinge l’ipotesi nulla
![Page 7: I NTERPRETAZIONE DEI FENOMENI IN AMBITO SANITARIO : DAL CAMPIONE ALLA POPOLAZIONE E SERCITAZIONI DI I NFERENZA S TATISTICA Boscaro Gianni & Brugnaro Luca](https://reader035.vdocuments.net/reader035/viewer/2022062418/5542eb50497959361e8c01a4/html5/thumbnails/7.jpg)
SINTESI DELLA PROCEDURA DELINEATA
7
![Page 8: I NTERPRETAZIONE DEI FENOMENI IN AMBITO SANITARIO : DAL CAMPIONE ALLA POPOLAZIONE E SERCITAZIONI DI I NFERENZA S TATISTICA Boscaro Gianni & Brugnaro Luca](https://reader035.vdocuments.net/reader035/viewer/2022062418/5542eb50497959361e8c01a4/html5/thumbnails/8.jpg)
ESEMPIO 1 : CONCLUSIONE
Poiché il valore empirico di z = 3.85 > zc, con una probabilità dell'1% di commettere un errore di I tipo, si decide di respingere l'ipotesi nulla e di concludere che le donne del campione appartengono ad una popolazione con valori medi di glicemia diversi dalla popolazione presa in esame.
Per una stima intervallare della media della popolazione delle gravide padovane, considerando i dati del campione estratto, si procede:
8
![Page 9: I NTERPRETAZIONE DEI FENOMENI IN AMBITO SANITARIO : DAL CAMPIONE ALLA POPOLAZIONE E SERCITAZIONI DI I NFERENZA S TATISTICA Boscaro Gianni & Brugnaro Luca](https://reader035.vdocuments.net/reader035/viewer/2022062418/5542eb50497959361e8c01a4/html5/thumbnails/9.jpg)
ESEMPIO 1:STIMA INTERVALLARE
n=100 #numerosità del campione
> alfa=0.01
> p=1-alfa/2
> media_camp= 83.5
> z=qnorm(p)
> sigma=13.5 #se la varianza è conosciuta (requisito per il test)
> lim_inf=media_camp - z*sigma/sqrt(n)
> lim_sup= media_camp + z*sigma/sqrt(n)
> list(lim_inf,lim_sup)
[1] 80.02263 [2] 86.97737
Per calcolare la probabilità che si verifichi H0:
> pvalue= 2*pnorm(3.85,lower.tail=F) #ipotesi bilaterale
> pvalue
[1] 0.0001181178
9
![Page 10: I NTERPRETAZIONE DEI FENOMENI IN AMBITO SANITARIO : DAL CAMPIONE ALLA POPOLAZIONE E SERCITAZIONI DI I NFERENZA S TATISTICA Boscaro Gianni & Brugnaro Luca](https://reader035.vdocuments.net/reader035/viewer/2022062418/5542eb50497959361e8c01a4/html5/thumbnails/10.jpg)
o È simmetrica
o Per campioni elevati si approssima ad una normale standard
o Media centrata sullo zero
o La curva si modifica secondo i df
ESEMPIO 2 : IL T.TEST E LA DISTRIBUZIONE DI T DI STUDENT
10
![Page 11: I NTERPRETAZIONE DEI FENOMENI IN AMBITO SANITARIO : DAL CAMPIONE ALLA POPOLAZIONE E SERCITAZIONI DI I NFERENZA S TATISTICA Boscaro Gianni & Brugnaro Luca](https://reader035.vdocuments.net/reader035/viewer/2022062418/5542eb50497959361e8c01a4/html5/thumbnails/11.jpg)
STUDENT T TEST: IPOTESI INIZIALI
11
o indipendenza dei dati(dipende dal disegno di studio)
o distribuzione normale dei dati(vedi test sulla normalità)
o presenza di errori campionari o assenza di errori sistematicio deviazione standard della distribuzione della popolazione ignota . E’ nota la varianza campionaria corretta (s)
![Page 12: I NTERPRETAZIONE DEI FENOMENI IN AMBITO SANITARIO : DAL CAMPIONE ALLA POPOLAZIONE E SERCITAZIONI DI I NFERENZA S TATISTICA Boscaro Gianni & Brugnaro Luca](https://reader035.vdocuments.net/reader035/viewer/2022062418/5542eb50497959361e8c01a4/html5/thumbnails/12.jpg)
STUDENT T TEST
12
Calcolo del t osservato
Calcolo del t osservato utilizzando R
t.test(dati1, (dati2 = può non esserci), alternative = c("two.sided", "less", "greater"), mu = 0, paired = FALSE, var.equal = FALSE, conf.level = 0.95)
![Page 13: I NTERPRETAZIONE DEI FENOMENI IN AMBITO SANITARIO : DAL CAMPIONE ALLA POPOLAZIONE E SERCITAZIONI DI I NFERENZA S TATISTICA Boscaro Gianni & Brugnaro Luca](https://reader035.vdocuments.net/reader035/viewer/2022062418/5542eb50497959361e8c01a4/html5/thumbnails/13.jpg)
ESEMPIO 2 : MASCHI VS FEMMINE Immaginiamo di aver rilevato i voti degli assaggiatori di sesso diverso,
delle birre ottenute con un particolare tipo di malto. Si vuole verificare se il giudizio medio degli assaggiatori è pari a 6 ( la sufficienza) si ponga il livello di significatività pari al 5%, supponendo che la varianza della popolazione non sia nota.
Inoltre, il responsabile del marketing vuole verificare se il gradimento della birra non dipende dal sesso dell’assaggiatore. A tale scopo si rilevano i seguenti giudizi per indirizzare la campagna pubblicitaria.
13
# A S01 7 m02 8 m03 9 m04 8 f05 9 f06 7 f07 6 f08 7 m09 8 m10 5 m
Indicare un sistema di verifica di ipotesi nel quale la media del gradimento della birra tra gli uomini e maggiore rispetto alle donne
Domanda 1 Domanda 2
![Page 14: I NTERPRETAZIONE DEI FENOMENI IN AMBITO SANITARIO : DAL CAMPIONE ALLA POPOLAZIONE E SERCITAZIONI DI I NFERENZA S TATISTICA Boscaro Gianni & Brugnaro Luca](https://reader035.vdocuments.net/reader035/viewer/2022062418/5542eb50497959361e8c01a4/html5/thumbnails/14.jpg)
USO DELLE TAVOLE
il valore critico di t si trova all’incrocio tra la riga 10 e la colonna .025 (considerando i valori sotto l’etichetta «Ipotesi bidirezionale»), si ricorda che la distribuzione della t di Student è simmetrica, quindi i valori positivi e negativi per uno stesso livello di alfa coincidono nel modulo e sono solo differenti nel segno).
14
![Page 15: I NTERPRETAZIONE DEI FENOMENI IN AMBITO SANITARIO : DAL CAMPIONE ALLA POPOLAZIONE E SERCITAZIONI DI I NFERENZA S TATISTICA Boscaro Gianni & Brugnaro Luca](https://reader035.vdocuments.net/reader035/viewer/2022062418/5542eb50497959361e8c01a4/html5/thumbnails/15.jpg)
SVILUPPO E CALCOLI
Media campionaria = = 7,4
Varianza campionaria corretta= = 1,6
Statistica = 3,5
Dalle tavole Y~ t(9,0,025) = 2,262 ; Y~t(9,0,05)= 1,83
15
Commentare i risultati
![Page 16: I NTERPRETAZIONE DEI FENOMENI IN AMBITO SANITARIO : DAL CAMPIONE ALLA POPOLAZIONE E SERCITAZIONI DI I NFERENZA S TATISTICA Boscaro Gianni & Brugnaro Luca](https://reader035.vdocuments.net/reader035/viewer/2022062418/5542eb50497959361e8c01a4/html5/thumbnails/16.jpg)
CALCOLI E SINTASSI CON RCREARE UN DATASET
16
> S=factor(c("m","m","m","f","f","f","f","m","m","m"))> A=c(7,8,9,8,9,7,6,7,8,5)> birra2=data.frame(S,A)> birra2 S A1 m 72 m 83 m 94 f 85 f 96 f 77 f 68 m 79 m 810 m 5> boxplot(S,A)> boxplot(A~S)> t.test(A~S)
![Page 17: I NTERPRETAZIONE DEI FENOMENI IN AMBITO SANITARIO : DAL CAMPIONE ALLA POPOLAZIONE E SERCITAZIONI DI I NFERENZA S TATISTICA Boscaro Gianni & Brugnaro Luca](https://reader035.vdocuments.net/reader035/viewer/2022062418/5542eb50497959361e8c01a4/html5/thumbnails/17.jpg)
CALCOLI CON RDOMANDA 1: TEST AD UN CAMPIONE> t.test(A,mu=6,alternative="greater")
One Sample t-test
data: A
t = 3.5, df = 9, p-value = 0.003362
alternative hypothesis: true mean is greater than 6
95 percent confidence interval:
6.666755 Inf
sample estimates:
mean of x
7.4
sd=(sqrt(var(A)))
> x=mean(A)
> n=10
> mu=6
> toss=(x-mu)/(sd/sqrt(n))
> toss
[1] 3.517
![Page 18: I NTERPRETAZIONE DEI FENOMENI IN AMBITO SANITARIO : DAL CAMPIONE ALLA POPOLAZIONE E SERCITAZIONI DI I NFERENZA S TATISTICA Boscaro Gianni & Brugnaro Luca](https://reader035.vdocuments.net/reader035/viewer/2022062418/5542eb50497959361e8c01a4/html5/thumbnails/18.jpg)
CALCOLI CON RDOMANDA 2: TEST A DUE CAMPIONI Welch Two Sample t-test
data: A by s
t = 0.1954, df = 6.858, p-value = 0.8508
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
-1.859068 2.192401
sample estimates:
mean in group f mean in group m
7.500000 7.333333
shapiro.test(A)
Shapiro-Wilk normality test
W = 0.9297, p-value = 0.445318
f m
56
78
9
![Page 19: I NTERPRETAZIONE DEI FENOMENI IN AMBITO SANITARIO : DAL CAMPIONE ALLA POPOLAZIONE E SERCITAZIONI DI I NFERENZA S TATISTICA Boscaro Gianni & Brugnaro Luca](https://reader035.vdocuments.net/reader035/viewer/2022062418/5542eb50497959361e8c01a4/html5/thumbnails/19.jpg)
IN TERMINI PRATICI…
Le tavole forniscono i quantili Si trovano fissando i gradi di libertà e l’errore voluto
Si utilizza con un campione ridotto e conoscendo solo la varianza campionaria S²
19
![Page 20: I NTERPRETAZIONE DEI FENOMENI IN AMBITO SANITARIO : DAL CAMPIONE ALLA POPOLAZIONE E SERCITAZIONI DI I NFERENZA S TATISTICA Boscaro Gianni & Brugnaro Luca](https://reader035.vdocuments.net/reader035/viewer/2022062418/5542eb50497959361e8c01a4/html5/thumbnails/20.jpg)
ESEMPIO 3 : IL CHISQ.TEST E LA DISTRIBUZIONE CHI-QUADRO DI PEARSON
chisq.test permette di verificare se vi è indipendenza tra la variabile identificata sulle righe e quella sulle colonne di una tabella di contingenza (num_righe*num_colonne).
I gradi di libertà del test sono pari a
(num_righe –1)*(num_colonne -1).
Il test richiede l’indipendenza dei dati ma nessuna particolarità sul tipo di distribuzione dei dati.
In R: chisq.test(x)
Dove x è una tabella di contingenza (le distribuzioni congiunte delle due variabili)
20
![Page 21: I NTERPRETAZIONE DEI FENOMENI IN AMBITO SANITARIO : DAL CAMPIONE ALLA POPOLAZIONE E SERCITAZIONI DI I NFERENZA S TATISTICA Boscaro Gianni & Brugnaro Luca](https://reader035.vdocuments.net/reader035/viewer/2022062418/5542eb50497959361e8c01a4/html5/thumbnails/21.jpg)
Χ² DI PEARSON
21
![Page 22: I NTERPRETAZIONE DEI FENOMENI IN AMBITO SANITARIO : DAL CAMPIONE ALLA POPOLAZIONE E SERCITAZIONI DI I NFERENZA S TATISTICA Boscaro Gianni & Brugnaro Luca](https://reader035.vdocuments.net/reader035/viewer/2022062418/5542eb50497959361e8c01a4/html5/thumbnails/22.jpg)
ESEMPIO 3: LA SCOPERTA DEL SECOLOSi ipotizza che l’assunzione regolare di vitamina C possa ridurre il rischio di contrarre l’influenza. Per un anno, regolarmente a un gruppo di individui di un campione randomizzato a triplo cieco viene somministrata la Vitamina C e alla parte restante un Placebo.
I soggetti vengono dunque seguiti per un anno e alla fine si chiede a ciascuno se hanno contratto l’influenza
(modalità = si o no ).
Si riportano nella tabella "esperimento" i dati aggregati.
22
esperimento=matrix(c(116,24,115,24),nr=2,dimnames=list(influenza=c("si","no"),trattamento=c("si","no")))> esperimento influenza
trattamento
placebo vit C tot
NO 116 115 231
SI 24 24 48
tot 140 139 279
![Page 23: I NTERPRETAZIONE DEI FENOMENI IN AMBITO SANITARIO : DAL CAMPIONE ALLA POPOLAZIONE E SERCITAZIONI DI I NFERENZA S TATISTICA Boscaro Gianni & Brugnaro Luca](https://reader035.vdocuments.net/reader035/viewer/2022062418/5542eb50497959361e8c01a4/html5/thumbnails/23.jpg)
COME PROCEDERE Costruire il sistema di ipotesi concettuale Tabella frequenze attese Calcolo del χ² di Pearson Confronto con il valore critico conclusione
23
![Page 24: I NTERPRETAZIONE DEI FENOMENI IN AMBITO SANITARIO : DAL CAMPIONE ALLA POPOLAZIONE E SERCITAZIONI DI I NFERENZA S TATISTICA Boscaro Gianni & Brugnaro Luca](https://reader035.vdocuments.net/reader035/viewer/2022062418/5542eb50497959361e8c01a4/html5/thumbnails/24.jpg)
COSTRUIRE IL SISTEMA DI IPOTESI
l’ipotesi H0 :le variabili sono indipendenti
l’ipotesi H1 : vi è qualche forma di relazione tra le variabili
24
l’assunzione regolare di vitamina C può ridurre il rischio di contrarre l’influenza ?
![Page 25: I NTERPRETAZIONE DEI FENOMENI IN AMBITO SANITARIO : DAL CAMPIONE ALLA POPOLAZIONE E SERCITAZIONI DI I NFERENZA S TATISTICA Boscaro Gianni & Brugnaro Luca](https://reader035.vdocuments.net/reader035/viewer/2022062418/5542eb50497959361e8c01a4/html5/thumbnails/25.jpg)
gradi di libertà (n-1)(c-1)
il ricercatore ha fissato un valore di alfa pari a .05 formulando un’ipotesi
Abbiamo quindi un sistema di ipotesi dove:H0 : indipendenza stocastica H1: relazione tra le variabili
25
![Page 26: I NTERPRETAZIONE DEI FENOMENI IN AMBITO SANITARIO : DAL CAMPIONE ALLA POPOLAZIONE E SERCITAZIONI DI I NFERENZA S TATISTICA Boscaro Gianni & Brugnaro Luca](https://reader035.vdocuments.net/reader035/viewer/2022062418/5542eb50497959361e8c01a4/html5/thumbnails/26.jpg)
TABELLA DELLE FREQUENZE «ATTESE»
Le frequenze attese sono quei valori che ci aspetteremo nella ipotesi della indipendenza «Stocastica».
26
= 0,0007446
influenzatrattamento
placebo vit C tot
NO 116 115 231
SI 24 24 48
tot 140 139 279
influenzatrattamento
placebo vit C tot
NO 115,914 115,086 231
SI 24,08602 23,91398 48
tot 140 139 279
![Page 27: I NTERPRETAZIONE DEI FENOMENI IN AMBITO SANITARIO : DAL CAMPIONE ALLA POPOLAZIONE E SERCITAZIONI DI I NFERENZA S TATISTICA Boscaro Gianni & Brugnaro Luca](https://reader035.vdocuments.net/reader035/viewer/2022062418/5542eb50497959361e8c01a4/html5/thumbnails/27.jpg)
…….ANCORA CALCOLI chisq.test(esperimento)$expected
trattamento
influenza si no
si 115.91398 115.08602
no 24.08602 23.91398
> chisq.test(esperimento)
Pearson's Chi-squared test with Yates' continuity correction
data: esperimento
X-squared = 0, df = 1, p-value = 1
> chisq.test(esperimento,correct=F)
Pearson's Chi-squared test
data: esperimento
X-squared = 7e-04, df = 1, p-value = 0.9782
27
![Page 28: I NTERPRETAZIONE DEI FENOMENI IN AMBITO SANITARIO : DAL CAMPIONE ALLA POPOLAZIONE E SERCITAZIONI DI I NFERENZA S TATISTICA Boscaro Gianni & Brugnaro Luca](https://reader035.vdocuments.net/reader035/viewer/2022062418/5542eb50497959361e8c01a4/html5/thumbnails/28.jpg)
CONCLUSIONI
fissato un alfa (usualmente 0.05) verifico il p-value rispetto a questo alfa se p-value >= alfa: accetto l’ipotesi H0 (le variabili sono indipendenti)
se p-value < alfa: accetto l’ipotesi H1 (vi è qualche forma di relazione tra le variabili)
28
Quali conclusioni possiamo trarre dai risultati ottenuti ?
![Page 29: I NTERPRETAZIONE DEI FENOMENI IN AMBITO SANITARIO : DAL CAMPIONE ALLA POPOLAZIONE E SERCITAZIONI DI I NFERENZA S TATISTICA Boscaro Gianni & Brugnaro Luca](https://reader035.vdocuments.net/reader035/viewer/2022062418/5542eb50497959361e8c01a4/html5/thumbnails/29.jpg)
Grazie per l’attenzione
29