1 unità 7 test parametrici test t di student analisi della varianza ad una via confronti multipli

41
1 Unità 7 Test parametrici Test t di Student Analisi della varianza ad una via Confronti multipli

Upload: alvise-di-carlo

Post on 02-May-2015

227 views

Category:

Documents


2 download

TRANSCRIPT

Page 1: 1 Unità 7 Test parametrici Test t di Student Analisi della varianza ad una via Confronti multipli

1

Unità 7

Test parametrici

☐☐ Test t di Student

☐☐ Analisi della varianza ad una via

☐☐ Confronti multipli

Page 2: 1 Unità 7 Test parametrici Test t di Student Analisi della varianza ad una via Confronti multipli

2

TEST t DI STUDENT

In medicina capita spesso di volere confrontare i valori di una variabile casuale continua misurati su due campioni non molto numerosi.

Esempio:

si vogliono confrontare i valori di colesterolo su un gruppo di individui prima e dopo una particolare dieta;

si vogliono confrontare due terapie diverse a partire da due campioni.

In questi casi viene spesso impiegato (anche erroneamenteanche erroneamente) il test test tt di Student di Student.

Esso è di fatto è il più classico (ed abusato) test di tipo parametrico.

Page 3: 1 Unità 7 Test parametrici Test t di Student Analisi della varianza ad una via Confronti multipli

3

Il test t di Student si può impiegare per confrontare le medie di due campioni, quando si può si può in primo in primo luogoluogo supporre che la variabile casuale che si supporre che la variabile casuale che si vorrà analizzare sia distribuita in maniera vorrà analizzare sia distribuita in maniera gaussianagaussiana.

In particolare il test segue procedimenti di calcolo differenti a seconda che si analizzino due campioni di dati appaiati (ad esempio rilevazioni ante-post) o due campioni di dati indipendenti e quindi anche di diversa numerosità.

Page 4: 1 Unità 7 Test parametrici Test t di Student Analisi della varianza ad una via Confronti multipli

4

Test t di Student per dati appaiati

Si ipotizzi che x1, x2, …., xn siano le osservazioni del gruppo 1 e che y1, y2, …., yn siano le corrispondenti osservazioni nel gruppo 2, di modo che ciascuna osservazione xi sia appaiata alla corrispondente osservazione yi. (Esempio stesso campione prima e dopo la terapia).

Si calcolino le differenze di = xi – yi con i = 1,2, ….,n.

PREMESSE:PREMESSE:

1. I valori di sono distribuiti in modo gaussiano (non è indispensabile che i valori originali seguano la distribuzione normale);

2. le varie di sono indipendenti l’una dall’altra.

Page 5: 1 Unità 7 Test parametrici Test t di Student Analisi della varianza ad una via Confronti multipli

5

CALCOLO:CALCOLO:

si calcoli la media m e la deviazione standard s delle differenze di;

si calcoli l’errore standard della media ;

il valore t è calcolato come ;

scelto il livello di significatività α, l’ipotesi nulla potrà essere rifiutata con p<α (differenza significativa) se il t calcolato con l’equazione precedente supererà in valore assoluto quello indicato nella tabella del t di Student in corrispondenza a n–1 gradi di libertà.

La seguente Tabella 1 riporta i valori critici del t di Student per test monodirezionale e bidirezionale.

nsES /

ns

m

ES

mt

Page 6: 1 Unità 7 Test parametrici Test t di Student Analisi della varianza ad una via Confronti multipli

6

Tabella 1Tabella 1 – Valori critici della – Valori critici della distribuzione t di Student per un distribuzione t di Student per un test bilaterale test bilaterale (area nelle due code) o monolaterale o monolaterale (area in una coda)..

N.B. Si noti che, quando il numero N.B. Si noti che, quando il numero dei gradi di libertà dei gradi di libertà (e quindi la (e quindi la numerosità delle osservazioni)numerosità delle osservazioni) aumenta,aumenta, i valori critici di i valori critici di tt tendono tendono a quelli corrispondenti della curva a quelli corrispondenti della curva di Gauss standardizzata.di Gauss standardizzata.

Page 7: 1 Unità 7 Test parametrici Test t di Student Analisi della varianza ad una via Confronti multipli

7

ESERCIZIO 1:

La tabella sotto riporta i valori di temperatura corporea in °C misurati su 6 pazienti al momento della somministrazione di un presunto antitermico e tre ore dopo. Valutare gli effetti del farmaco utilizzando il test t di Student bidirezionale.

m = 0,92 °C

s = 0,393 °C

74,56393,092,0 t

Page 8: 1 Unità 7 Test parametrici Test t di Student Analisi della varianza ad una via Confronti multipli

8

Dalla Tabella 1 con 5 gradi di libertà il valore critico tabellare con α = 0,01 è (per il test bidirezionale) tt0,010,01= 4,032= 4,032.

Quindi, essendo il t calcolato uguale a 5,745,74, le differenze fra prima e dopo la somministrazione del farmaco sono significative con p<0,01.

Page 9: 1 Unità 7 Test parametrici Test t di Student Analisi della varianza ad una via Confronti multipli

9

ESERCIZIO 2:

La tabella sotto riporta i valori di VEMS (volume espiratorio massimo nel primo secondo) in litri misurata su un gruppo di 5 asmatici prima e dopo un broncodilatatore. Valutare gli effetti del farmaco usando il test t di Student bidirezionale.

m = – 0,8 / 5= – 0,16 litri

s = 0,114 litri

14,35114,0

16,0

t

Dalla Tabella 1 con 4 gradi di libertà i valori critici tabellari sono (per il test bidirezionale) t0,05=2,776 e t0,02=3,747 e quindi 0,02 < p < 0,05.

Page 10: 1 Unità 7 Test parametrici Test t di Student Analisi della varianza ad una via Confronti multipli

10

Esercizio 2 risolto usando il software GraphPadEsercizio 2 risolto usando il software GraphPad

Page 11: 1 Unità 7 Test parametrici Test t di Student Analisi della varianza ad una via Confronti multipli

11

Page 12: 1 Unità 7 Test parametrici Test t di Student Analisi della varianza ad una via Confronti multipli

12

Page 13: 1 Unità 7 Test parametrici Test t di Student Analisi della varianza ad una via Confronti multipli

13

Test t di Student per campioni indipendenti

Si voglia verificare l’ipotesi nulla che le medie di due popolazioni, stimate mediante due campioni indipendenti di numerosità n1 e n2, siano uguali.

PREMESSE:PREMESSE:

1. I dati seguono in modo accettabile una distribuzione normale;

2. i dati sono indipendenti;

3. le deviazioni standard per le due popolazioni sono uguali (in generale diciamo che il rapporto tra la deviazione standard maggiore e quella minore non è maggiore di 2).

Page 14: 1 Unità 7 Test parametrici Test t di Student Analisi della varianza ad una via Confronti multipli

14

CALCOLO:CALCOLO:

si calcolino le medie m1 e m2 dei due campioni;

si calcolino le deviazioni standard s1 e s2 dei due campioni;

il valore t è calcolato come:

scelto il livello di significatività α, l’ipotesi nulla potrà essere rifiutata con p<α (differenza significativa) se il t calcolato con l’equazione precedente supererà in valore assoluto quello indicato nella tabella del t di Student (ancora Tabella 1) in corrispondenza a n1+n2–2 gradi di libertà.

21

21

21

222

211

21

2

)1()1( nn

nn

nn

snsn

mmt

Page 15: 1 Unità 7 Test parametrici Test t di Student Analisi della varianza ad una via Confronti multipli

15

ESERCIZIO 1:

La tabella a lato riporta i valori di pressione arteriosa sistolica in un campione di 7 individui ipertesi trattati con un farmaco antipertensivo e quelli misurati in un gruppo di controllo.Valutare gli effetti del farmaco utilizzando il test t di Student bidirezionale.

83,4

67

67

267

354,95512,96

5,1771,15222

t

Page 16: 1 Unità 7 Test parametrici Test t di Student Analisi della varianza ad una via Confronti multipli

16

Dalla Tabella 1 con 11 gradi di libertà il valore critico tabellare con α = 0,001 è (per il test bidirezionale) t0,001= 4,437.

Quindi, essendo il t calcolato uguale a – 4,83, si può rifiutare l’ipotesi nulla (uguaglianza delle medie) con p<0,001.

Page 17: 1 Unità 7 Test parametrici Test t di Student Analisi della varianza ad una via Confronti multipli

17

Esercizio risolto con GraphPadEsercizio risolto con GraphPad

Page 18: 1 Unità 7 Test parametrici Test t di Student Analisi della varianza ad una via Confronti multipli

18

Page 19: 1 Unità 7 Test parametrici Test t di Student Analisi della varianza ad una via Confronti multipli

19

ANALISI DELLA VARIANZA

Il concetto di fonti di variabilità

Il valore misurato di una grandezza può variare per diverse cause. Esempi di queste cause possono essere:

gli individui in cui la grandezza viene misurata (variabilità individuale); i tempi in cui viene effettuata la misura (variabilità temporale); le sollecitazioni a cui la grandezza è sottoposta (ad esempio un farmaco); gli strumenti con cui viene effettuata la misura.

Nell’analisi della varianza vengono prese in considerazione una o più fonti di variabilità principale da testare contro quella che, di volta in volta, viene considerata la fonte di variabilità residua.

Si calcola la varianza delle fonti di variabilità principale e la si divide per la varianza della fonte residua. Questo rapporto si chiama F.

Page 20: 1 Unità 7 Test parametrici Test t di Student Analisi della varianza ad una via Confronti multipli

20

ANALISI DELLA VARIANZA A UNA VIA

Un caso particolare dell’analisi della varianza è l’analisi della varianza a una via.

In questo caso si considera una sola fonte di variabilità si considera una sola fonte di variabilità principaleprincipale, mentre tutte le altre fonti di variabilità sono considerate come fonti residue.

Un classico esempio si ha quando si vogliono confrontare più trattamenti: i campioni A, B, C e D sono stati sottoposti a trattamenti diversi e si vuole verificare se i risultati ottenuti con i diversi trattamenti non differiscono fra loro (ipotesi nulla) o almeno uno dei trattamenti differisce dagli altri (ipotesi alternativa).

Page 21: 1 Unità 7 Test parametrici Test t di Student Analisi della varianza ad una via Confronti multipli

21

L’analisi della varianza a una via può essere vista quindi L’analisi della varianza a una via può essere vista quindi come una generalizzazione del test come una generalizzazione del test tt di Student per di Student per campioni indipendenti a più di due gruppi.campioni indipendenti a più di due gruppi.

Essa parte quindi da premesse analoghepremesse analoghe a quelle fatte per il test t di Student per campioni indipendenti.

L'ipotesi alla base dell'analisi della varianza è che dati l gruppi, sia possibile scomporre la varianza in due componenti:

varianza interna ai gruppivarianza interna ai gruppi (anche detta “withinwithin”); varianza tra i gruppivarianza tra i gruppi (“betweenbetween”).

La ragione che spinge a compiere tale distinzione è la convinzione, da parte del ricercatore, che determinati fenomeni trovino spiegazione in caratteristiche proprie del gruppo di appartenenza.

Page 22: 1 Unità 7 Test parametrici Test t di Student Analisi della varianza ad una via Confronti multipli

22

CALCOLO:CALCOLO:

Indicati con l il numero dei campioni presi in esame (ad esempio gruppi a diverso trattamento), con mi e ni rispettivamente la media e il numero di osservazioni del campione i-esimo e con m e n la media generale ed il numero complessivo di osservazioni, il procedimento relativo all’analisi della varianza ad un via può essere riassunto nei seguenti passi:

1.1. si calcola la devianza fra gruppi definita come

2. si calcola quindi la varianza fra i gruppi data da

lii mmnB

12)(

1

l

BV

Page 23: 1 Unità 7 Test parametrici Test t di Student Analisi della varianza ad una via Confronti multipli

23

3. indicati con xi gli elementi del campione i-esimo, si calcola la devianza di del gruppo i-esimo come

4. si calcola la devianza entro i gruppi

(D = B + W sarà la devianza totale)

5. si calcola la varianza entro i gruppi

iniii mxd

12)(

lidW

1

ln

W

Page 24: 1 Unità 7 Test parametrici Test t di Student Analisi della varianza ad una via Confronti multipli

24

6. il rapporto F è dato da

7. F si distribuisce seguendo la distribuzione F con l – 1 gradi di libertà per il numeratore e n – l per il denominatore. I valori critici di questa distribuzione corrispondenti al 95° e ad 99° percentile sono riportati rispettivamente in Tabella 2 e Tabella 3.

Se il valore di F calcolato supera il valore tabulare di F corrispondente al 95° percentile si può rifiutare l’ipotesi nulla con probabilità di errore inferiore al 5% (e quindi almeno uno dei trattamenti ha fornito un risultato diverso dagli altri con p<0,05).

Se il valore calcolato di F supera anche il valore tabulare corrispondente al 99° percentile, la probabilità di errore connessa al rigetto dell’ipotesi nulla sarà inferiore all’1%.

V

F

Page 25: 1 Unità 7 Test parametrici Test t di Student Analisi della varianza ad una via Confronti multipli

25

Distribuzione F (Fisher-Snedecor)

Page 26: 1 Unità 7 Test parametrici Test t di Student Analisi della varianza ad una via Confronti multipli

26

Tabella 2Tabella 2 - Rapporto F: 95° percentile.

Page 27: 1 Unità 7 Test parametrici Test t di Student Analisi della varianza ad una via Confronti multipli

27

Tabella 3Tabella 3 - Rapporto F: 99° percentile.

Page 28: 1 Unità 7 Test parametrici Test t di Student Analisi della varianza ad una via Confronti multipli

28

ESERCIZIO 1:

In un esperimento sull’inibizione della crescita dei tumori nel topo mediante trattamenti con due preparati (A e B) si sono ottenuti i pesi di tumori dopo una settimana dal trapianto in tre gruppi di 7, 4, 5 topini tenuti rispettivamente come controllo, sotto trattamento A e sotto trattamento B.

Sulla base dei risultati ottenuti, mostrati in tabella, si valuti l’efficacia dei trattamenti utilizzando l’analisi della varianza ad una via.

Page 29: 1 Unità 7 Test parametrici Test t di Student Analisi della varianza ad una via Confronti multipli

29

Soluzione

Gruppo di controllo: media = 34,71 cg dev. std. = 9,759 cg Gruppo trattato con A: media = 24,0 cg dev. std. = 6,272 cg Gruppo trattato con B: media = 35,60 cg dev. std. = 6,189 cg

Devianza fra gruppi = 370,8 cg2 gradi di libertà = 2 Varianza tra gruppi = 185,4 cgVarianza tra gruppi = 185,4 cg22

Devianza entro gruppi = 842,6 cg2 gradi di libertà = 13 Varianza entro gruppi = 64,82 cgVarianza entro gruppi = 64,82 cg22

Devianza totale = 1213 cg2

FF = 185,4 / 64,82 = 2,86 = 185,4 / 64,82 = 2,86 a cui corrisponde pp = 0,09346 = 0,09346

Page 30: 1 Unità 7 Test parametrici Test t di Student Analisi della varianza ad una via Confronti multipli

30

Page 31: 1 Unità 7 Test parametrici Test t di Student Analisi della varianza ad una via Confronti multipli

31

N.B.N.B. Anche utilizzando la Tabella 2 si giunge alla conclusione che le differenze non sono significative e che, con i dati a disposizione, non si può affermare che l’uno o l’altro dei due preparati anticancerosi sia efficace.

Infatti il rapporto F ottenuto (2,86) è minore di quello in Tabella 2 con 2 e 13 gradi di libertà al livello del 5% (3,81).

Page 32: 1 Unità 7 Test parametrici Test t di Student Analisi della varianza ad una via Confronti multipli

32

ESERCIZIO 2:

Le ciambelle assorbono quantità variabili di grassi a seconda della modalità di cottura. È stato condotto un esperimento che prevede l’utilizzo di tre tipi di grassi: olio di semi di arachide, olio di mais e strutto. I dati relativi alla statistica descrittiva sono riportati in tabella sotto.

L’olio di semi di arachide e l’olio di mais sono grassi insaturi, mentre lo strutto è un grasso saturo. Si determini se la quantità di grassi assorbita dipende dal tipo di grasso utilizzato.

Page 33: 1 Unità 7 Test parametrici Test t di Student Analisi della varianza ad una via Confronti multipli

33

Soluzione

Devianza tra gruppi

Devianza entro gruppi 2222 1529)22,8(5)77,7(5)34,13(5 g

2222 1596)7362(6)7385(6)7372(6 g

Page 34: 1 Unità 7 Test parametrici Test t di Student Analisi della varianza ad una via Confronti multipli

34

CONFRONTI MULTIPLI

Avendo impiegato l’analisi della varianza ad una via dopo avere fissato α = 0,05, un valore calcolato del rapporto F superiore al 95° percentile indica che almeno un gruppo si differenzia dagli altri con p < 0,05.

Se si vuole sapere quanti e quali siano diversi si possono fare test t multipli fra le varie coppie di campioni.

Per tenere conto del fatto che si stanno facendo Per tenere conto del fatto che si stanno facendo confronti multipli, si applicheranno opportune confronti multipli, si applicheranno opportune correzioni al livello di significatività.correzioni al livello di significatività.

Un semplice metodo, ad hoc, consiste nell’applicare la correzione di Bonferronicorrezione di Bonferroni.

Page 35: 1 Unità 7 Test parametrici Test t di Student Analisi della varianza ad una via Confronti multipli

35

N.B.N.B. Tale correzione viene, in generale, utilizzata quando è necessario eseguire molti test di ipotesi con lo stesso database. Infatti, eseguendo un gran numero di test, ciascuno con α = 0,05, alcuni test forniranno un risultato positivo anche in assenza di qualunque effetto reale.

IMPORTANTE L’uso della correzione di Bonferroni porta a test più conservativi rispetto a quelli che tengono sotto controllo l’errore relativo ad ogni singolo controllo (ossia si possono non evidenziare differenze significative anche se le differenze sono presenti).

Esistono altri test meno conservativi, basati su altro tipo di considerazioni, per effettuare confronti multipli dopo avere eseguito un’analisi della varianza ad un via (per esempio, il metodo di TukeyTukey, di DuncanDuncan, di Student-Newmann-KeulsStudent-Newmann-Keuls).

Page 36: 1 Unità 7 Test parametrici Test t di Student Analisi della varianza ad una via Confronti multipli

36

L’idea alla base della correzione di Bonferroni è che, se si esegue un numero di test di significatività pari a c, per ottenere un livello complessivo di errore di Tipo I pari ad α , si deve semplicemente dichiarare che ciascun test sarà significativo se il valore ottenuto di p sarà minore di α / c.

Esempio. Avendo prefissato α = 0,05, se si vogliono verificare 55 ipotesi in un solo esperimento (diciamo 5 diversi trattamenti contro un controllo), non si accetterà un risultato come significativo se il valore di p nei vari test non è minore di 0,010,01.

Questo modo di procedere non è esente da critiche, trattandosi di un aggiustamento molto grossolano.

Anche se la correzione di Bonferroni porta ad un test molto conservativo, essa può essere un utile invito alla cautela e a smorzare gli entusiasmi, quando si esegue un gran numero di test!

Page 37: 1 Unità 7 Test parametrici Test t di Student Analisi della varianza ad una via Confronti multipli

37

OsservazioneOsservazione

La correzione di Bonferroni è un’approssimazione della correzione di Sidak. Con la correzione di Sidak la formula da impiegare effettuando c confronti è la seguente:

dove αt è il valore da utilizzare in ogni test di confronto se si vuole avere un livello complessivo di errore di Tipo I pari a α.

Se α « 1 si può ritenere valida la seguente approssimazione del primo ordine ( ≈ )

da cui si ottiene la correzione di Bonferroni

ct

1)1(1

ttc

t cc ....)1(1)1(1

ct

Page 38: 1 Unità 7 Test parametrici Test t di Student Analisi della varianza ad una via Confronti multipli

38

Esempio 1: Esempio 1: calcolo diretto (da α a αt )

Esempio 2: Esempio 2: calcolo inverso (da αt a α)

Nelle seguenti diapositive sono riportati alcuni esempi di calcolo della probabilità (valutata secondo Sidak) che uno o più test forniscano un valore di p < 0,05 quando si eseguono confronti multipli.Il calcolo è fatto utilizzando il software “GraphPad”.

Page 39: 1 Unità 7 Test parametrici Test t di Student Analisi della varianza ad una via Confronti multipli

39

Page 40: 1 Unità 7 Test parametrici Test t di Student Analisi della varianza ad una via Confronti multipli

40

Page 41: 1 Unità 7 Test parametrici Test t di Student Analisi della varianza ad una via Confronti multipli

41