testul t pentru eşantioane independente · interpretarea rezultatului la testul tpentru...
TRANSCRIPT
Testul t pentru eşantioane independente
M. Popa
Model de cercetare inter-subiecţi
• testarea diferenţei dintre două eşantioane de subiecţi– diferenţa asumării riscului între bărbaţi şi femei– diferenţa dintre timpul de reacţie al celor care au
consumat o anumită cantitate de alcool faţă de al celor care nu au consumat alcool, etc.
• în astfel de situaţii– variabila dependentă (scală I/R)
• asumare riscului, timpul de reacţie
– variabila independentă (scală categorială dihotomică)• genul (M/F), consumul de alcool (DA/NU)
Temă de cercetare
• Un psiholog doreşte să probeze eficienţa trainingului autogen asupra performanţei în tragerea la ţintă cu arcul
• În acest scop:– alcătuieşte două grupe de sportivi (echivalenţi sub
aspectul gradului de antrenament)– cu un grup efectuează trainig autogen înainte de
tragere cu celalalt nu– se execută o sedinţă de tragere şi se înregistrează
performanţele sportivilor din fiecare grup
Variabilele cercetării
• v. independentă– trainingul autogen– scală nominală dihotomică (DA/NU)
• v. dependentă– performanţa de tragere– scală I/R (număr de punte)
Populaţiile cercetării
• dacă ipoteza cercetării este adevărată:– eşantionul fără training autogen face parte din
populaţia trăgătorilor fără training autogen– eşantionul cu training autogen face parte
populaţia trăgătorilor cu training autogen
POPULAŢIA 1
nepracticanţi training autogen
POPULAŢIA 2
practicanţi training autogen
eşantion 1
eşantion 3
eşantion 2
eşantion 1
eşantion 2
eşantion 3
m11-m21
m12-m22
m13-m23
populaţia de diferenţe dintre medii
eşantion k eşantion jm1k-m2j
Populaţia diferenţelor dintre medii
µ1- µ2=0
populaţia fără TA populaţia cu TA
m11 m12m11-m12
m21 m22
m21-m22
m31 m32
m31-m32
populaţia de nul
urmează distribuţia t
şi are media = 0
Procedura statisticăun test z(t) pentru diferenţa dintre medii,
similar testului z(t) pentru un singur eşantion
m
mz
σµ−
=m=m1-m2 µ1- µ2=0
Nm
σσ =
Nm
2σσ =
2
2
2
1
2
121
NNmm
σσσ +=−
21
2121 )()(
mm
mmz
−
−−−=
σµµ
2
2
2
1
2
1
21
NN
mmz
σσ+
−=
σ va fi estimat prin s
Variante de calcul
testul t pentru dispersii diferite
2
2
2
1
2
1
21
N
s
N
s
mmt
+
−=
2
*)1(*)1(
21
2
22
2
112
−+−+−
=NN
sNsNs c
Dispersia cumulată pentru diferența dintre medii
� controversată
� rezultatul nu urmează fidel distribuţia t
� s1 şi s2 se cumulează pentru a estima σ
� numitorul exprimă gradele de libertate
Exemplu de calcul
• Problema cercetării– Diferenţa dintre mediile celor două eşantioane
este are legătură cu practicarea TA sau este o variaţie întâmplătoare a mediei de eşantionare?
• Eşantioanele cercetării– 6 sportivi nepracticanţi de TA– 6 sportivi practicanţi de TA
• Ipoteza cercetării– bilaterală
• Practicarea TA este în relaţie cu performanţa de tragere la ţintă
– unilaterală• Practicanţii de TA obţin o performanţă la bună
decât nepracticanţii de TA
• Criteriile deciziei statistice
– alfa=0.05 , bilateral– df=(N1+N2)-2=(6+6)-2=10– t critic = ±2.228
2.5% 2.5%
t=-2.228 t=+2.228
Decizia statistică bilaterală
zona de respingere H0
zona de respingere H0
X1
15
9
12
13
16
15
X2
10
8
11
5
7
9
practicanţi TA („1”) ne-practicanţi TA („2”)
(X1-m1)2
2.78
18.74
1.76
0.10
7.12
2,78
(X2-m2)2
2.78
0,10
7.12
11.08
1.76
0.44
ΣΣΣΣ
N
m
50
6
m2=8.33
80
6
m1=13.33
1
)( 2
2
−
−=∑
N
mXs
i
66.65
28.332
1 ==s 66.45
28.232
2 ==s
23.2833.28
Calculăm t pentru dispersii cumulateeroarea standard a diferenţei
+
−+−+−
=2121
22
212
1 11
2
))(1())(1(
NNNN
sNsNsDIF
34.16
1
6
1
266
66.4*)16(66.6*)16(=
+−+−+−
=DIFs
73.334.1
33.833.1321 =−
=−
=Difs
mmttestul t
21
21
22
212
1
2
))(1())(1(
NN
NN
sNsN
sDIF+
−+−+−
=
m1-m2 0 tcritic=2.28 t=3.73
Decizia statistică
tcalculat (3.73) > tcritic (2.228 )
� Decizia cu privire la ipoteza de nul ?
� Concluzia cercetării?
Mărimea efectului
Indicele d (Cohen):
)1()1(
)1()1(
21
22
212
1
21
−+−∗−+∗−
−=
NN
sNsN
mmd
1.238.2
5
)16()16(
66.4)16(67.6)16(
33.833.13==
−+−∗−+∗−
−=d
Relaţia dintre practicarea TA şi performanţa de tragere este “importantă”, “mare”, “ridicată”
>0.80
m1-m2 0
Mărimea efectului
d=2.1
Nivelul de semnificație
Mărimea efectuluiSuficient de mare Prea mică
Acceptabil (p<0.05)
Inferența nu ridică probleme
Cercetarea SUSȚINEun rezultat care
NU ESTE IMPORTANT
Inacceptabil(p>0.05)
Cercetarea NU SUSȚINEun rezultat care
ESTE IMPORTANT
Inferențanu ridică probleme
Limitele de încredere ale diferenţei dintre
mediile a două populaţii
� punctul de estimare:� diferenţa dintre cele două medii m1-m2=13.33-8.33=5 puncte� diferenţa mediilor în populaţie se situează în jurul a cinci
puncte� limitele de variaţie a diferenţei dintre mediile populaţiilor, pentru un nivel de încredere de 95% (poate fi şi 99% sau 99.1%), bilateral
� stabilim valorile critice pentru t între care se află 95% dintre valorile distribuţiei, pentru df=10
� în exemplul dat acestea sunt, aşa cum am văzut deja, ±2.2281
( ) ( )21
2121
mms
mmt
−
−−−=
µµ
( ) ( ) 212121 * mmcrit stmm −=−−− µµ
( ) 212121 * mmcrit stmm −±−=− µµ
( ) 34.1*2281.233.833.1321 ±−=− µµ
0+7.985 limita superioară
+2.015limita inferioară
95% şanse ca diferenţa dintre medii să se afle
între aceste limite
Interpretarea rezultatului la testul t pentru
eşantioane independente
• Valoarea testului (t=3.73) nu are o relevanţă în sine– relevantă sunt probabilitatea asociată acestei valori (p<0.05),
mărimea efectului şi limitele de încredere
• Modelul de cercetare nu permite formularea unei concluzii în termenii unei relaţii cauzale– în acest scop se impune un model de cercetare experimentală
• O diferenţă semnificativă nu este similară cu existenţa unei diferenţe cu valoare practică. – Diferenţa dintre cele două loturi de sportivi (5 puncte), deşi
semnificativă statistic, poate fi prea mică pentru a justifica programul TA
– Într-o asemenea situaţie, studiul nu este lipsit de valoare dar concluziile sunt utile doar în plan teoretic.
Publicarea rezultatului(standard APA)
• sintetic:– mediile şi abaterile standard ale fiecărui eşantion– volumul eşantioanelor sau gradele de libertate– valoarea testului t– nivelul lui p– mărimea efectului
– limitele de încredere
• narativ:– „Sportivii care practică trainingul autogen au fost comparaţi cu
cei care nu practică. Primii au realizat o performanţă mai bună (m=13.33, σ=2.58) faţă de ceilalţi (m=8.33, σ=2.16), t(10)=3.65, p<0.05. Mărimea efectului este mare (d=2.1) iar limitele de încredere (95%) pentru diferenţa mediilor sunt cuprinse între 2.01 şi 7.98”.
Condiţiile în care putem calcula testul t pentru
eşantioane independente
• Eşantioane aleatoare (ideal)• Eşantioane independente• Variabila dependentă să se distribuie normal în
ambele populaţii– garantează că şi distribuţia diferenţelor dintre medii se distribuie
normal– totuşi, TLC permite asumarea normalităţii distribuţiei mediei de
eşantionare (N>30)– dacă analiza distribuţiilor indică forme aberante, se va alege
soluţia unui test neparametric– testele t sunt robuste la încălcarea condiţiei de normalitate
• Dispersia celor două eşantioane să fie omogenă– testul t poate fi aplicat strict în cazurile în care dispersiile celor două
populaţii („practicanţi”, „nepracticanţi”) au aceeaşi dispersie (omogenitatea dispersiei)
– există trei situaţii în care această condiţie nu trebuie să ne preocupe:• când eşantioanele sunt suficient de mari (cel puţin 100 fiecare)• când cele două eşantioane au acelaşi volum (N1=N2)• când dispersiile celor două eşantioane nu diferă semnificativ
Când se utilizează testul t pentru eşantioane independente?
• variabilă dependentă, măsurată pe o scală de interval/raport
• variabilă independentă măsurată pe scala de tip nominal (dihotomic)
• utilizarea testului t pentru eşantioane independente este frecventă
Sfârşit..............
df\p 0.40 0.25 0.10 0.05 0.025 0.01 0.005 0.0005
1 0.324920 1.000000 3.077684 6.313752 12.70620 31.82052 63.65674 636.6192
2 0.288675 0.816497 1.885618 2.919986 4.30265 6.96456 9.92484 31.5991
3 0.276671 0.764892 1.637744 2.353363 3.18245 4.54070 5.84091 12.9240
4 0.270722 0.740697 1.533206 2.131847 2.77645 3.74695 4.60409 8.6103
5 0.267181 0.726687 1.475884 2.015048 2.57058 3.36493 4.03214 6.8688
6 0.264835 0.717558 1.439756 1.943180 2.44691 3.14267 3.70743 5.9588
7 0.263167 0.711142 1.414924 1.894579 2.36462 2.99795 3.49948 5.4079
8 0.261921 0.706387 1.396815 1.859548 2.30600 2.89646 3.35539 5.0413
9 0.260955 0.702722 1.383029 1.833113 2.26216 2.82144 3.24984 4.7809
10 0.260185 0.699812 1.372184 1.812461 2.22814 2.76377 3.16927 4.5869
11 0.259556 0.697445 1.363430 1.795885 2.20099 2.71808 3.10581 4.4370
12 0.259033 0.695483 1.356217 1.782288 2.17881 2.68100 3.05454 4.3178
13 0.258591 0.693829 1.350171 1.770933 2.16037 2.65031 3.01228 4.2208
14 0.258213 0.692417 1.345030 1.761310 2.14479 2.62449 2.97684 4.1405
Tabelul t pentru probalităţile din dreapta curbei