dissenys en blocs
DESCRIPTION
Dissenys en blocs. Llicenciatura de Biologia Disseny d’Experiments i Anàlisi de Dades Jordi Ocaña Rebull. Contingut. Blocs i el control del biaix i de l’error Disseny en blocs aleatoritzats complet Model estadístic Anàlisi estadística - PowerPoint PPT PresentationTRANSCRIPT
Departament d’EstadísticaDivisió de Ciències Experimentals i
Matemàtiques
Dissenys en blocs
Llicenciatura de Biologia
Disseny d’Experiments i Anàlisi de Dades
Jordi Ocaña Rebull
Dissenys en blocs
Departament
d’Estadística
Contingut
Blocs i el control del biaix i de l’error Disseny en blocs aleatoritzats complet
– Model estadístic– Anàlisi estadística– Altres qüestions: eficiència, cas de factors aleatoris,
comparacions múltiples...
Disseny en quadrats llatins– Model estadístic– Anàlisi estadística
Altres dissenys en blocs: comentaris i extensions
Dissenys en blocs
Departament
d’Estadística
Fer blocs com a forma de controlar el biaix i l’error
Hi ha factors sense interés en un estudi però que poden influir en el resultat: factors “soroll”.
Possibles estratègies per eliminar-ne l’efecte:– Si desconegut i totalment incontrolable: aleatorització.
– Si incontrolable però mesurable: restar-ne l’efecte en l’anàlisi dels resultats (cas de l’anàlisi de la covariància).
– Si controlable experimentalment: fer blocs, comparar els tractament d’interés dins blocs fets segons nivells del(s) factor(s) de “soroll”.
Dissenys en blocs
Departament
d’Estadística
Disseny en blocs aleatoritzats complet
Sovint un factor de soroll és la pròpia unitat experimental– Exemples: els propis pacients en un estudi clínic, amb les
seves característiques especials (salut, hàbits, ...), les parcel·les en un estudi de producció agrícola, la pròpia peça de material en estudis de duresa, etc.
Possible estratègia: tots els tractaments (factor(s) d'interès en l’estudi) a cada unitat experimental.
Ordre o lloc de tractament dins cada unitat a l’atzar. Temps de recuperació si és necessari.
Dissenys en blocs
Departament
d’Estadística
Exemple de disseny en blocs aleatoritzats: [CO] i resistència a l’esforç
Distància recorreguda en 12’ tot respirant diverses “atmosferes” (A, B, C o D). Temps de recuperació entre proves i ordre de tractaments a l’atzar dins cada individu.
Individu A B C D1 835 874 750 8542 787 827 755 8293 724 738 698 7264 336 378 210 2795 252 315 168 3366 560 672 558 6427 336 341 260 336
Dissenys en blocs
Departament
d’Estadística
Model estadístic pel disseny en blocs aleatoritzats complet
a tractaments, b blocs (~ individus), una observació per bloc i tractament, no interacció.
1
1
1,2, ,
1,2, ,0,
efecte del tractament , 0
efecte del bloc , 0
ij i j ij
ija
i ii
b
j jj
i aY e
j be N iid
i
j
Dissenys en blocs
Departament
d’Estadística
Anàlisi estadística d’un disseny en blocs aleatoritzats complet (I)
Hipòtesis d’interès:
Sumes de quadrats:
0 1 2
1 '
:
: , per alguna 'a
i i
H
H i i
2
..
1 1
2 2
.. ... .1 1
2
... .1 1
T A B E
a b
T iji j
a b
iA B ji j
a b
iE ij ji j
SS SS SS SS
SS Y Y
SS b Y Y SS a Y Y
SS Y Y Y Y
Dissenys en blocs
Departament
d’Estadística
Anàlisi estadística d’un disseny en blocs aleatoritzats complet (II)
Graus de llibertat:
Quadrats mitjans:
1 1 1 1A B E
A B E
SS SS SSMS MS MS
a b a b
1 1 . . .
1 . . .
1 . . .
1 1 . . .
T
A
B
E
SS ab N g d ll
SS a g d ll
SS b g d ll
SS a b g d ll
Dissenys en blocs
Departament
d’Estadística
Anàlisi estadística d’un disseny en blocs aleatoritzats complet (i III)
Esperances dels quadrats mitjans:
Estadístic de test i distribució sota H0:
2
2 1
2
12
2
1
1
a
ii
A
b
jj
B
E
bE MS
a
a
E MSb
E MS
1, 1 1A
E
MSF F a a b
MS
Dissenys en blocs
Departament
d’Estadística
Càlculs de les sumes de quadrats[CO] i resistència a l’esforç
Individu A B C D1 835 874 750 854 828.25 77900.80 1471772.432 787 827 755 829 799.50 62678.703 724 738 698 726 721.50 29706.984 336 378 210 279 300.75 61699.015 252 315 168 336 267.75 79181.946 560 672 558 642 608.00 3464.167 336 341 260 336 318.25 53311.51
547.14 592.14 485.57 571.71 549.14
4.00 1849.00 4041.33 509.47
44826.57 16316.43
. jy 2
. ..jy y
.iy
2
. ..iy y
BSS
ASS
ESS
Dissenys en blocs
Departament
d’Estadística
Taula d’anàlisi de la variància[CO] i resistència a l’esforç
Font devariació
Suma dequadrats SS G.d.ll.
Quadrats mitjans MS F P-valor
Atmosfera 44826.57 3 14942.19 16.48 0.000021Individu (bloc) 1471772.43 6 245295.40 6.00 0.001372Error 16316.43 18 906.47Total 1532915.43 27
Dissenys en blocs
Departament
d’Estadística
Disseny en blocs aleatoritzats complet. Comentaris finals
En general sempre més eficient que disseny totalment aleatoritzat.
Suposició de no interacció, perillosa i no demostrable (en general) estadísticament.
Cas de tractaments i/o blocs factor aleatori (com hauria de ser a l’exemple): són vàlides exactament les mateixes anàlisis (amb interpretació adequada).
Comparacions múltiples entre tractaments: són vàlids tots els mètodes explicats pel cas d’un factor.
Dissenys en blocs
Departament
d’Estadística
Disseny en quadrats llatins
Volem analitzar un factor amb p nivells (p.e. Tractament, amb p = 4 possibilitats: A, B, C, D).
Hi ha dos factors (sense interès per ells mateixos) que sospitem que poden influir en la resposta, tots dos també amb p nivells (p.e. Pacient i Partida de matèria prima): factors de bloc.
Arrangem els factors de bloc en quadrat p x p. Assignem un tractament a l’atzar a cada casella (Pacient x Partida) amb la restricció que no hi hagi cap tractament repetit a cap fila ni columna.
Dissenys en blocs
Departament
d’Estadística
Un exemple de quadrat llatí 4x4
Partida
1 2 3 4
1 A B D C
2 B C A D
3 C D B A
Pacient
4 D A C B
Quadrat llatí estàndard: si primera fila i columna en ordre alfabètic.Cada cop més quadrats llatins possibles en augmentar p.
midaquadrats llatins 3x3 4x4 5x5 6x6
estàndard 1 4 56 9408total 12 576 161280 >818·106
Dissenys en blocs
Departament
d’Estadística
Model associat a un quadrat llatí
efecte de:– Fila (p.e. pacient), correspon a l’índex i– Tractament, índex j = j(i,k)– Columna (p.e. partida de producte), índex k
aquesta funció defineix el quadrat llatí concret es suposa que no hi ha cap mena d’interacció
1, , 1, ,
~ (0,
,
)
( )
ijk i j k ijk
ijk
Y e
i p k p
e N i
j j
d
i
i
k
Dissenys en blocs
Departament
d’Estadística
Sumes de quadrats associades a un quadrat llatí
. .
2
···
1 1
2 2
·· ··· ·· ···.1 1
2
· · ···.1
T fila col tract E
p p
T ijki j
p p
i kfila coli k
p
jtractj
SS SS SS SS SS
SS Y Y
SS p Y Y SS p Y Y
SS p Y Y
Dissenys en blocs
Departament
d’Estadística
Taula ANOVA per un disseny en quadrat llatí
Font devariació
Suma dequadrats
Graus dellibertat
Quadratmitjà
F
Tractament SStract p - 1 MStract MStract / MSE
F(p-1, (p-2)(p-1))
Fila SSfila p - 1 MSfila ?
Columna SScol. p - 1 MScol. ?
Error SSE (p-2)(p-1) MSE
Total SST
Dissenys en blocs
Departament
d’Estadística
Exemple: producció d’ordi en Qmsegons varietat A, B, C, D
Finca dividida en 16 = 4 x 4 parcel·les, cada parcel·la sembrada amb una varietat segons quadrat llatí agafat a l’atzar.
C 47
D 40
B 50
A 57
B 49
A 53
C 37
D 29
D 28
C 34
A 46
B 37
A 48
B 44
D 25
C 30
Efecte parcel·la (posició en espai) eliminat pel quadrat llatí. Files i columnes representen l’espai.
Dissenys en blocs
Departament
d’Estadística
Taula ANOVA per la producció d’ordi
Analysis of Variance for ORDI.Qm - Type III Sums of Squares-------------------------------------------------------------------------------------------Source of variation Sum of Squares d.f. Mean square F-ratio Sig. level-------------------------------------------------------------------------------------------MAIN EFFECTS A:ORDI.Varietat 968.75000 3 322.91667 227.941 .0000 B:ORDI.Fila 391.25000 3 130.41667 92.059 .0000 C:ORDI.Columna 67.25000 3 22.41667 15.824 .0030
RESIDUAL 8.5000000 6 1.4166667-------------------------------------------------------------------------------------------TOTAL (CORRECTED) 1435.7500 15-------------------------------------------------------------------------------------------0 missing values have been excluded.All F-ratios are based on the residual mean square error.
Dissenys en blocs
Departament
d’Estadística
Quadrats llatins i altres dissenys en blocs: comentaris i extensions. I
Totalment additius (no consideren interaccions, que no es poden analitzar!).
Un quadrat llatí es pot replicar (i aleshores permet una certa anàlisi de la interacció):– dins cada casella
– replicant-lo per files (o columnes)
– replicant-lo per files i columnes
Un disseny “cross-over” per dos tractaments es pot interpretar com un quadrat llatí replicat per columnes.
Dissenys en blocs
Departament
d’Estadística
Quadrats llatins i altres dissenys en blocs: comentaris i extensions. II
Dissenys greco-llatins: en quadrat p x p, dos tractaments (representats per lletra grega i lletra llatina).
A B C D B A D C C D A B D C B A
Com dos quadrats llatins superposats, ortogonals (cada lletra grega un sol cop amb una llatina).Altres tipus de dissenys en blocs: incomplets, replicats, ...