statistička kontrola pridruženih faktora - analiza...
TRANSCRIPT
Statistička kontrola pridruženih faktoraStatistička kontrola pridruženih faktora- analiza kovarijanse -
Nikola KocevNikola Kocev
Statistika za istraživače u oblasti medicinskih nauka Katedra za medicinsku statistiku i informatiku
SAS i DS 2009
DEFINICIJAAnaliza kovarijanse je metoda kojom seAnaliza kovarijanse je metoda kojom se statistički kontroliše uticaj pridružene varijable. Sinteza je analize varijanse i regresije.Parametarska metoda zaključivanja zasnovana na klasi generalnih lineranih modela.ANCOVA se primenjuje kada su rezultujuća i pridružena varijabla merene intervalnom ili
k l f k ( )omernom skalom, a faktor (tretman) je meren nominalnom skalom.
SAS i DS 2009 Informatika za istraživačeKatedra za medicinsku statistiku i informatiku
Jednofaktorska analiza kovarijanseHeterogene eksperimentalne jediniceete oge e e spe e ta e jed ceVarijablu koja prikazuje tu heterogenost za svaku eksperimentalnu jedinicu i da je klj či ( li i iš ) liuključimo (a ne eliminišemo) u analizu
konačnih eksperimentalnih rezultataVarijabla koja predstavlja heterogenostVarijabla koja predstavlja heterogenost eksperimentalnih jedinica zove se kovarijata (kovarijabla), obeležava se kao varijabla X. Rezultujuća varijabla koju istražujemo označava se sa Y.
SAS i DS 2009 Informatika za istraživačeKatedra za medicinsku statistiku i informatiku
ANCOVA, ustvari, pretpostavlja da su odnosi između , , p p jkovarijate (varijable X) i zavisne varijable (Y) isti u obe grupe, tj. da je povezanost između koronarne stenoze i abnormalnosti kretanja zida ista i kod pušača i kodabnormalnosti kretanja zida ista i kod pušača i kod nepušača. Ova pretpostavka je ekvivalentna zahtevu da su regresioni nagibi jednaki u obe grupe. Geometrijski, d kl đ d l l kdakle, ANCOVA utvrđuje da li postoje razlike u odsečcima, pretpostavljajući da su nagibi jednaki.
SAS i DS 2009 Informatika za istraživačeKatedra za medicinsku statistiku i informatiku
ANCOVA simulira ishod Y koji bi se pojavioANCOVA simulira ishod Y koji bi se pojavio ako se vrednost X drži konstantnom. Geometrijski, ANCOVA utvrđuje da li postojeGeometrijski, ANCOVA utvrđuje da li postoje razlike u odsečcima, pretpostavljajući da su nagibi jednaki. primer
SAS i DS 2009 Informatika za istraživačeKatedra za medicinsku statistiku i informatiku
Analiza kovarijanse je statistička procedura koja omogućava da se uključe i kontinualne i k t ij l ij bl j di t d lkategorijalne varijable u jedinstvan model.ANCOVA predpostavlja da su regresioni koeficijenti homogeni u odnosi nakoeficijenti homogeni u odnosi na kategorijalnu varijablu.
SAS i DS 2009 Informatika za istraživačeKatedra za medicinsku statistiku i informatiku
yProsek
40
30 Tretman 2
Tretman 4
Tretman 1
Ukupno(kontrola)
20
Tretman 3
10 20 30 40
-10
0 x
-20
-30
-40
SAS i DS 2009 Informatika za istraživačeKatedra za medicinsku statistiku i informatiku
PrimerPrimer odnosi se na istraživanje čiji je cilj bio da ispita j j j j pefikasnost različitih lekova na smanjenje krvnog pritiska kod odraslih osoba. Pre davanja leka (faktor - tretman) krvni pritisak variraPre davanja leka (faktor tretman) krvni pritisak varira znatno od ispitanika do ispitanika. Pravljenje bloka prema početnom krvnom pristisku teorijski je moguće, ali realno nije adekvatnoali realno nije adekvatno. Zbog toga bismo mogli izmeriti i zabeležiti početni krvni pritisak x svakog ispitanika pre primene leka i ovu informaciju iskoristiti da bi prilagodili (ađastirali) efekteinformaciju iskoristiti da bi prilagodili (ađastirali) efekte tretmana na varijablu Y.
SAS i DS 2009 Informatika za istraživačeKatedra za medicinsku statistiku i informatiku
Statistička kontrola pridruženih faktora Statistička kontrola pridruženih faktora u tablicama kontingencije
Identifikacija i kvantifikacija faktora rizika
Nikola Kocev
Statistika za istraživače u oblasti medicinskih nauka Katedra za medicinsku statistiku i informatiku
SAS i DS 2009
Opservaciona istraživanja su veoma važna kategorija p j g jnaučnih istraživanja. Najjednostavniji oblik ovih istraživanja jesu ona u kojima postoje samo dve varijable od interesa.kojima postoje samo dve varijable od interesa. Prva, faktor rizika, označava varijablu za koju se misli da je povezana sa nekim ishodom. Za faktor rizika se sumnja da je uzrok nekog specifičnog stanjarizika se sumnja da je uzrok nekog specifičnog stanja ishodne varijable. Druga, ishodna, varijabla najčešće je prisustvo ili d t k b l ti ili ž lj d đ jodsustvo neke bolesti ili neželjenog događaja, na
primer.
SAS i DS 2009 Informatika za istraživačeKatedra za medicinsku statistiku i informatiku
Model 2 x 2
Ishodna varijabla / Bolest Nezavisna j varijabla / Faktor
rizika Ima Nema Ukupno
Prisutan a b a+bOdsutan c d c+d S + b+d +b+ +dSvega a+c b+d a+b+c+d=n
SAS i DS 2009 Informatika za istraživačeKatedra za medicinsku statistiku i informatiku
Dva aspekta evaluacije povezanostiPrvi je poređenje incidence bolesti u izloženoj i j p j jneizloženoj grupi korišćenjem odgovarajućeg statističkog testa značajnosti. Da li je poveza-nost statistički značajna ili je samo posledica slučajnosti?ili je samo posledica slučajnosti?Drugi aspekt – njena kvantifikacija, dobija se relativnim rizikom u prospektivnim studijama ili unakrsnim odnosom (odds ratio, odnos šansi) u retrospektivnim opservacionim studijama. Kada su obe varijable (nezavisna i zavisna) merene barKada su obe varijable (nezavisna i zavisna) merene bar intervalnom skalom merenja u cilju evaluacije povezanosti koriste se regresiona i korelaciona analiza.
SAS i DS 2009 Informatika za istraživačeKatedra za medicinsku statistiku i informatiku
Relativni rizik redstavlja odnos između verovatnoće da se edsta ja od os eđu e o at oće da sebolest razvije u ispitanika koji su izloženi faktoru rizika i verovatnoće pojave te bolesti u ispitanika koji nisu izloženi potencijalnomu ispitanika koji nisu izloženi potencijalnom faktoru rizika:
( )( )dcc
baaRR
++
=//^
relativni rizik izračunat iz studijskog uzorka i ocena je( )dcc +/ studijskog uzorka i ocena je relativnog rizika, RR, za čitavu populaciju iz koje je uzorak izabran
SAS i DS 2009 Informatika za istraživačeKatedra za medicinsku statistiku i informatiku
izabran.
Relativni rizik – interval poverenja
⎟⎠⎞⎜
⎝⎛± 2/1^ χz
( )⎟⎠
⎜⎝
±
=−/1^
%1100χα
αz
RRIP( )bcadn − 2
2 ( )( )( )( )( )dcbadbca
bcadn++++
=2χ
z dvosmerna z vrednost koja odgovara izabranomzα dvosmerna z vrednost koja odgovara izabranom koeficijentu poverenja
0 ≤ RR ≤ ∝RR = 1 ekspozicija faktoru rizika i bolest nisu povezaniRR = 1 ekspozicija faktoru rizika i bolest nisu povezaniRR > 1 rizik oboljevanja veći u onih koji su izloženi potencijalnom faktoru rizika.RR < 1 negativna povezanost, znači da se ovde uopšte ne radi o faktoru rizika već je pitanju protektivni faktor
SAS i DS 2009 Informatika za istraživačeKatedra za medicinsku statistiku i informatiku
rizika, već je pitanju protektivni faktor
Unakrsni odnos ili odnos šansi definiše se kao odnos između verovatnoće uspeha prema p pverovatnoći neuspeha.podaci potiču iz retrospektivnih studijaove studije zasnivaju na uzorcima ispitanika sa bolešćuove studije zasnivaju na uzorcima ispitanika sa bolešću (slučajevi) i onih bez nje (kontrole) pa se retrospektivno određuje raspodela rizika među njima.
Š d j k l č j ( j d i
( )[ ] ( )[ ] bababbaa //// =++Šansa da je neko slučaj (tj. da ima bolest) a da nije kontrola (tj. da nema bolest) među ispitanicima koji su izloženi faktoru rizikakoji su izloženi faktoru rizika
( )[ ] ( )[ ] dcdcddcc //// =++ šansa da je neko slučaj (tj. da ima bolest) a da nije kontrola (tj. da nema b l ) đ i i i i k ji i
SAS i DS 2009 Informatika za istraživačeKatedra za medicinsku statistiku i informatiku
bolest) među ispitanicima koji nisu izloženi faktoru rizika
Odnos šansiOdnos šansi koji računamo predstavlja meru izračunatu j p jiz uzoračkih podataka a koristimo je kao ocenu populacionog OR:
⎞⎛ 2
bcaddcba
OR ///^
== ( )⎟⎠⎞⎜
⎝⎛±
=−
2/1^%1100
χα
αz
ORIP
Unakrsni odnos uzima vrednosti između 0 i beskonačnosti. Što je veća vrednost unakrsnog odnosa jača je povezanost između bolesti koja se ispituje i ekpozicije faktoru rizika. Vrednosti bliske jedinici ukazuju na nepostojanje povezanosti između bolesti i ekspozicije faktoru rizika,vrednosti manje od jedinice indikator su negativne povezanosti (tj. protektivnog efekta) između faktora rizika i bolesti
SAS i DS 2009 Informatika za istraživačeKatedra za medicinsku statistiku i informatiku
protektivnog efekta) između faktora rizika i bolesti.
Mentl-Henšelova statistikaIspituje se povezanost između statusa neke bolesti i statusa nekog faktora rizika. Može postojati jedna ili više varijabli koje su povezane ili sa bolešću, ili sa faktorom rizika ili i sa jednom i sa drugim
U ovom slučaju ova povezanost zamagljuje, iskrivljava ili potpuno skrivaU ovom slučaju ova povezanost zamagljuje, iskrivljava ili potpuno skriva stvarnu povezanost između bolesti i faktora rizika.
Kada se pridružena varijabla/e identifikuje treba je kontrolisati tako da se otkrije prava veza između ishodne i nezavisne varijableotkrije prava veza između ishodne i nezavisne varijable.
S jedne strane testiramo hipotezu o postojanju povezanosti između ishodne i nezavisne varijable kontrolišući pridruženu varijablu, a sa druge, kvantifikujemo tu povezanost izračunavanjem jedinstvene mere asocijacije za sve podatke posle prilagođavanja ili ađastiranja efekata pridružene varijable.
SAS i DS 2009 Informatika za istraživačeKatedra za medicinsku statistiku i informatiku
Mentl-Henšelova statistika -postupak
Ovim metodom može da se testira i hipoteza o pznačajnosti povezanosti oblika: H0: aMA = 1 i H1: aMA nije jednako 1. U primeni Mentl-Henšelove procedure slučajevi i kontrole se raspodeljuju u različite stratume formirane prema različitim vrednostima pridružene varijable.prema različitim vrednostima pridružene varijable. Kada pridružena varijabla nije kategorijalna nego kontinuirana mora se prethodno kategorisati. Podaci se tada individualno analizuju stratum po stratum, a potom svi zajedno.
SAS i DS 2009 Informatika za istraživačeKatedra za medicinsku statistiku i informatiku
Izgled i-tog stratuma i njegova tablica kontingencije
Uzorci Faktor rizika Ukupno Slučajevi Kontrole
Prisutan ai bi ai + bi Odsutan ci di ci + diOdsutan ci di ci di
Svega ai + ci bi + di ni
Nulta hipoteza o nepostojanju povezanosti izmeđuNulta hipoteza o nepostojanju povezanosti između bolesti i potencijalnog faktora rizika u populaciji se odbacuje ako je izračunata vrednost jednaka ili veća od k itič d ti t t t ti tik k j j t blič hikritične vrednosti test statistike koja je tablična hi-kvadrat vrednost sa jednim stepenom slobode i izabranim nivoom značajnosti.
SAS i DS 2009 Informatika za istraživačeKatedra za medicinsku statistiku i informatiku
j
MH - izračunavanja
( )( )b ++( )( )i
iiiii n
cabae
++=
( )( )( )( )++++ dbcadcba( )( )( )( )( )12 −
++++=
ii
iiiiiiiii
nndbcadcba
v
( )∑=
−=
k
iii
MH
ea1
2
2χ DF = 1
∑=
= k
ii
MH
v1
χ DF = 1
SAS i DS 2009 Informatika za istraživačeKatedra za medicinsku statistiku i informatiku
i 1
Mentl-Henšelova zajednička ocena unakrsnog odnosa
k
( )∑== k
k
iiii
MH
nda
OR1
^/
Kada ga formiramo pretpostavljamo da su u
( )∑=i
iii ncb1
/
g p p jpopulaciji unakrsni odnosi za svaki stratum jednaki (a to znači da nema interakcije). Kada su opšta i ova zajednička ocena različite to je
t b d k t j j id ž ti K dpotreban dokaz postojanja pridruženosti. Kada su jednake pridruženosti nema, a ako se malo razlikuju smatramo da je potencijal pridruženosti slab.
SAS i DS 2009 Informatika za istraživačeKatedra za medicinsku statistiku i informatiku
PrimerPlat i saradnici su procenjivali efektivnost p jpreoperativne antibiotske profilakse u randomizovanom, duplo slepom kliničkom
l d k h đ dogledu, pacijenata u kojih su rađene dve vrste operativnih zahvata: hirurgija dojke i odstranjivanje kile Pacijenti su primali biloodstranjivanje kile. Pacijenti su primali bilo cefonid (1 gram dnevno) bilo placebo.
SAS i DS 2009 Informatika za istraživačeKatedra za medicinsku statistiku i informatiku
C f i id Pl bCefonicid PlaceboHirurgija dojke Broj pacijenata
Broj pacijenata koji je iz bilo kog
303
303
Broj pacijenata koji je iz bilo kog razloga dobijao postoperativni
tretman
26 43
Operacija kileOperacija kileBroj pacijenata
Broj pacijenata koji je iz bilo kog razloga dobijao postoperativni
301
14
311
25razloga dobijao postoperativni tretman
14 25
SAS i DS 2009 Informatika za istraživačeKatedra za medicinsku statistiku i informatiku
PRIMER (nastavak)Da li na osnovu ovih podataka istraživači mogu zaključiti da postoji povezanost između preoperativne terapije antibioticima i potrebe za posteoperativnom terapijom antibioticimaposteoperativnom terapijom antibioticima između pacijenata koji su operisali dojku ili kilu?HIPOTEZE
H0: ne postoji povezanost između preoperativne antibiotske profilakse i potrebe za postoperativnim antibiotskim tretmanom među pacijentima koji suantibiotskim tretmanom među pacijentima koji su imali bilo operaciju dojke ili kileH1: postoji povezanost između dve varijable
SAS i DS 2009 Informatika za istraživačeKatedra za medicinsku statistiku i informatiku
Mentl-Henšelov test
Stratum 1 (hirugija dojke)Faktor rizikaa Slučajevib Kontrole Ukupno
Prisutan 43 260 303 Od t 26 277 303Odsutan 26 277 303Svega 69 537 606
Stratum 2 (operacija kile) Faktor rizikaa Slučajevib Kontrole UkupnoFaktor rizika Slučajevi Kontrole Ukupno
Prisutan 25 286 311 Odsutan 14 287 301 Svega 39 573 612
A Faktor rizika je neprimanje preoperativne profilakse antibioticimaB Slučaj je pacijent koji je primio antibiotik postoperativno iz bilo kog razloga
SAS i DS 2009 Informatika za istraživačeKatedra za medicinsku statistiku i informatiku
g
Očekivane frekvence i pripadajuće varijanse:Očekivane frekvence i pripadajuće varijanse:e1 = (43 + 260)(43 + 26) / 606 = 34.5e2 = (25 + 286)(25 + 14) / 612 = 19.82( )( )
Pripadajuće varijanse:v1 = (303)(303)(69)(537) / (6062)(606 – 1) = 15.3112v2 = (311)(301)(39)(573) / (6122)(612 – 1) = 9.1418.
SAS i DS 2009 Informatika za istraživačeKatedra za medicinsku statistiku i informatiku
( ) ( ) 05482.19255.3443 222 −+−
DF 1( ) ( ) 05.4
1418.93112.152 =
+=MHχ DF = 1
( ) ( )( ) ( ) 77.1
697.17378.31
////
222111
222111^
==++
=ncbncbndanda
OR MH ( ) ( )222111
Ocenjujemo da je šansa da pacijenti koji operišu bilo dojku bilo kilu a koji preoperativno nisu primili cefonicid postoperativno dobiju antibiotski tretman 1.77 puta veća u odnosu na pacijente koji su cefonicid preoperativno dobijali.
SAS i DS 2009 Informatika za istraživačeKatedra za medicinsku statistiku i informatiku