põhjuslikkus ja statistika
DESCRIPTION
Põhjuslikkus ja statistika. Krista Fischer MRC Biostatistics Unit Cambridge, UK. M õningate selles ettekandes esitatud tõdemusteni oleme jõudnud koostöös Jack Bowden ’iga (MRC Clinical Trials Unit, UK). Põhjuslikud seosed epidemioloogias – kas ekspositsioon mõjutab tervist?. - PowerPoint PPT PresentationTRANSCRIPT
![Page 1: Põhjuslikkus ja statistika](https://reader036.vdocuments.net/reader036/viewer/2022062409/568148b8550346895db5cfac/html5/thumbnails/1.jpg)
Põhjuslikkus ja statistika
Krista FischerMRC Biostatistics Unit
Cambridge, UK
21.4.2023 1ESS konverents "Statistika ja eluteadused"
![Page 2: Põhjuslikkus ja statistika](https://reader036.vdocuments.net/reader036/viewer/2022062409/568148b8550346895db5cfac/html5/thumbnails/2.jpg)
21.4.2023 ESS konverents "Statistika ja eluteadused" 2
Mõningate selles ettekandes esitatud tõdemusteni oleme jõudnud koostöös Jack Bowden’iga (MRC Clinical Trials Unit, UK)
![Page 3: Põhjuslikkus ja statistika](https://reader036.vdocuments.net/reader036/viewer/2022062409/568148b8550346895db5cfac/html5/thumbnails/3.jpg)
Põhjuslikud seosed epidemioloogias – kas ekspositsioon mõjutab tervist?– Mis on põhjuslik seos? Kas seda saab
matemaatiliselt defineerida?– Miks ja millal on meil vaja hinnata põhjuslikke
seoseid?– Randomiseerimine: kas imevahend põhjuslikkuse
kindlakstegemiseks?– Põhjuslike seoste hindamine randomiseeritud
uuringutes – mida me tegelikult hindame (ja kas see on see, mida me hinnata tahame)?
21.4.2023 3ESS konverents "Statistika ja eluteadused"
![Page 4: Põhjuslikkus ja statistika](https://reader036.vdocuments.net/reader036/viewer/2022062409/568148b8550346895db5cfac/html5/thumbnails/4.jpg)
Seos X ja Y vahel: statistiline või põhjuslik?
Kaks huvipakkuvat näitajat:• X – ekspositsioon (eluviisidest või keskkonnast
tulenev riskitegur)• Y – väljundnäitaja (haigestumine, suremus)
Kaks küsimust:• Kas X ja Y vahel on seos?• Kas tunnus X mõjutab tunnust Y?Need kaks küsimust ei ole samaväärsed!
21.4.2023 4ESS konverents "Statistika ja eluteadused"
![Page 5: Põhjuslikkus ja statistika](https://reader036.vdocuments.net/reader036/viewer/2022062409/568148b8550346895db5cfac/html5/thumbnails/5.jpg)
Kas X ja Y vahel on seos?
Lihtsustame ülesannet: olgu mõlemad tunnused binaarsed (väärtused 0 ja 1 vastavad ekspositsiooni/tervisetulemi puudumisele ja olemasolule)
Seos on olemas, kui P(Y=1|X=1) ≠ P(Y=1|X=0)Lihtne testida, kuid kahjuks ei näita
põhjuslikkust.
21.4.2023 5ESS konverents "Statistika ja eluteadused"
![Page 6: Põhjuslikkus ja statistika](https://reader036.vdocuments.net/reader036/viewer/2022062409/568148b8550346895db5cfac/html5/thumbnails/6.jpg)
Statistiline vs põhjuslik seos
P(Y=1|X=1) ja P(Y=1|X=0)
Iseloomustavad haiguse Y esinemissagedust kahes rahvastikurühmas. Neid rühmi eristab ekspositsioon X (nt suitsetamine: jah/ei), kuid nad võivad erineda veel paljude muude näitajate poolest.
21.4.2023 6ESS konverents "Statistika ja eluteadused"
![Page 7: Põhjuslikkus ja statistika](https://reader036.vdocuments.net/reader036/viewer/2022062409/568148b8550346895db5cfac/html5/thumbnails/7.jpg)
Statistiline vs põhjuslik seos vaatlusuuringutes
X - ekspositsioon Y - haigus
U – muud näitajad
?
21.4.2023 7ESS konverents "Statistika ja eluteadused"
![Page 8: Põhjuslikkus ja statistika](https://reader036.vdocuments.net/reader036/viewer/2022062409/568148b8550346895db5cfac/html5/thumbnails/8.jpg)
Kuidas defineerida põhjuslikku mõju?
Kujutame ette sekkumist, mis suudaks tunnuse X väärtust muuta vastavalt soovile kas 1-ks või 0-ks kõigil indiviididel.
P(Y=1|do(X)=1): tõenäosus, et Y=1 kui tunnuse X väärtus on kogu üldkogumis seatud olema 1.
Samamoodi defineerime P(Y=1|do(X)=1)(Tähistust kasutas esimesena J. Pearl)
Üldkogumi keskmine põhjuslik mõju on nüüd defineeritav kui: ACE = P(Y=1|do(X)=1) - P(Y=1|do(X)=0)
21.4.2023 8ESS konverents "Statistika ja eluteadused"
![Page 9: Põhjuslikkus ja statistika](https://reader036.vdocuments.net/reader036/viewer/2022062409/568148b8550346895db5cfac/html5/thumbnails/9.jpg)
Kuidas defineerida põhjuslikku mõju?
Üldkogumi keskmine põhjuslik mõju on defineeritav kui: ACE = P(Y=1|do(X)=1) - P(Y=1|do(X)=0)
Või, alternatiivselt defineerime nn potentsiaalsed tunnused Y(1) = Y(do(X)=1) ja Y(0) = Y(do(X)=0)
Nüüd:ACE = E[Y(1) – Y(0)]
Kas ACE on see, mida meil tegelikult vaja on?
21.4.2023 9ESS konverents "Statistika ja eluteadused"
![Page 10: Põhjuslikkus ja statistika](https://reader036.vdocuments.net/reader036/viewer/2022062409/568148b8550346895db5cfac/html5/thumbnails/10.jpg)
Ekspositsiooni mõju eksponeeritutel
Vahel on mõttekam rääkida ekspositsiooni mõjust neile, kes tegelikult eksponeeritud on (meid ei huvita niivõrd see, kui palju suureneks praeguse mittesuitsetaja haiguserisk kui ta suitsetaks, vaid huvitab, kui palju väheneks suitsetaja haiguserisk kui ta ei suitsetaks).
Keskmine ekspositsiooni mõju eksponeeritutel:(Average Treatment effect in the Treated)ATT = P(Y=1|X=1) - P(Y=1|X=1,do(X)=0)
Ehk ATT = E[Y-Y(0)|X=1]
21.4.2023 10ESS konverents "Statistika ja eluteadused"
![Page 11: Põhjuslikkus ja statistika](https://reader036.vdocuments.net/reader036/viewer/2022062409/568148b8550346895db5cfac/html5/thumbnails/11.jpg)
Põhjusliku mõju hindamine
ACE on teoreetiliselt hinnatav, kui X on randomiseeritav - juhuvalim üldkogumist jagatakse juhuslikkuse alusel kaheks osaks, ühele osale määratakse X=1, teisele X=0. Sellises uuringus
P(Y=1|do(X)=x) = P(Y=1|X=x).
Kahjuks ei ole selline uuring enamasti praktiliselt teostatav.
21.4.2023 11ESS konverents "Statistika ja eluteadused"
![Page 12: Põhjuslikkus ja statistika](https://reader036.vdocuments.net/reader036/viewer/2022062409/568148b8550346895db5cfac/html5/thumbnails/12.jpg)
Statistiline vs põhjuslik seos ideaalses randomiseeritud uuringus
X - ekspositsioon Y - haigus
U – muud näitajad
?
R - randomiseerimine
P(Y=1|X=x) = P(Y=1|do(X)=x)
21.4.2023 12ESS konverents "Statistika ja eluteadused"
![Page 13: Põhjuslikkus ja statistika](https://reader036.vdocuments.net/reader036/viewer/2022062409/568148b8550346895db5cfac/html5/thumbnails/13.jpg)
Realistlik randomiseeritud uuring I: suudetakse tagada kontrollrühma mitte-eksponeeritus,
kuid ei suudeta tagada ravirühma 100%-list eksponeeritust
Ravirühm Kontrollrühm
Sai ravimit 450/800
Ei saanud ravimit 50/200
Kokku 500/1000 250/1000
Näide (fiktiivsete andmetega): paranes/kokku
Suhteline risk ravirühmas võrreldes kontrolliga = 2 See ei ole ACE ega ATT!
21.4.2023 13ESS konverents "Statistika ja eluteadused"
![Page 14: Põhjuslikkus ja statistika](https://reader036.vdocuments.net/reader036/viewer/2022062409/568148b8550346895db5cfac/html5/thumbnails/14.jpg)
Statistiline vs põhjuslik seos reaalses randomiseeritud uuringus
X - ekspositsioon Y - haigus
U – muud näitajad
?
R - randomiseerimine
P(Y=1|X=x) ≠ P(Y=1|do(X)=x)Siiski – R on instrument!
21.4.2023 14ESS konverents "Statistika ja eluteadused"
![Page 15: Põhjuslikkus ja statistika](https://reader036.vdocuments.net/reader036/viewer/2022062409/568148b8550346895db5cfac/html5/thumbnails/15.jpg)
Realistlik randomiseeritud uuring I: suudetakse tagada kontrollrühma mitte-eksponeeritus,
kuid ei suudeta tagada ravirühma 100%-list eksponeeritust
Ravirühm Kontrollrühm
Sai (oleks saanud) ravimit
450/800 ?/800
Ei (oleks) saanud ravimit 50/200 ?/200
Kokku 500/1000 250/1000
Näide (fiktiivsete andmetega): paranes/kokku
21.4.2023 15ESS konverents "Statistika ja eluteadused"
![Page 16: Põhjuslikkus ja statistika](https://reader036.vdocuments.net/reader036/viewer/2022062409/568148b8550346895db5cfac/html5/thumbnails/16.jpg)
Realistlik randomiseeritud uuring I: suudetakse tagada kontrollrühma mitte-eksponeeritus,
kuid ei suudeta tagada ravirühma 100%-list eksponeeritust
Ravirühm Kontrollrühm
Sai (oleks saanud) ravimit
450/800 ?/800
Ei (oleks) saanud ravimit 50/200 50/200
Kokku 500/1000 250/1000
Näide (fiktiivsete andmetega): paranes/kokku
Eeldame, et ravimi määramisel otsest mõju ei ole (nende jaoks kes ravimit ei saa)21.4.2023 16ESS konverents "Statistika ja eluteadused"
![Page 17: Põhjuslikkus ja statistika](https://reader036.vdocuments.net/reader036/viewer/2022062409/568148b8550346895db5cfac/html5/thumbnails/17.jpg)
Realistlik randomiseeritud uuring I: suudetakse tagada kontrollrühma mitte-eksponeeritus,
kuid ei suudeta tagada ravirühma 100%-list eksponeeritust
Ravirühm Kontrollrühm
Sai (oleks saanud) ravimit
450/800 200/800
Ei (oleks) saanud ravimit 50/200 50/200
Kokku 500/1000 250/1000
Näide (fiktiivsete andmetega): paranes/kokku
Suhteline risk potentsiaalsete ravimisaajate hulgas: 450/200=2.25See ongi hinnang ATT-le!
21.4.2023 17ESS konverents "Statistika ja eluteadused"
![Page 18: Põhjuslikkus ja statistika](https://reader036.vdocuments.net/reader036/viewer/2022062409/568148b8550346895db5cfac/html5/thumbnails/18.jpg)
Realistlik randomiseeritud uuring II: ei suudeta tagada kontrollrühma täielikku mitte-
eksponeeritust, ega ka ravirühma 100%-list eksponeeritust
Näide: Eesti postmenopausis naiste hormoonasendusravi (HR) uuring: naiste arv kallel esines 5a jooksul luumurde / naisi kokku
Suhteline risk ravirühmas võrreldes kontrolliga = 0.63, riskide vahe 0.029 ehk 2.9% See ei ole ACE ega ATT!
HR Kontrollrühm
Sai ravimit vähemalt 3kuud 38/768 (4.9%) 6/ 120 (5.0%)
Ei saanud ravimit üle 3kuu 6/ 130 (4.6%) 63/ 760 (8.3%)
Kokku 44 / 898 (4.9%) 69 / 880 (7.8%)
21.4.2023 18ESS konverents "Statistika ja eluteadused"
![Page 19: Põhjuslikkus ja statistika](https://reader036.vdocuments.net/reader036/viewer/2022062409/568148b8550346895db5cfac/html5/thumbnails/19.jpg)
Näide: Eesti postmenopausis naiste hormoonasendusravi (HR) uuring: naiste arv kallel esines 5a jooksul luumurde / naisi kokku
Mida teha nendega, kes kontrollrühmas ravimit võtsid?Variandid:A Eeldada, et nende seas on ravimi mõju samasugune kui ravimivõtjatel ravimirühmasB Eeldada, et nende seas puudub ravimi määramise mõju – nii nende ekspositsiooni kui ka tulemusnäitaja tase ei sõltu sellest, kummasse rühma nad on määratud Eeldame ka endiselt, et ravimi määramise põhjuslik mõju puudub nende hulgas, kes ravimirühmas ravimit ei võtnud (Viimased kaks eeldust väidavaid, et nn põhimõttelisi vastuhakkajaid ei ole)
HR Kontrollrühm
Sai ravimit vähemalt 3kuud 38/768 (4.9%) 6/ 120 (5.0%)
Ei saanud ravimit üle 3kuu 6/ 130 (4.6%) 63/ 760 (8.3%)
Kokku 44 / 898 (4.9%) 69 / 880 (7.8%)
21.4.2023 19ESS konverents "Statistika ja eluteadused"
![Page 20: Põhjuslikkus ja statistika](https://reader036.vdocuments.net/reader036/viewer/2022062409/568148b8550346895db5cfac/html5/thumbnails/20.jpg)
Mida teha nendega, kes kontrollrühmas ravimit võtsid?
Variant A viib mudelini ATT jaoks:E[Y - Y(0)| X=x, R=r] = ψx
ehk E[Y | X=x, R] – ψx = E[Y(0) | X=x, R=r] = E[Y(0) | X=x]
eeldusel, et randomiseerimine on korrektne – seega Y(0) ei sõltu randomiseerimisest
Nii osutub sobivaks selline ψ hinnang, mille korral Y- ψx ei sõltu R-st
Selle saame, kui keskmine tulemite vahe jagada keskmise ekspositsioonide vahega: ψh = (µy1 – µy0)/(µx1 – µx0)
HR uuringus ψh = -0.041 ehk -4.1%21.4.2023 20ESS konverents "Statistika ja eluteadused"
![Page 21: Põhjuslikkus ja statistika](https://reader036.vdocuments.net/reader036/viewer/2022062409/568148b8550346895db5cfac/html5/thumbnails/21.jpg)
Mida teha nendega, kes kontrollrühmas ravimit võtsid?
Variant B viib mudelini “kuulekate” keskmise põhjusliku mõju (CACE-complier average causal effect) jaoks:E[Y(1) – Y(0)|X(1)=1, X(0)=0] = ψ,
Kus X(0) ja X(1) on indiviidi potentsiaalsed ekspositsioonitasemed ravi- ja kontrollrühmas.
CACE iseloomustab põhjuslikku mõju kitsamas rühmas kui ATT
Kas ja millistel eeldustel saame hinnata ekspositsiooni mõju nende hulgas, kes võtaksid ravimit siis ja ainult siis kui nad on randomiseeritud ravimirühma?
21.4.2023 21ESS konverents "Statistika ja eluteadused"
![Page 22: Põhjuslikkus ja statistika](https://reader036.vdocuments.net/reader036/viewer/2022062409/568148b8550346895db5cfac/html5/thumbnails/22.jpg)
Näide: Eesti postmenopausis naiste hormoonasendusravi (HR) uuring: naiste arv kallel esines 5a jooksul luumurde / naisi kokku
HR Kontrollrühm
Oleks saanud ravimit R-st sõltumata 38/768 (4.9%)
6/ 120 (5.0%)
Saaks ravimit vaid siis kui R=1 63/ 760 (8.3%)
Ei saaks ravimit ei R=1 ega R=0 korral
6/ 130 (4.6%)
Kokku 44 / 898 (4.9%) 69 / 880 (7.8%)
21.4.2023 22ESS konverents "Statistika ja eluteadused"
![Page 23: Põhjuslikkus ja statistika](https://reader036.vdocuments.net/reader036/viewer/2022062409/568148b8550346895db5cfac/html5/thumbnails/23.jpg)
Näide: Eesti postmenopausis naiste hormoonasendusravi (HR) uuring: naiste arv kallel esines 5a jooksul luumurde / naisi kokku
HR Kontrollrühm
Oleks saanud ravimit R-st sõltumata
6/122 (5.0%) 6/ 120 (5.0%)
Saaks ravimit vaid siis kui R=1
Ei saaks ravimit ei R=1 ega R=0 korral
6/ 130 (4.6%) 6/ 127 (4.6%)
Kokku 44 / 898 (4.9%) 69 / 880 (7.8%)
21.4.2023 23ESS konverents "Statistika ja eluteadused"
![Page 24: Põhjuslikkus ja statistika](https://reader036.vdocuments.net/reader036/viewer/2022062409/568148b8550346895db5cfac/html5/thumbnails/24.jpg)
Näide: Eesti postmenopausis naiste hormoonasendusravi (HR) uuring: naiste arv kallel esines 5a jooksul luumurde / naisi kokku
HR Kontrollrühm
Oleks saanud ravimit R-st sõltumata
6/122 (5.0%) 6/ 120 (5.0%)
Saaks ravimit vaid siis kui R=1
32/646 (5.0%) 57/633 (9.0%)
Ei saaks ravimit ei R=1 ega R=0 korral
6/ 130 (4.6%) 6/ 127 (4.6%)
Kokku 44 / 898 (4.9%) 69 / 880 (7.8%)
CACE = - 0.04 (-4%)
21.4.2023 24ESS konverents "Statistika ja eluteadused"
![Page 25: Põhjuslikkus ja statistika](https://reader036.vdocuments.net/reader036/viewer/2022062409/568148b8550346895db5cfac/html5/thumbnails/25.jpg)
CACE vs ATT
21.4.2023 25ESS konverents "Statistika ja eluteadused"
HR uuringus selgus, et
CACE = ATT = - 0.04 (-4%)
• Osutub, et ka matemaatiliselt on nii tuletatud CACE hinnang ekvivalentne eelnevalt tuletatud ATT hinnanguga!
• Sellest hoolimata tuleb silmas pidada, et eeldused ja seega ka tõlgendus sõltuvad sellest, kas hinnatavaks suuruseks on ATT või CACE.
• Analoogselt saab tuletada ka CACE ja ATT riskisuhte hinnangud ja jälle näidata, et nad on võrdsed.
• Šansisuhte hinnangud on aga erinevad!
![Page 26: Põhjuslikkus ja statistika](https://reader036.vdocuments.net/reader036/viewer/2022062409/568148b8550346895db5cfac/html5/thumbnails/26.jpg)
Kokkuvõte
• Põhjuslikud seosed ei ole üheselt matemaatliselt defineeritavad
• Põhjuslikke mõjusid hinnates peaks küsima:– kas ja millise mõju hindamine on tegelikult huvi pakkuv?– Kas ja milliseid eeldusi oleme nõus tegema konkreetse
uuringu jooksul, et huvipakkuvad mõjud oleks hinnatavad?• (Nt HR uuringus ei pruugi ei eeldus A ega B kehtida!)• Hinnatud põhjuslike mõjude tõlgendus ja hinnangute valiidsus
sõltuvad tehtud eeldustest ja nende paikapidavusest
21.4.2023 26ESS konverents "Statistika ja eluteadused"
![Page 27: Põhjuslikkus ja statistika](https://reader036.vdocuments.net/reader036/viewer/2022062409/568148b8550346895db5cfac/html5/thumbnails/27.jpg)
Randomiseerimine looduse poolt: Mendelian randomization
Vahel, kui randomiseeritud uuringut korraldada ei saa, võib abi olla geenidest!
Näide: teatud geneetiline mutatsioon takistab alkoholi lagundamist seedesüsteemi poolt. Teadlased on üsna veendunud, et seesama mutatsioon ei mõjuta otseselt südamehaigustesse haigestumist.
Sisuliselt käitub see geen just samamoodi nagu randomiseerimine -- muud süstemaatilist erinevust selle geeniga ja ilma selleta inimeste hulgas, peale nende erineva alkoholitarbimise taseme.
Uuringut, kus on kogutud sobivaid geeniandmeid, samuti andmeid ekspositsiooni ja väljundtunnuse kohta, saab analüüsida samamoodi kui tavalist randomiseeritud uuringut!
21.4.2023 27ESS konverents "Statistika ja eluteadused"
![Page 28: Põhjuslikkus ja statistika](https://reader036.vdocuments.net/reader036/viewer/2022062409/568148b8550346895db5cfac/html5/thumbnails/28.jpg)
Kirjanduseviiteid• Pearl, J., koduleht hulga põhjusliku analüüsi alase
materjaliga http://bayes.cs.ucla.edu/jp_home.html
(seotult ka tema raamatuga “Causality”) • Sheehan, N., Didelez, V., jt. Mendelian
Randomization and Causal Inference in Observational Epidemiology, PLoS Med. 2008 August; 5(8). http://www.ncbi.nlm.nih.gov/pmc/articles/PMC2522255/?tool=pubmed
21.4.2023 28ESS konverents "Statistika ja eluteadused"