põhjuslikkus ja statistika

28
Põhjuslikkus ja statistika Krista Fischer MRC Biostatistics Unit Cambridge, UK 18.6.2022 1 ESS konverents "Statistika ja eluteadused"

Upload: glenys

Post on 14-Jan-2016

35 views

Category:

Documents


4 download

DESCRIPTION

Põhjuslikkus ja statistika. Krista Fischer MRC Biostatistics Unit Cambridge, UK. M õningate selles ettekandes esitatud tõdemusteni oleme jõudnud koostöös Jack Bowden ’iga (MRC Clinical Trials Unit, UK). Põhjuslikud seosed epidemioloogias – kas ekspositsioon mõjutab tervist?. - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: Põhjuslikkus ja statistika

Põhjuslikkus ja statistika

Krista FischerMRC Biostatistics Unit

Cambridge, UK

21.4.2023 1ESS konverents "Statistika ja eluteadused"

Page 2: Põhjuslikkus ja statistika

21.4.2023 ESS konverents "Statistika ja eluteadused" 2

Mõningate selles ettekandes esitatud tõdemusteni oleme jõudnud koostöös Jack Bowden’iga (MRC Clinical Trials Unit, UK)

Page 3: Põhjuslikkus ja statistika

Põhjuslikud seosed epidemioloogias – kas ekspositsioon mõjutab tervist?– Mis on põhjuslik seos? Kas seda saab

matemaatiliselt defineerida?– Miks ja millal on meil vaja hinnata põhjuslikke

seoseid?– Randomiseerimine: kas imevahend põhjuslikkuse

kindlakstegemiseks?– Põhjuslike seoste hindamine randomiseeritud

uuringutes – mida me tegelikult hindame (ja kas see on see, mida me hinnata tahame)?

21.4.2023 3ESS konverents "Statistika ja eluteadused"

Page 4: Põhjuslikkus ja statistika

Seos X ja Y vahel: statistiline või põhjuslik?

Kaks huvipakkuvat näitajat:• X – ekspositsioon (eluviisidest või keskkonnast

tulenev riskitegur)• Y – väljundnäitaja (haigestumine, suremus)

Kaks küsimust:• Kas X ja Y vahel on seos?• Kas tunnus X mõjutab tunnust Y?Need kaks küsimust ei ole samaväärsed!

21.4.2023 4ESS konverents "Statistika ja eluteadused"

Page 5: Põhjuslikkus ja statistika

Kas X ja Y vahel on seos?

Lihtsustame ülesannet: olgu mõlemad tunnused binaarsed (väärtused 0 ja 1 vastavad ekspositsiooni/tervisetulemi puudumisele ja olemasolule)

Seos on olemas, kui P(Y=1|X=1) ≠ P(Y=1|X=0)Lihtne testida, kuid kahjuks ei näita

põhjuslikkust.

21.4.2023 5ESS konverents "Statistika ja eluteadused"

Page 6: Põhjuslikkus ja statistika

Statistiline vs põhjuslik seos

P(Y=1|X=1) ja P(Y=1|X=0)

Iseloomustavad haiguse Y esinemissagedust kahes rahvastikurühmas. Neid rühmi eristab ekspositsioon X (nt suitsetamine: jah/ei), kuid nad võivad erineda veel paljude muude näitajate poolest.

21.4.2023 6ESS konverents "Statistika ja eluteadused"

Page 7: Põhjuslikkus ja statistika

Statistiline vs põhjuslik seos vaatlusuuringutes

X - ekspositsioon Y - haigus

U – muud näitajad

?

21.4.2023 7ESS konverents "Statistika ja eluteadused"

Page 8: Põhjuslikkus ja statistika

Kuidas defineerida põhjuslikku mõju?

Kujutame ette sekkumist, mis suudaks tunnuse X väärtust muuta vastavalt soovile kas 1-ks või 0-ks kõigil indiviididel.

P(Y=1|do(X)=1): tõenäosus, et Y=1 kui tunnuse X väärtus on kogu üldkogumis seatud olema 1.

Samamoodi defineerime P(Y=1|do(X)=1)(Tähistust kasutas esimesena J. Pearl)

Üldkogumi keskmine põhjuslik mõju on nüüd defineeritav kui: ACE = P(Y=1|do(X)=1) - P(Y=1|do(X)=0)

21.4.2023 8ESS konverents "Statistika ja eluteadused"

Page 9: Põhjuslikkus ja statistika

Kuidas defineerida põhjuslikku mõju?

Üldkogumi keskmine põhjuslik mõju on defineeritav kui: ACE = P(Y=1|do(X)=1) - P(Y=1|do(X)=0)

Või, alternatiivselt defineerime nn potentsiaalsed tunnused Y(1) = Y(do(X)=1) ja Y(0) = Y(do(X)=0)

Nüüd:ACE = E[Y(1) – Y(0)]

Kas ACE on see, mida meil tegelikult vaja on?

21.4.2023 9ESS konverents "Statistika ja eluteadused"

Page 10: Põhjuslikkus ja statistika

Ekspositsiooni mõju eksponeeritutel

Vahel on mõttekam rääkida ekspositsiooni mõjust neile, kes tegelikult eksponeeritud on (meid ei huvita niivõrd see, kui palju suureneks praeguse mittesuitsetaja haiguserisk kui ta suitsetaks, vaid huvitab, kui palju väheneks suitsetaja haiguserisk kui ta ei suitsetaks).

Keskmine ekspositsiooni mõju eksponeeritutel:(Average Treatment effect in the Treated)ATT = P(Y=1|X=1) - P(Y=1|X=1,do(X)=0)

Ehk ATT = E[Y-Y(0)|X=1]

21.4.2023 10ESS konverents "Statistika ja eluteadused"

Page 11: Põhjuslikkus ja statistika

Põhjusliku mõju hindamine

ACE on teoreetiliselt hinnatav, kui X on randomiseeritav - juhuvalim üldkogumist jagatakse juhuslikkuse alusel kaheks osaks, ühele osale määratakse X=1, teisele X=0. Sellises uuringus

P(Y=1|do(X)=x) = P(Y=1|X=x).

Kahjuks ei ole selline uuring enamasti praktiliselt teostatav.

21.4.2023 11ESS konverents "Statistika ja eluteadused"

Page 12: Põhjuslikkus ja statistika

Statistiline vs põhjuslik seos ideaalses randomiseeritud uuringus

X - ekspositsioon Y - haigus

U – muud näitajad

?

R - randomiseerimine

P(Y=1|X=x) = P(Y=1|do(X)=x)

21.4.2023 12ESS konverents "Statistika ja eluteadused"

Page 13: Põhjuslikkus ja statistika

Realistlik randomiseeritud uuring I: suudetakse tagada kontrollrühma mitte-eksponeeritus,

kuid ei suudeta tagada ravirühma 100%-list eksponeeritust

Ravirühm Kontrollrühm

Sai ravimit 450/800

Ei saanud ravimit 50/200

Kokku 500/1000 250/1000

Näide (fiktiivsete andmetega): paranes/kokku

Suhteline risk ravirühmas võrreldes kontrolliga = 2 See ei ole ACE ega ATT!

21.4.2023 13ESS konverents "Statistika ja eluteadused"

Page 14: Põhjuslikkus ja statistika

Statistiline vs põhjuslik seos reaalses randomiseeritud uuringus

X - ekspositsioon Y - haigus

U – muud näitajad

?

R - randomiseerimine

P(Y=1|X=x) ≠ P(Y=1|do(X)=x)Siiski – R on instrument!

21.4.2023 14ESS konverents "Statistika ja eluteadused"

Page 15: Põhjuslikkus ja statistika

Realistlik randomiseeritud uuring I: suudetakse tagada kontrollrühma mitte-eksponeeritus,

kuid ei suudeta tagada ravirühma 100%-list eksponeeritust

Ravirühm Kontrollrühm

Sai (oleks saanud) ravimit

450/800 ?/800

Ei (oleks) saanud ravimit 50/200 ?/200

Kokku 500/1000 250/1000

Näide (fiktiivsete andmetega): paranes/kokku

21.4.2023 15ESS konverents "Statistika ja eluteadused"

Page 16: Põhjuslikkus ja statistika

Realistlik randomiseeritud uuring I: suudetakse tagada kontrollrühma mitte-eksponeeritus,

kuid ei suudeta tagada ravirühma 100%-list eksponeeritust

Ravirühm Kontrollrühm

Sai (oleks saanud) ravimit

450/800 ?/800

Ei (oleks) saanud ravimit 50/200 50/200

Kokku 500/1000 250/1000

Näide (fiktiivsete andmetega): paranes/kokku

Eeldame, et ravimi määramisel otsest mõju ei ole (nende jaoks kes ravimit ei saa)21.4.2023 16ESS konverents "Statistika ja eluteadused"

Page 17: Põhjuslikkus ja statistika

Realistlik randomiseeritud uuring I: suudetakse tagada kontrollrühma mitte-eksponeeritus,

kuid ei suudeta tagada ravirühma 100%-list eksponeeritust

Ravirühm Kontrollrühm

Sai (oleks saanud) ravimit

450/800 200/800

Ei (oleks) saanud ravimit 50/200 50/200

Kokku 500/1000 250/1000

Näide (fiktiivsete andmetega): paranes/kokku

Suhteline risk potentsiaalsete ravimisaajate hulgas: 450/200=2.25See ongi hinnang ATT-le!

21.4.2023 17ESS konverents "Statistika ja eluteadused"

Page 18: Põhjuslikkus ja statistika

Realistlik randomiseeritud uuring II: ei suudeta tagada kontrollrühma täielikku mitte-

eksponeeritust, ega ka ravirühma 100%-list eksponeeritust

Näide: Eesti postmenopausis naiste hormoonasendusravi (HR) uuring: naiste arv kallel esines 5a jooksul luumurde / naisi kokku

Suhteline risk ravirühmas võrreldes kontrolliga = 0.63, riskide vahe 0.029 ehk 2.9% See ei ole ACE ega ATT!

HR Kontrollrühm

Sai ravimit vähemalt 3kuud 38/768 (4.9%) 6/ 120 (5.0%)

Ei saanud ravimit üle 3kuu 6/ 130 (4.6%) 63/ 760 (8.3%)

Kokku 44 / 898 (4.9%) 69 / 880 (7.8%)

21.4.2023 18ESS konverents "Statistika ja eluteadused"

Page 19: Põhjuslikkus ja statistika

Näide: Eesti postmenopausis naiste hormoonasendusravi (HR) uuring: naiste arv kallel esines 5a jooksul luumurde / naisi kokku

Mida teha nendega, kes kontrollrühmas ravimit võtsid?Variandid:A Eeldada, et nende seas on ravimi mõju samasugune kui ravimivõtjatel ravimirühmasB Eeldada, et nende seas puudub ravimi määramise mõju – nii nende ekspositsiooni kui ka tulemusnäitaja tase ei sõltu sellest, kummasse rühma nad on määratud Eeldame ka endiselt, et ravimi määramise põhjuslik mõju puudub nende hulgas, kes ravimirühmas ravimit ei võtnud (Viimased kaks eeldust väidavaid, et nn põhimõttelisi vastuhakkajaid ei ole)

HR Kontrollrühm

Sai ravimit vähemalt 3kuud 38/768 (4.9%) 6/ 120 (5.0%)

Ei saanud ravimit üle 3kuu 6/ 130 (4.6%) 63/ 760 (8.3%)

Kokku 44 / 898 (4.9%) 69 / 880 (7.8%)

21.4.2023 19ESS konverents "Statistika ja eluteadused"

Page 20: Põhjuslikkus ja statistika

Mida teha nendega, kes kontrollrühmas ravimit võtsid?

Variant A viib mudelini ATT jaoks:E[Y - Y(0)| X=x, R=r] = ψx

ehk E[Y | X=x, R] – ψx = E[Y(0) | X=x, R=r] = E[Y(0) | X=x]

eeldusel, et randomiseerimine on korrektne – seega Y(0) ei sõltu randomiseerimisest

Nii osutub sobivaks selline ψ hinnang, mille korral Y- ψx ei sõltu R-st

Selle saame, kui keskmine tulemite vahe jagada keskmise ekspositsioonide vahega: ψh = (µy1 – µy0)/(µx1 – µx0)

HR uuringus ψh = -0.041 ehk -4.1%21.4.2023 20ESS konverents "Statistika ja eluteadused"

Page 21: Põhjuslikkus ja statistika

Mida teha nendega, kes kontrollrühmas ravimit võtsid?

Variant B viib mudelini “kuulekate” keskmise põhjusliku mõju (CACE-complier average causal effect) jaoks:E[Y(1) – Y(0)|X(1)=1, X(0)=0] = ψ,

Kus X(0) ja X(1) on indiviidi potentsiaalsed ekspositsioonitasemed ravi- ja kontrollrühmas.

CACE iseloomustab põhjuslikku mõju kitsamas rühmas kui ATT

Kas ja millistel eeldustel saame hinnata ekspositsiooni mõju nende hulgas, kes võtaksid ravimit siis ja ainult siis kui nad on randomiseeritud ravimirühma?

21.4.2023 21ESS konverents "Statistika ja eluteadused"

Page 22: Põhjuslikkus ja statistika

Näide: Eesti postmenopausis naiste hormoonasendusravi (HR) uuring: naiste arv kallel esines 5a jooksul luumurde / naisi kokku

HR Kontrollrühm

Oleks saanud ravimit R-st sõltumata 38/768 (4.9%)

6/ 120 (5.0%)

Saaks ravimit vaid siis kui R=1 63/ 760 (8.3%)

Ei saaks ravimit ei R=1 ega R=0 korral

6/ 130 (4.6%)

Kokku 44 / 898 (4.9%) 69 / 880 (7.8%)

21.4.2023 22ESS konverents "Statistika ja eluteadused"

Page 23: Põhjuslikkus ja statistika

Näide: Eesti postmenopausis naiste hormoonasendusravi (HR) uuring: naiste arv kallel esines 5a jooksul luumurde / naisi kokku

HR Kontrollrühm

Oleks saanud ravimit R-st sõltumata

6/122 (5.0%) 6/ 120 (5.0%)

Saaks ravimit vaid siis kui R=1

Ei saaks ravimit ei R=1 ega R=0 korral

6/ 130 (4.6%) 6/ 127 (4.6%)

Kokku 44 / 898 (4.9%) 69 / 880 (7.8%)

21.4.2023 23ESS konverents "Statistika ja eluteadused"

Page 24: Põhjuslikkus ja statistika

Näide: Eesti postmenopausis naiste hormoonasendusravi (HR) uuring: naiste arv kallel esines 5a jooksul luumurde / naisi kokku

HR Kontrollrühm

Oleks saanud ravimit R-st sõltumata

6/122 (5.0%) 6/ 120 (5.0%)

Saaks ravimit vaid siis kui R=1

32/646 (5.0%) 57/633 (9.0%)

Ei saaks ravimit ei R=1 ega R=0 korral

6/ 130 (4.6%) 6/ 127 (4.6%)

Kokku 44 / 898 (4.9%) 69 / 880 (7.8%)

CACE = - 0.04 (-4%)

21.4.2023 24ESS konverents "Statistika ja eluteadused"

Page 25: Põhjuslikkus ja statistika

CACE vs ATT

21.4.2023 25ESS konverents "Statistika ja eluteadused"

HR uuringus selgus, et

CACE = ATT = - 0.04 (-4%)

• Osutub, et ka matemaatiliselt on nii tuletatud CACE hinnang ekvivalentne eelnevalt tuletatud ATT hinnanguga!

• Sellest hoolimata tuleb silmas pidada, et eeldused ja seega ka tõlgendus sõltuvad sellest, kas hinnatavaks suuruseks on ATT või CACE.

• Analoogselt saab tuletada ka CACE ja ATT riskisuhte hinnangud ja jälle näidata, et nad on võrdsed.

• Šansisuhte hinnangud on aga erinevad!

Page 26: Põhjuslikkus ja statistika

Kokkuvõte

• Põhjuslikud seosed ei ole üheselt matemaatliselt defineeritavad

• Põhjuslikke mõjusid hinnates peaks küsima:– kas ja millise mõju hindamine on tegelikult huvi pakkuv?– Kas ja milliseid eeldusi oleme nõus tegema konkreetse

uuringu jooksul, et huvipakkuvad mõjud oleks hinnatavad?• (Nt HR uuringus ei pruugi ei eeldus A ega B kehtida!)• Hinnatud põhjuslike mõjude tõlgendus ja hinnangute valiidsus

sõltuvad tehtud eeldustest ja nende paikapidavusest

21.4.2023 26ESS konverents "Statistika ja eluteadused"

Page 27: Põhjuslikkus ja statistika

Randomiseerimine looduse poolt: Mendelian randomization

Vahel, kui randomiseeritud uuringut korraldada ei saa, võib abi olla geenidest!

Näide: teatud geneetiline mutatsioon takistab alkoholi lagundamist seedesüsteemi poolt. Teadlased on üsna veendunud, et seesama mutatsioon ei mõjuta otseselt südamehaigustesse haigestumist.

Sisuliselt käitub see geen just samamoodi nagu randomiseerimine -- muud süstemaatilist erinevust selle geeniga ja ilma selleta inimeste hulgas, peale nende erineva alkoholitarbimise taseme.

Uuringut, kus on kogutud sobivaid geeniandmeid, samuti andmeid ekspositsiooni ja väljundtunnuse kohta, saab analüüsida samamoodi kui tavalist randomiseeritud uuringut!

21.4.2023 27ESS konverents "Statistika ja eluteadused"

Page 28: Põhjuslikkus ja statistika

Kirjanduseviiteid• Pearl, J., koduleht hulga põhjusliku analüüsi alase

materjaliga http://bayes.cs.ucla.edu/jp_home.html

(seotult ka tema raamatuga “Causality”) • Sheehan, N., Didelez, V., jt. Mendelian

Randomization and Causal Inference in Observational Epidemiology, PLoS Med. 2008 August; 5(8). http://www.ncbi.nlm.nih.gov/pmc/articles/PMC2522255/?tool=pubmed

21.4.2023 28ESS konverents "Statistika ja eluteadused"