causal inference without counterfactuals -...

44
Causal Inference Without Counterfactuals 2015-11-12

Upload: ngocong

Post on 16-Dec-2018

217 views

Category:

Documents


0 download

TRANSCRIPT

Causal Inference Without Counterfactuals

2015-11-12

Alexander Philip Dawid

I Professor de Estatística na University College LondonI BayesianoI Vários artigos sobre causalidade, sendo um tema de interesse

recente (último artigo de 2015).I “My positivist world view being antipathetic to popular

explications of cause based on counterfactual variables, I havebeen investigating the extent to which sensible and meaningfulcausal inferences can be justified without recourse tocounterfactuals.”

Antecipando Conclusões

I Problemas sobre efeitos de causas são superados utilizando ateoria da decisão e não dependem de contrafactuais.

I Contrafactuais podem ser úteis como instrumento paramodelagem,

I mas não como instrumento para inferência

I Inferências sobre causas de efeitos são problemáticas eproduzem ambiguidade por princípio

I Para eliminar a ambiguidade, o único jeito é elaborar ummodelo genuinamente determinístico.

I É possível reduzir a ambiguidade medindo concomitantes eespecificando claramente o contexto do estudo.

Tipos de perguntas

Predição

I Estava com dor de cabeça e tomei um remédio. Vou melhorar?

Intervenção

I Estou com dor de cabeça. Se tomar um remédio, vou melhorar?

Contrafactual

I Estava com dor de cabeça, tomei remédio e melhorei. Se eunão tivesse tomado remédio, teria melhorado?

Tipos de causalidade

Effects of Causes

I I have a headache. Will it help if I take aspirin?

Utilizar argumentos contrafactuais é desnecessário e potencialmenteperigoso.

Causes of Effects

I My headache is gone. Is it because I took aspirin?

Utilizar argumentos contrafactuais é relevante, mas é importanteentender o que essa query significa e quais suas limitações.

Effects of causes

Exemplo (experimento)

Modelo metafísico

{(Yt(u),Yc(u)), u ∈ U}

são iid, cada par com distribuição normal bivariada com média(θt , θc), variância comum φY e correlação ρ.

I u “unidade” (episódio da dor de cabeça, ou indivíduo), u ∈ UI É metafísico pois não podemos observar simultaneamente

Yt(u) e Yc(u).

Exemplo (experimento)

Formulação alternativa

Yi(u) = θi + β(u) + γi(u)

I i tratamento (i = t tratamento, i = c placebo).I Yi(u) resposta ao tratamento i para o indivíduo u.I β é um efeito aleatório que só depende do indivíduo, com

média zero e variância φβ = ρφY .I γ é um efeito aleatório de interação entre indivíduo e tipo de

tratamento, com média zero e variância φγ = (1− ρ)φY .

Effects of causes

I Observo um novo u0. Devo dar c ou t?I Definimos ICE (Individual Causal Effect)

τ(u0) = Yt(u0)− Yc(u0) = τ + λ(u0),

com

λ(u0) = γt(u0)− γc(u0)

Effects of causes

I É possível estimar o ACE (Average Causal Effect)

τ = θt − θc ,

usando θ̂i = Y i .

Exemplo (experimento)

Modelo físicoRelabel u: ui1, ui2, . . . , uini

Xij = Yi(uij) = θi + εij ,

em que

εij = β(uij) + γi(uij)

I ρ, φβ e φγ não são identificáveis.

Modelo físico

É possível estimar τ da mesma forma: τ̂ = X t − X c .

Problemas

I Como calcular a variância?

V [τ(u0)] = 2(1− ρ)φY ,

I ρ é um parâmetro metafísico!I Como estimar a média de τ∗(u0) = Yt(u0)/Yc(u0)?

Problema geral

I É possível acessar empiricamente Pt e Pc (marginais),I mas não é possível acessar P (conjunta).I parâmetros que dependem da conjunta (ρ, φβ, φγ , τ∗) são

metafísicos.I Mesmo a suposição de que o par (Yt ,Yc) tem distribuição

normal bivariada é metafísica.

Suposições que podem ajudar

I Uniformidade (φY = 0). Estudo determinístico.I TUA (Treatment-unit additivity), τ(u) é o mesmo para todo

u ∈ U .I Implica que φγ = 0 e ρ = 1

I Monotonicidade (resposta binária), P(Yt ≥ Yc) = 1.

Todas essas suposições são metafísicas!

I Será que queremos mesmo fazer inferência sobre τ?

Solução para u0 com teoria da decisãoI L função de perda, a ser aplicada a um resultado y .I Para cada i , calcular a perda esperada EPi [L(Y )].I Escolher tratamento que resulta em menor perda esperada.

Base filosófica

Pensamento Popperiano

I “A model is not a straightforward reflection of external reality,and to propose a model is not to assert or to believe thatnature behaves in a particular way.”

I Dogmatic empiricism: theories must be expressible inempirically testable vocabulary.

Base filosófica

Lei de Jeffrey

I “mathematically distinct models that cannot be distinguishedon the basis of empirical observation should lead toindistinguishable inferences.”

I “Sheeps and goats”I Counterfactual approach has the potential to create

goats.

Base filosófica

Fatalism

I Um modelo metafísico trata os resultados Yi(u) como atributos“pré-determinados” de u.

I Como u só ocorre uma vez, fatalismo não é testávelempiricamente e, portanto, metafísico.

I Suposições TUA e monotonicidade são fatalistas porconstrução.

I SUTVA é fatalista, mas existe uma alternativa não-fatalista,aplicável com a teoria da decisão.

Base filosófica

Instrumental use of counterfactuals

I Contrafactuais para modelagem é OK em casos específicos(pode facilitar a construção).

I Contrafactuais para inferência em geral é desnecessário.

Causes of effects

Exemplo (experimento)

I Observei um novo u0, o tratamento t e o resultado Yt(u0) = y0.Como teria sido o resultado se tivéssemos aplicado c?

Exemplo (experimento)

I Agora Yt(u0) e Yc(u0) são contrafactuais, pois já observamosum resultado.

I Nesse caso, temos

λ = E [Yt(u0)− Yc(u0)|y0] = y0 − θc − ρ(y0 − θt)

Exemplo (experimento)

I Se ρ ≥ 0, temos que λ fica entre y0 − θc e θt − θcI É possível reduzir a arbitrariedade de λ com a utilização de

concomitantes.I No entanto, é “muito raro” acabar com a ambiguidade de ρ

Alternativas

I Utilização de suposições metafísicas, como TUA oumonotonicidade.

Alternativas

Utilização de concomitantes

I variáveis mensuráveis e não afetadas pelo tratamento.I Seja K um concomitante, tal que

I E [Yi |K = k] = θi + k e V [Yi |K = k] = ψK

I Além disso,I φK = V [K ] e ψ0 = φY = φK + ψK

Então

ρct|K = ρφY − φKφY − φK

= 1− (1− ρ) ψ0ψK≤ ρ

Alternativas

Utilização de concomitantes

Assim, por exemplo

V [τ(u0)|Yt(u0) = y ,K (u0) = k] = (1− ρ2ct|K )ψK

V [τ(u0)|Yt(u0) = y ,K (u0) = k] ≤ V [τ(u0)|Yt(u0) = y ]

I Queremos encontrar o concomitante que leva ao menor valorde ψK

I Ou seja, uma variável independente de i que melhor explique Yi

Alternativas

Utilização de concomitantes

Assumindo que ρct|K ≥ 0,

1− ψKψ0≤ ρ ≤ 1

Alternativas

I Modelos determinísticos Yi(u) = f (i ,D(u))I Criação de modelos pseudo-determinísticos (Pearl)

I Nesse caso, D é o resultado do conjunto de todas as variáveislatentes.

I Como D raramente é um concomitante real (mensuráveis e nãoafetadas pelo tratamento), esse tipo de análise pode levar adecisões equivocadas

Contexto

I A suposição de que concomitantes são independentes dotratamento é metafísica.

I No entanto, existe uma ligação da coleção de concomitantes aserem consideradas com o contexto em que um estudo estáinserido.

I Portanto, é possível realizar inferências restritas ao contextodas concomitantes.

Conclusões

I Inferências sobre efeitos de causas são possíveis utilizando ateoria da decisão e não dependem de contrafactuais.

I Contrafactuais podem ser úteis como instrumento paramodelagem,

I mas não como instrumento para inferência.

I Inferências sobre causas de efeitos são problemáticas eproduzem ambiguidade por princípio

I Para eliminar a ambiguidade, o único jeito é elaborar ummodelo genuinamente determinístico.

I É possível reduzir a ambiguidade medindo concomitantes eespecificando claramente o contexto do estudo.

Comentários

David R. Cox

I Questionamento quanto ao conjunto de resultados necessáriospara auferir causalidade.

I Crítica ao “Goat and sheep”, pois poderia ter mais interações.

George Casella & Stephen Schwartz

I Structure of models: restrição rígida demais, que podeatrapalhar a ciência.

I Object of inference: Usar teoria da decisão muda o objeto dainferência. O novo objeto pode ser útil, mas pode não ser oque o pesquisador deseja.

I Philosophy of inference: Popper “não está mais na moda”I Associa lei de Jeffrey com princípio da verossimilhança

Judea PearlI Modelos funcionais, com origem nos erros, criam os

contrafactuais, e não o contrário

Effects of Causes

I I have a headache. Will it help if I take aspirin?

QI = P(Yt = 1)− P(Yc = 1)

Causes of Effects

I My headache is gone. Is it because I took aspirin?

QII = P(Yc = 0|T = 1,Y = 1)

I QII tem “implicações testáveis”

Judea Pearl

I O empiricista pragmático versus o empiricista dogmáticoI A utilização instrumental do contrafactual

James Robins & Sander Greenland

I O trabalho não se aplica para estudos observacionaisI ACE não pode ser identificado num estudo observacional sem

realizar suposições não identificáveis sobre a magnitude edireção do confundimento.

I Comentários sobre o determinismo e sua utilidade na definiçãode efeitos causais, mesmo na presença de estocasticidade

I “the vagueness is not in our counterfactuals but in our attemptto make causal inferences from observational data”.

Donald Rubin

I Importante considerar os “resultados potenciais”(contrafactuais depois de observados) para dois fins: ensino epesquisa aplicada.

I Exemplo de dados censurados de acordo com um dosresultados.

Glenn Shafer

I A principal crítica é sobre a ausência de uma ligação entrecausalidade e predição

I Counterfactual = past conditionalI Dawid erra ao afirmar que para “causas de efeitos” os

contrafactuais “categóricos” são necessáriosI Questões de “causa do efeito” são bobas.I Bernoulli: Do not judge human action by what happens.

Larry Wasserman

I Defende o uso de contrafactuaisI Exemplo do paradoxo de SimpsonI Mesmas queries do Pearl (QI e QII)

Tréplica

Tréplica

I Link entre estudo observacional e unidades sob intervenção(sem permutabilidade).

I Mecanismo de probabilidade estável, no lugar de modelosfuncionais.

I Modelos podem ter implicações não testáveisI Os comentários assumem implicitamente que a linguage

contrafactual é mais rica que a linguagem baseada em teoria dadecisão

Counterfactual Dimensions

I Fact - FictionI Real - InstrumentalI Clear - VagueI Helpful - Dangerous

Comentário

I Para “effects of causes”, não precisamos interpretar o mundocomo determinístico ou não-determinístico.

I Para “causes of effects”, aparentemente, precisamos ao menospensar nisso.