causal inference without counterfactuals -...
TRANSCRIPT
Alexander Philip Dawid
I Professor de Estatística na University College LondonI BayesianoI Vários artigos sobre causalidade, sendo um tema de interesse
recente (último artigo de 2015).I “My positivist world view being antipathetic to popular
explications of cause based on counterfactual variables, I havebeen investigating the extent to which sensible and meaningfulcausal inferences can be justified without recourse tocounterfactuals.”
Antecipando Conclusões
I Problemas sobre efeitos de causas são superados utilizando ateoria da decisão e não dependem de contrafactuais.
I Contrafactuais podem ser úteis como instrumento paramodelagem,
I mas não como instrumento para inferência
I Inferências sobre causas de efeitos são problemáticas eproduzem ambiguidade por princípio
I Para eliminar a ambiguidade, o único jeito é elaborar ummodelo genuinamente determinístico.
I É possível reduzir a ambiguidade medindo concomitantes eespecificando claramente o contexto do estudo.
Tipos de perguntas
Predição
I Estava com dor de cabeça e tomei um remédio. Vou melhorar?
Intervenção
I Estou com dor de cabeça. Se tomar um remédio, vou melhorar?
Contrafactual
I Estava com dor de cabeça, tomei remédio e melhorei. Se eunão tivesse tomado remédio, teria melhorado?
Tipos de causalidade
Effects of Causes
I I have a headache. Will it help if I take aspirin?
Utilizar argumentos contrafactuais é desnecessário e potencialmenteperigoso.
Causes of Effects
I My headache is gone. Is it because I took aspirin?
Utilizar argumentos contrafactuais é relevante, mas é importanteentender o que essa query significa e quais suas limitações.
Exemplo (experimento)
Modelo metafísico
{(Yt(u),Yc(u)), u ∈ U}
são iid, cada par com distribuição normal bivariada com média(θt , θc), variância comum φY e correlação ρ.
I u “unidade” (episódio da dor de cabeça, ou indivíduo), u ∈ UI É metafísico pois não podemos observar simultaneamente
Yt(u) e Yc(u).
Exemplo (experimento)
Formulação alternativa
Yi(u) = θi + β(u) + γi(u)
I i tratamento (i = t tratamento, i = c placebo).I Yi(u) resposta ao tratamento i para o indivíduo u.I β é um efeito aleatório que só depende do indivíduo, com
média zero e variância φβ = ρφY .I γ é um efeito aleatório de interação entre indivíduo e tipo de
tratamento, com média zero e variância φγ = (1− ρ)φY .
Effects of causes
I Observo um novo u0. Devo dar c ou t?I Definimos ICE (Individual Causal Effect)
τ(u0) = Yt(u0)− Yc(u0) = τ + λ(u0),
com
λ(u0) = γt(u0)− γc(u0)
Effects of causes
I É possível estimar o ACE (Average Causal Effect)
τ = θt − θc ,
usando θ̂i = Y i .
Exemplo (experimento)
Modelo físicoRelabel u: ui1, ui2, . . . , uini
Xij = Yi(uij) = θi + εij ,
em que
εij = β(uij) + γi(uij)
I ρ, φβ e φγ não são identificáveis.
Problemas
I Como calcular a variância?
V [τ(u0)] = 2(1− ρ)φY ,
I ρ é um parâmetro metafísico!I Como estimar a média de τ∗(u0) = Yt(u0)/Yc(u0)?
Problema geral
I É possível acessar empiricamente Pt e Pc (marginais),I mas não é possível acessar P (conjunta).I parâmetros que dependem da conjunta (ρ, φβ, φγ , τ∗) são
metafísicos.I Mesmo a suposição de que o par (Yt ,Yc) tem distribuição
normal bivariada é metafísica.
Suposições que podem ajudar
I Uniformidade (φY = 0). Estudo determinístico.I TUA (Treatment-unit additivity), τ(u) é o mesmo para todo
u ∈ U .I Implica que φγ = 0 e ρ = 1
I Monotonicidade (resposta binária), P(Yt ≥ Yc) = 1.
Todas essas suposições são metafísicas!
I Será que queremos mesmo fazer inferência sobre τ?
Solução para u0 com teoria da decisãoI L função de perda, a ser aplicada a um resultado y .I Para cada i , calcular a perda esperada EPi [L(Y )].I Escolher tratamento que resulta em menor perda esperada.
Base filosófica
Pensamento Popperiano
I “A model is not a straightforward reflection of external reality,and to propose a model is not to assert or to believe thatnature behaves in a particular way.”
I Dogmatic empiricism: theories must be expressible inempirically testable vocabulary.
Base filosófica
Lei de Jeffrey
I “mathematically distinct models that cannot be distinguishedon the basis of empirical observation should lead toindistinguishable inferences.”
I “Sheeps and goats”I Counterfactual approach has the potential to create
goats.
Base filosófica
Fatalism
I Um modelo metafísico trata os resultados Yi(u) como atributos“pré-determinados” de u.
I Como u só ocorre uma vez, fatalismo não é testávelempiricamente e, portanto, metafísico.
I Suposições TUA e monotonicidade são fatalistas porconstrução.
I SUTVA é fatalista, mas existe uma alternativa não-fatalista,aplicável com a teoria da decisão.
Base filosófica
Instrumental use of counterfactuals
I Contrafactuais para modelagem é OK em casos específicos(pode facilitar a construção).
I Contrafactuais para inferência em geral é desnecessário.
Exemplo (experimento)
I Observei um novo u0, o tratamento t e o resultado Yt(u0) = y0.Como teria sido o resultado se tivéssemos aplicado c?
Exemplo (experimento)
I Agora Yt(u0) e Yc(u0) são contrafactuais, pois já observamosum resultado.
I Nesse caso, temos
λ = E [Yt(u0)− Yc(u0)|y0] = y0 − θc − ρ(y0 − θt)
Exemplo (experimento)
I Se ρ ≥ 0, temos que λ fica entre y0 − θc e θt − θcI É possível reduzir a arbitrariedade de λ com a utilização de
concomitantes.I No entanto, é “muito raro” acabar com a ambiguidade de ρ
Alternativas
Utilização de concomitantes
I variáveis mensuráveis e não afetadas pelo tratamento.I Seja K um concomitante, tal que
I E [Yi |K = k] = θi + k e V [Yi |K = k] = ψK
I Além disso,I φK = V [K ] e ψ0 = φY = φK + ψK
Então
ρct|K = ρφY − φKφY − φK
= 1− (1− ρ) ψ0ψK≤ ρ
Alternativas
Utilização de concomitantes
Assim, por exemplo
V [τ(u0)|Yt(u0) = y ,K (u0) = k] = (1− ρ2ct|K )ψK
V [τ(u0)|Yt(u0) = y ,K (u0) = k] ≤ V [τ(u0)|Yt(u0) = y ]
I Queremos encontrar o concomitante que leva ao menor valorde ψK
I Ou seja, uma variável independente de i que melhor explique Yi
Alternativas
I Modelos determinísticos Yi(u) = f (i ,D(u))I Criação de modelos pseudo-determinísticos (Pearl)
I Nesse caso, D é o resultado do conjunto de todas as variáveislatentes.
I Como D raramente é um concomitante real (mensuráveis e nãoafetadas pelo tratamento), esse tipo de análise pode levar adecisões equivocadas
Contexto
I A suposição de que concomitantes são independentes dotratamento é metafísica.
I No entanto, existe uma ligação da coleção de concomitantes aserem consideradas com o contexto em que um estudo estáinserido.
I Portanto, é possível realizar inferências restritas ao contextodas concomitantes.
Conclusões
I Inferências sobre efeitos de causas são possíveis utilizando ateoria da decisão e não dependem de contrafactuais.
I Contrafactuais podem ser úteis como instrumento paramodelagem,
I mas não como instrumento para inferência.
I Inferências sobre causas de efeitos são problemáticas eproduzem ambiguidade por princípio
I Para eliminar a ambiguidade, o único jeito é elaborar ummodelo genuinamente determinístico.
I É possível reduzir a ambiguidade medindo concomitantes eespecificando claramente o contexto do estudo.
David R. Cox
I Questionamento quanto ao conjunto de resultados necessáriospara auferir causalidade.
I Crítica ao “Goat and sheep”, pois poderia ter mais interações.
George Casella & Stephen Schwartz
I Structure of models: restrição rígida demais, que podeatrapalhar a ciência.
I Object of inference: Usar teoria da decisão muda o objeto dainferência. O novo objeto pode ser útil, mas pode não ser oque o pesquisador deseja.
I Philosophy of inference: Popper “não está mais na moda”I Associa lei de Jeffrey com princípio da verossimilhança
Judea PearlI Modelos funcionais, com origem nos erros, criam os
contrafactuais, e não o contrário
Effects of Causes
I I have a headache. Will it help if I take aspirin?
QI = P(Yt = 1)− P(Yc = 1)
Causes of Effects
I My headache is gone. Is it because I took aspirin?
QII = P(Yc = 0|T = 1,Y = 1)
I QII tem “implicações testáveis”
Judea Pearl
I O empiricista pragmático versus o empiricista dogmáticoI A utilização instrumental do contrafactual
James Robins & Sander Greenland
I O trabalho não se aplica para estudos observacionaisI ACE não pode ser identificado num estudo observacional sem
realizar suposições não identificáveis sobre a magnitude edireção do confundimento.
I Comentários sobre o determinismo e sua utilidade na definiçãode efeitos causais, mesmo na presença de estocasticidade
I “the vagueness is not in our counterfactuals but in our attemptto make causal inferences from observational data”.
Donald Rubin
I Importante considerar os “resultados potenciais”(contrafactuais depois de observados) para dois fins: ensino epesquisa aplicada.
I Exemplo de dados censurados de acordo com um dosresultados.
Glenn Shafer
I A principal crítica é sobre a ausência de uma ligação entrecausalidade e predição
I Counterfactual = past conditionalI Dawid erra ao afirmar que para “causas de efeitos” os
contrafactuais “categóricos” são necessáriosI Questões de “causa do efeito” são bobas.I Bernoulli: Do not judge human action by what happens.
Larry Wasserman
I Defende o uso de contrafactuaisI Exemplo do paradoxo de SimpsonI Mesmas queries do Pearl (QI e QII)
Tréplica
I Link entre estudo observacional e unidades sob intervenção(sem permutabilidade).
I Mecanismo de probabilidade estável, no lugar de modelosfuncionais.
I Modelos podem ter implicações não testáveisI Os comentários assumem implicitamente que a linguage
contrafactual é mais rica que a linguagem baseada em teoria dadecisão