introduzione allanalisi stratificata prof. roberto de marco sezione di epidemiologia &...

33
INTRODUZIONE ALL’ANALISI STRATIFICATA Prof. Roberto de Marco Sezione di Epidemiologia & Statistica Medica Università degli Studi di Verona

Upload: gioconda-rota

Post on 01-May-2015

215 views

Category:

Documents


1 download

TRANSCRIPT

Page 1: INTRODUZIONE ALLANALISI STRATIFICATA Prof. Roberto de Marco Sezione di Epidemiologia & Statistica Medica Università degli Studi di Verona

INTRODUZIONE ALL’ANALISI STRATIFICATA

Prof. Roberto de Marco

Sezione di Epidemiologia & Statistica Medica

Università degli Studi di Verona

Page 2: INTRODUZIONE ALLANALISI STRATIFICATA Prof. Roberto de Marco Sezione di Epidemiologia & Statistica Medica Università degli Studi di Verona

STRATIFICAZIONE SCOPI:

• valutare e controllare i confondenti

• valutare e descrivere i modificatori d’effetto

Exposure Disease?

Mediator

Confounder

Effect modifier

• valutare il ruolo di una covariata

Page 3: INTRODUZIONE ALLANALISI STRATIFICATA Prof. Roberto de Marco Sezione di Epidemiologia & Statistica Medica Università degli Studi di Verona

1. Confounding

• A confounding variable is associated with the exposure and it affects the outcome, but it is not an intermediate link in the chain of causation between exposure and outcome.

Alcohol Lung cancer

Smoking

Page 4: INTRODUZIONE ALLANALISI STRATIFICATA Prof. Roberto de Marco Sezione di Epidemiologia & Statistica Medica Università degli Studi di Verona

SStima corretta (aggiustata) OR=1tima corretta (aggiustata) OR=1

Drinker

Non-drinker

100 200

Lung cancer No lung cancer

50 50

50 150

example

OR=3grezzo

Drinker

Non-drinker

Lung cancer No lung cancer

45 15

30 10

Lung cancer

No lung cancer

5 35

20 140

smokers Non smokers

OR=1OR=1

Page 5: INTRODUZIONE ALLANALISI STRATIFICATA Prof. Roberto de Marco Sezione di Epidemiologia & Statistica Medica Università degli Studi di Verona

Esercizio:

Il fumo è un confodente della relazione tra consumo di alcool e tumore al

polmone perché è un determinate della malattia ed è associato all’esposizione!

L’associazione stimata condizionalmente al potenziale confondente

(entro strati del potenziale confondente) è libera da confondimento.

La stima corretta è una “media ponderata” delle stima strato-specifiche.

Verificate (e stimate) sulla base dei dati precedenti:

- l’associazione tra fumo e tumore al polmone

- l’associazione tra fumo e consumo di alcool

Page 6: INTRODUZIONE ALLANALISI STRATIFICATA Prof. Roberto de Marco Sezione di Epidemiologia & Statistica Medica Università degli Studi di Verona

VALUTAZIONE DEL CONFONDIMENTO :

stima grezza stima corretta x 100 stima corretta

confronto tra la stima grezza e la stima ‘corretta’

(ottenuta controllando l’effetto del potenziale confondente)

nell’esempio: stima grezza=3 stima corretta = 1

Intensità del confondimento-

3 1 x 100 = 200% 1

Nell’esempio

Page 7: INTRODUZIONE ALLANALISI STRATIFICATA Prof. Roberto de Marco Sezione di Epidemiologia & Statistica Medica Università degli Studi di Verona

L’analisi stratificata consiste nella:

i)Definizione degli strati in base ai livelli della covariata/e in studio;ii)Valutazione dell’associazione entro ogni strato;iii)Stima di una misura aggiustata su tutti gli strati, quando appropriato.

RR RR RR RR la covariata è: grezzo strato1 strato2 aggiustato confondente modificatore

ES1: 3.0 1.0 1.0 1.0 SI NO ES2 : 1.2 0.3 3.5 non app. NO SIES3: 2.2 1.5 4.8 3.0(?) SI SI ES4: 2.5 2.3 2.9 2.5 NO NO

Page 8: INTRODUZIONE ALLANALISI STRATIFICATA Prof. Roberto de Marco Sezione di Epidemiologia & Statistica Medica Università degli Studi di Verona

Introduzione alle stime di Mantel-Haenszel

• L’esempio mostra che non è mai appropriato utilizzare la stima di associazione grezza (marginale) in presenza di potenziali confondenti (o modificatori d’effetto) non controllati col disegno. Quindi, le misure che ci informano sula “vera” relazione tra esposizione e malattia sono quelle condizionali (aggiustate) stimate entro strati della covariata.

Page 9: INTRODUZIONE ALLANALISI STRATIFICATA Prof. Roberto de Marco Sezione di Epidemiologia & Statistica Medica Università degli Studi di Verona

Introduzione agli stimatori di Mantel-Haenszel

• Misure aggiustate:

– Caso 1: le stime condizionali (entro strato) sono differenti. In questo caso la covariata è un modificatore d’effetto. Una misura aggiustata nasconde tale effetto.

– Caso 2:le stime condizionali sono identiche o simili. La misura aggiustata è la miglior stima di associazione

Page 10: INTRODUZIONE ALLANALISI STRATIFICATA Prof. Roberto de Marco Sezione di Epidemiologia & Statistica Medica Università degli Studi di Verona

STIMATORI DI MANTEL ed HAENSZEL

Semplici stime proposte per ottenere misure di associazione aggiustatesotto l’ipotesi di effetto (associazione) uniforme negli strati.

H0:1 = 2 = ... = k = omogeneità dell’effetto tra gli strati

Definito il vero parametro di associazione tra esposizione emalattia, gli stimatori M.H sono calcolati sotto la seguente H0:

Page 11: INTRODUZIONE ALLANALISI STRATIFICATA Prof. Roberto de Marco Sezione di Epidemiologia & Statistica Medica Università degli Studi di Verona

Spermicidi

No spermicidi

100 200

Casi Controlli

4 109

12 1145

STIMATORI DI MANTEL ed HAENSZEL

casi cancer controlli

3 104

9 1059

OR=3.4

Casi Controlli

1 5

3 86

Indagine caso controllo sull’uso materno di spermicidi prima delconcepimento (Esposizione) e nascita di un bambino con sindrome di Down (outcome) con in funzione dell’età della madre (covariata)

Età della madre <35 >=35

OR=3.5

OR=5.7

Page 12: INTRODUZIONE ALLANALISI STRATIFICATA Prof. Roberto de Marco Sezione di Epidemiologia & Statistica Medica Università degli Studi di Verona

The Mantel-Haenszel Summary Odds Ratio

Exposed

Not Exposed

Case Control

a b

c d

Ti

Page 13: INTRODUZIONE ALLANALISI STRATIFICATA Prof. Roberto de Marco Sezione di Epidemiologia & Statistica Medica Università degli Studi di Verona

STIMATORE DI MH dell OR condizionale (aggiustata)

Page 14: INTRODUZIONE ALLANALISI STRATIFICATA Prof. Roberto de Marco Sezione di Epidemiologia & Statistica Medica Università degli Studi di Verona

STIMATORI DI MANTEL ed HAENSZEL

casi cancer controlli

3 104

9 1059

OR=3.4

Casi Controlli

1 5

3 86

Continuazione esempio Età della madre <35 >=35

OR=5.71175 95

Sotto HO

spermicidi

Nospermicidi

Page 15: INTRODUZIONE ALLANALISI STRATIFICATA Prof. Roberto de Marco Sezione di Epidemiologia & Statistica Medica Università degli Studi di Verona

Cochran-Mantel-Haenszel Test of Conditional Independence

• The (Cochran)-Mantel-Haenszel statistic tests the null hypothesis that exposure and disease are independent when conditioned on the confounder.

H0:1 = 2 = ... = k =

l’odds ratio è sempre uguale a 1 in tutti gli strati

Page 16: INTRODUZIONE ALLANALISI STRATIFICATA Prof. Roberto de Marco Sezione di Epidemiologia & Statistica Medica Università degli Studi di Verona

CMH test of conditional independence

 

Exposed

Unexposed

 Disease No Disease

a b

c d

Strata k

21

1

2

1 ~

)(

))](([

k

ik

k

k

ik

aVar

aEa

)1(

2*1*2*1)(

1*1)(

2

kk

kkkkk

k

kkk

NN

colcolrowrowaVar

N

colrowaE

Nk

Page 17: INTRODUZIONE ALLANALISI STRATIFICATA Prof. Roberto de Marco Sezione di Epidemiologia & Statistica Medica Università degli Studi di Verona

TEST DI MANTEL ed HAENSZEL

casi cancer controlli

3 104

9 1059

Casi Controlli

1 5

3 86

Continuazione esempio Età della madre <35 >=35

1175 95

Sperm.

NOSperm.

Page 18: INTRODUZIONE ALLANALISI STRATIFICATA Prof. Roberto de Marco Sezione di Epidemiologia & Statistica Medica Università degli Studi di Verona

IL test di MH è una misura globale di associazione tra l’esposizione e la malattia

sotto l’assunzione di uniformità del rischio nei vari strati.

L’associazione è presente quando viene rifiutata H0 (p<0.05).

Quando l’ipotesi di uniformità del rischio è palesemente violata il test e le stime di MH

non sono utilizzabili.

Page 19: INTRODUZIONE ALLANALISI STRATIFICATA Prof. Roberto de Marco Sezione di Epidemiologia & Statistica Medica Università degli Studi di Verona

Breslow-Day Testk

Come valutare l’ipotesi di uniformità dell’associazione tra i vari strati

H0:1 = 2 = ... = k =

l’odds ratio è sempre uguale a (la stima di MH) in tutti gli strati

Page 20: INTRODUZIONE ALLANALISI STRATIFICATA Prof. Roberto de Marco Sezione di Epidemiologia & Statistica Medica Università degli Studi di Verona

Breslow-Day Test

• Breslow-Day test statistics takes the form:

• Under H0, Breslow-Day test statistics has a chi-squared distribution with degrees of freedom k-1.

Page 21: INTRODUZIONE ALLANALISI STRATIFICATA Prof. Roberto de Marco Sezione di Epidemiologia & Statistica Medica Università degli Studi di Verona

Nell’esercizio sull’ utilizzo di spermicidi e nascita di un bambino con sindrome di down il test di BD:

Quindi la stima di MH è appropriata.

Page 22: INTRODUZIONE ALLANALISI STRATIFICATA Prof. Roberto de Marco Sezione di Epidemiologia & Statistica Medica Università degli Studi di Verona

Stimatori e test di MH o analoghi sono stati derivati anche per gli studi di coorte o cross-

sectional.

Qualsiasi software statistico prevede la possibilità di analisi stratificata dei dati con il calcolo dei test condizionali di indipendenza,

dei test di eterogeneità e delle stime aggiustate.

Page 23: INTRODUZIONE ALLANALISI STRATIFICATA Prof. Roberto de Marco Sezione di Epidemiologia & Statistica Medica Università degli Studi di Verona

STEP DELL’ANALISI STRATIFICATA

e

1. Calcolare ed esaminare le stime d’effetto strato-specifiche

2. Valutare la presenza di modificazione della misura d’effetto ( test statistico per l’omogeneità dell’effetto. Es test di Breslow e Day)

3a. In presenza di eterogeneità dell’effetto

riportare e descrivere le stime d’effetto strato-specifiche

stimare una misura d’effetto aggiustata per valutare l’impatto netto dell’esposizione (se le stime vanno nello stesso senso)

3b. In assenza di eterogeneità dell’effetto

calcolare una singola stima di sintesi (‘pooled’) tra gli strati

4. Test per l’indipendenza condizionale tra l’esposizione e la malattia ( es test di Mantel-Haenszel)

Page 24: INTRODUZIONE ALLANALISI STRATIFICATA Prof. Roberto de Marco Sezione di Epidemiologia & Statistica Medica Università degli Studi di Verona

peso alla nascita OR [95% Conf. Interval]

normopeso (2.5-4.2kg) 1.364683 .8719141 2.06666

sottopeso (<2.5kh) 1.956522 .4536863 6.409957

sovrappeso(>4.2kg) 3.911111 .7749241 16.0958)

Crude 1.516583 1.021686 2.196633

M-H combined 1.521609 1.055097 2.194389

Test of homogeneity (M-H) chi2 = 2.51{txt} Pr>chi2 = 0.2858

Test that combined OR = 1:

Mantel-Haenszel chi2(1) = 5.10

Pr>chi2 = 0.0239

Associazione tra eventi stressanti durante la gravidanza (lutto, di-vorzio, perdita del lavoro) e insorgenza di asma nel bambino infunzione del peso alla nascita.

Page 25: INTRODUZIONE ALLANALISI STRATIFICATA Prof. Roberto de Marco Sezione di Epidemiologia & Statistica Medica Università degli Studi di Verona

Il peso alla nascita non è un modificatore d’effetto (test perl’omogeneità dell’associazione non significativo) ne’ un confondente (la stima grezza e quella aggiustata sonosimili. L’associazione tra il verificarsi di eventi stressanti e l’insorgenza di asma nel bambino è statisticamente significativa(p<0.05 test di MH). La miglior stima dell’associazione è quellaaggiustata (MH)

Page 26: INTRODUZIONE ALLANALISI STRATIFICATA Prof. Roberto de Marco Sezione di Epidemiologia & Statistica Medica Università degli Studi di Verona

Esempio 2: Tassi di mortalità età-specifici per malattie coronariche nei medici inglesi maschi per abitudine al fumo.

[Rothman KJ & Greenland S. Modern Epidemiology. 2nd Edition. Lippincott-Raven, Philadelphia, 1998; pag. 259]

• IR ‘grezzo’ = 1.7 ( potrebbe essere confuso dall’età)

FUMATORI NON-FUMATORI

età(anni)

morti PY tasso(per 10,000 PY)

morti PY tasso(per 10,000 PY)

IRi

STRATO 1 35-44 32 52,407 6.1 2 18,790 1.1 5.7

STRATO 2 45-54 104 43,248 24.0 12 10,673 11.2 2.1

STRATO 3 55-64 206 28,612 72.0 28 5,710 49.0 1.5

STRATO 4 65-74 186 12,663 146.9 28 2,585 108.3 1.4

STRATO 5 75-84 102 5,317 191.8 31 1,462 212.0 0.9

TOTALE 630 142,247 101 39,220

Page 27: INTRODUZIONE ALLANALISI STRATIFICATA Prof. Roberto de Marco Sezione di Epidemiologia & Statistica Medica Università degli Studi di Verona

2 = per omogeneita = 10.41

p-value = prob(24 10.30 H0 vera) = 0.034

ipotesi nulla di omogeneità del rapporto fra tassi rifiutata modificazione della misura di effetto

Misura di associazione aggiustata (uquivalente a MH per dati di incidenza)

IR = 1.42

STRATO 1: IR1 = 5.7

STRATO 2: IR2 = 2.1

STRATO 3: IR2 = 1.5

STRATO 4: IR2 = 1.4

STRATO 5: IR2 = 0.9

Page 28: INTRODUZIONE ALLANALISI STRATIFICATA Prof. Roberto de Marco Sezione di Epidemiologia & Statistica Medica Università degli Studi di Verona

IN PRESENZA DI MODIFICAZIONE DELLA MISURA D’EFFETTO: RIPORTARE E DESCRIVERE LE STIME STRATO-SPECIFICHE

• non si presenta una singola stima di sintesi dell’effetto ... ( non fornisce informazioni sul pattern di variazione delle stime strato-specifiche)

… ma si riportano i risultati dell’analisi (stime e intervalli di confidenza) separatamente per ogni strato

• si può descrivere il pattern di variazione delle stime strato-specifiche tramite un modello di regressione

solo se a ciascun strato può essere assegnato un valore numerico sensato

ciascuna stima strato-specifica deve essere opportunamente pesata

Page 29: INTRODUZIONE ALLANALISI STRATIFICATA Prof. Roberto de Marco Sezione di Epidemiologia & Statistica Medica Università degli Studi di Verona

-1

0

1

2

3

4ln

(IR

i)35-44

45-5455-64 65-74

75-84

ETA’

Esempio 2 (continua):

IC95% approssimato: exp{ln(IRi) 1.96*ES[ln(IRi)]}

età (anni) IRi IC95%

35-44 5.7 1.4-23.8

45-54 2.1 1.2-3.8

55-64 1.5 1.0-2.2

65-74 1.4 0.9-2.1

75-84 0.9 0.6-1.3

IC95% esatto: 1.5-49.4

Page 30: INTRODUZIONE ALLANALISI STRATIFICATA Prof. Roberto de Marco Sezione di Epidemiologia & Statistica Medica Università degli Studi di Verona

differenza tra log(rischi relativi) per unità di cambiamento in AGEi ( passaggio da una classe di età a

quella successiva)

modello lineare pesato

wi1/2ln(IRi) = wi

1/2(a + b*AGEi) + wi1/2i

wi = 1 / VAR[ln(IRi)] = (1/A1i + 1/A0i)-1

AGEi = {1,2,3,4,5}

^

^a = 1.405

b = 0.297 (IC95%: 0.520 to 0.074)

rapporto tra rischi relativi per unità di cambiamento in AGEi

exp(b) = exp( 0.297) = 0.743 ^

-1

0

1

2

3

4

ln(I

Ri)

35-44

45-5455-64 65-74

75-84

ETA’

Page 31: INTRODUZIONE ALLANALISI STRATIFICATA Prof. Roberto de Marco Sezione di Epidemiologia & Statistica Medica Università degli Studi di Verona

ESERCIZIO

• Example: Gender Bias at Berkeley?(From: Sex Bias in Graduate Admissions: Data from Berkeley, Science 187: 398-403; 1975.)

 

 

Crude RR = (1276/1835)/(1486/2681) =1.25 (1.20 – 1.32)

Denied

Admitted

1835 2681

Female Male

1276 1486

559 1195

Page 32: INTRODUZIONE ALLANALISI STRATIFICATA Prof. Roberto de Marco Sezione di Epidemiologia & Statistica Medica Università degli Studi di Verona

Relazione tra rischio di non ammissione e sesso in funzione del corso scelto

 

 

Crude RR = 1.25 (1.20 – 1.32)

Stratum specific RR’s:A .46 (.30-.70) B 0.86 (.48-1.54)C 1.05 (.94-1.16) D 1.02 (.92-1.12)E 0.96 (.87-1.05)F 1.01 (.97-1.05)

Maentel-Haenszel Summary RR: .97

Cochran-Mantel-Haenszel Test is NS.

Page 33: INTRODUZIONE ALLANALISI STRATIFICATA Prof. Roberto de Marco Sezione di Epidemiologia & Statistica Medica Università degli Studi di Verona

Summary

 

 

Crude RR = 1.25 (1.20 – 1.32)

Stratum specific RR’s:.46 (.30-.70)

0.86 (.48-1.54)1.05 (.94-1.16) 1.02 (.92-1.12)0.96 (.87-1.05)1.01 (.97-1.05)

Breslow-Day test rejects (p=.0023)