regresi logistik modul

35
MODUL MATA KULIAH ANALISIS MULTIVARIAT APLIKASI REGRESI LOGISTIK Oleh Prof. Dr. dr. RIZANDA MACHMUD, M.Kes PROGRAM STUDI S3 KEDOKTERAN FAKULTAS KEDOKTERAN PROGRAM PASCASARJANA UNIVERSITAS ANDALAS

Upload: gopi1995

Post on 05-Dec-2015

273 views

Category:

Documents


9 download

DESCRIPTION

idn

TRANSCRIPT

Page 1: Regresi Logistik Modul

MODUL MATA KULIAH

ANALISIS MULTIVARIAT APLIKASI REGRESI LOGISTIK

Oleh

Prof. Dr. dr. RIZANDA MACHMUD, M.Kes

PROGRAM STUDI S3 KEDOKTERAN FAKULTAS KEDOKTERAN

PROGRAM PASCASARJANA UNIVERSITAS ANDALAS

Page 2: Regresi Logistik Modul

2

DAFTAR ISI

DAFTAR ISI .......................................................................................................... 2

I. PENGANTAR REGRESI LOGISTIK .............................................................. 3

II. MODEL REGRESI LOGISTIK ....................................................................... 4

III. STUDY DESIGN ISSUE............................................................................. 5

IV. STRATEGI PEMODELAN REGRESI LOGISTIK ....................................... 6

1. MODEL PREDIKSI ................................................................................. 7

2. MODEL ESTIMASI ............................................................................... 23

DAFTAR PUSTAKA ............................................................................................ 35

Page 3: Regresi Logistik Modul

3

I. PENGANTAR REGRESI LOGISTIK

Analisis regresi logistik adalah suatu pendekatan model matematis yang

dapat digunakan untuk menggambarkan hubungan antara banyak variabel

independen dengan variabel dependen yang bersifat dikotomus. Variabel

independen dapat bertipe apa saja, dan asumsi distribusi variabel adalah bebas

(Kleinbaum, 1996).

Fungsi logistik merupakan fungsi matematik dengan rumus:

ƒ(z) = ze1

1

Saat ini modelling prosedur dengan menggunakan regressi logistik paling

populer dibandingkan modelling prosedur lainnya yang digunakan untuk anlisa

epidemioligik bila ukuran penyakit yang digunakan adalah dikotomus.

Penjelasannya adalah sebagai berikut:

Terlihat pada gambar fungsi logistik terletak pada nilai z antara -∞ dan +∞.

Pada saat nilai z= -∞ maka ƒ(z) =0 dan pada saat z= +∞ maka ƒ(z) =1

Jadi nilai ƒ(z) akan berkisar antara 0 dan1. Sehingga model logistik dapat

digunakan untuk menggambarkan probabilitas yang selalu memiliki nilai antara 0

dan 1. Pada epidemiologi, probabilitas ini dikenal sebagai risiko untuk terjadinya

penyakit.

Alasan lainnya mengapa fungsi logistik ini populer untuk analisis data

epidemiologik adalah bentuk dari kurva logistik. Seperti terlihat pada gambar,

nilai ƒ(z) meningkat secara perlahan pada saat z berubah dari -∞ ke arah 0,

kemudian ƒ(z) meningkat secara cepat dan kemudian peningkatannya kembali

perlahan pada saat ƒ(z) mendekati 1 ketika z meningkat menjadi +∞. Hasilnya

adalah kurva yang berbentuk S.

Kurva yang berbentuk S ini dianggap cocok untuk menggambarkan

peningkatan risiko terjadinya outcome pada penelitia epidemiologi, jikaz

dianggap sebagai indeks yang menggabungkan efek dari berbagai faktor risiko

dan ƒ(z) merupakan risiko pada nilai z tertentu. Bentuk kurva S menunjukkan

Page 4: Regresi Logistik Modul

4

efek z pada risiko individu minimal pada nilai z kecil sampai pada satu batas

ambang tertentu dan tetap tinggi saat risiko mendekati 1 dan nilai z cukup besar.

Menurut ahli epidemiologi, konsep ambang batas (threshold) ini dapat

digunakan pada berbagai keadaan penyakit. Jadi bentuk kurva logistik dapat

digunakan secara luas pada analisis multivariabel pada penelitian epidemiologi.

1

ƒ(z) = ze1

1=0 ½ ƒ(z) =

ze1

1=1

- ∞ 0 +∞

Z

threshold

Range : 0 ≤ ƒ(z) ≤ 1

Individual risk : 0 ≤ probability ≤ 1

II. MODEL REGRESI LOGISTIK

Model regresi logistik dituliskan dalam bentuk penjumlahan linier yaitu:

Z = α +β1X1 + β2X2 + …+βkXk

dimana X1,X2 dan Xk merupakan variabel independen. Jadi z merupakan

indeks yang menggabungkan x. Kemudian nilai z pada fungsi logistik diganti

penjumlahan linier sehingga fungsi logistik dapat dituliskan:

Page 5: Regresi Logistik Modul

5

ƒ(z) = )....( 22111

1kke

Dimana f(z) merupakan probabilitas untuk terjadinya suatu keluaran. Pada

penelitian kesehatan, probabilitas ini untuk terjadinya penyakit (1) atau tidak

terjadinya penyakit (0) pada kombinasi variabel independen. Jadi fungsi logistik

dapat dituliskan sebagai berikut:

P(D) = ).....( 22111

1kke

Pada model logistik, α dan βi merupakan parameter yang tidak diketahui

yang perlu di estimasi dengan menggunakan data yang ada. Estimasi parameter

dilakukan dengan menggunakan metode maximum likelihood dengan fungsi

likelihood:

L =

n

l

il

k

i

i

n

l

il

k

i

i

1 1

1 1

exp1

exp

Estimasi parameter terlalu kompleks untuk dilakukan dengan perhitungan

manual, sehingga perhitungan dilakukan dengan perangkat lunak statistik.

Hasil turunan matematik pada fungsi logistik menunjukkan bahwa ekponen β i

adalah OR.

III. STUDY DESIGN ISSUE

Analisis regresi logistik digunakan pada disain cohort, dan dapat juga pada

disain case control maupun pada cross sectional. Meskipun logistik modelling

dapat digunakan untuk disain case control dan cross sectional, tapi terdapat

keterbatasan analisa untuk disain ini. Pada disain kohort, model logistik dapat

digunakan untuk memprediksi risiko individual, tapi pada disain case control dan

cross sectional kita tidak memprediksi individual risk, hanya bisa memakai hasil

estimasi OR saja.

Page 6: Regresi Logistik Modul

6

Tabel penggunaan interpretasi Interpretasi cohort Case control Cross sectional

P (D) ya tidak tidak

OR ya ya ya

IV. STRATEGI PEMODELAN REGRESI LOGISTIK

Ada secara tipikal 2 tujuan (goals) dalam mathematical modeling pada regresi

logistik:

1. untuk mendapatkan valid estimasi dari hubungan suatu exposure-

penyakit, disebut model Estimasi

2. untuk mendapatkan model prediksi yang dianggap terbaik untuk

memprediksi kejadian variabel dependen (outcome), disebut model

Prediksi

Tergantung dari tujuan peneliti, maka strategi yang digunakan juga berbeda

untuk masing-masing tujuan (different strategies for different goals).

Pada tabel akan dijelaskan lebih lanjut perbedaan kedua model tersebut.

Tabel Perbedaan model prediksi dan model estimasi

Perbedaan

Model Prediksi

Model Estimasi

Kedudukan variabel pada model

semua variabel dianggap sama penting, sehingga dapat dilakukan estimasi beberapa koefisien sekaligus

diutamakan adalah nilai koefisien regresi suatu determinan yang ingin dipelajari, sedangkan variabel lain dipertimbangkan sebagai kontrol.

Bentuk model

Model yang paling tepat dan paling sederhana (parsimoni)

Modelnya relatif lebih kaya dibandingkan model prediksi

Page 7: Regresi Logistik Modul

7

Hal penting yang harus diperhatikan pada waktu kita melakukan strategi

pemodelan adalah sebagai berikut:

Kita harus melakukan check untuk kemungkinan terjadinya

multicollinearity.

Juga harus diperhatikan Influential observation. Individual data dapat

mempengaruhi koefisien regresi, seperti contoh outlier. Koefisien dapat

berubah bila outlier dikeluarkan dari analisis.

Bila variabel independen memiliki kategori lebih dari 2 kategori, maka

variabel tersebut disebut variabel dummy, pada analisa harus dilakukan

kategorisasi. Akibat bila tidak dilakukan pengkategorian, hubungan antara

variabel dependen dan independen (OR) dianalisakan sebagai numerik

bukan kelompok, ini dapat menimbulkan salah interpretasi. Cara

pengkategorian akan dijelaskan pada contoh latihan.

Identifikasi untuk variabel independen yang kontinu, adalah mengganti

variabel kontinyu dengan variabel yang bersifat kategorikal. Pembagian ini

berdasarkan pembagian kuartil dan kemudian dilakukan plotting koefisien

estimasi dengan titik tengah kuartil. Kalau dianggap tidak linier, maka

dianjurkan untuk dirubah menjadi dikotom atau tetap sebagai variabel

kontinyu kalau hanya bertindak sebagai variabel kontrol.

Untuk variabel yang bersifat kontinyu, diusahakan agar data/nilai variabel

tidak dalam bentuk desimal. Karena OR yang terbentuk, akan

diperhitungkan sesuai kenaikan per desimal tersebut. Dampaknya nilai

OR akan menjadi besar dalam bentuk ratusan atau ribuan.

1. MODEL PREDIKSI

Ketika tujuannya adalah untuk prediksi, maka bisa menggunakan computer

algorithms, seperti backward elimination atau semua kemungkinan regression,

sesuai dengan paket yang ada dalam komputer.

Langkah-langkah yang dilakukan dalam memprediksi model adalah :

Page 8: Regresi Logistik Modul

8

Mencari covariat potensial yang akan dimasukkan kedalam model dengan

cara melakukan screening untuk menseleksi variabel

a. Variabel kategori menggunakan uji crosstab

b. Variabel kontinyu menggunakan uji t

analisis bivariat masing-masing variabel independen dengan variabel

dependen, bila nilai p yang didapat < 0.25 dimasukkan sebagai covariat

potensial. Kriteria ini ditetapkan berdasarkan pengalaman empirik,

penggunaan nilai α yang lazim 0.05 seringkali tidak berhasil

mengidentifikasikan variabel yang dianggap penting.

Maka terbentuk variabel yang akan masuk kedalam candidat model.

Model ini disebut juga sebagai main effects model.

Melakukan pemilihan variabel dengan memasukkan semua variabel yang

telah terpilih sebagai candidat model.

Pemilihan variabel yang dilakukan dalam memilih variabel dapat dilakukan

dengan 2 cara (tersedia dalam paket komputer), seperti:

a. Pemilihan dengan manual; Enter

b. Pemilihan variabel oleh komputer; Forward, Backward dan

Stepwise

Kesemua cara ini memiliki tujuan yang sama yaitu mendapatkan model

yang parsimoni. Kecenderungan peneliti adalah memilih dengan metode

enter, karena peneliti dapat memilih variabel yang masuk atau

mengeluarkan variabel yang bisa diterangkan secara substantif keilmuan.

Untuk pemilihan variabel dengan komputer, setelah kita masukkan

seluruh candidat model maka akan keluar langsung hasil model yang

parsimonimenurut komputer. Untuk selanjutnya akan dibicarakan dengan

cara enter.

Dari model yang lengkap kemudian secara bertahap dihilangkan satu

persatu variabel yang memiliki nilai p > 0.05, dimulai dari variabel dengan

nilai p tertinggi. Model di run kembali sehingga didapatkan masing-masing

variabel memiliki nilai p yang < 0.05

Page 9: Regresi Logistik Modul

9

Dilakukan test interaksi berdasarkan substansi. Dari model yang telah

ada, dilakukan satu persatu kemungkinan adanya interaksi. Lakukan

pemilihan variabel interaksi seperti langkah diatas.

Terbentuk model regresi logistik yang diinginkan

CONTOH PEMODELAN PREDIKSI

Model untuk mengetahui faktor risiko terjadinya penyakit jantung koroner, data

yang digunakan adalah data CHD.

Tujuan penelitian

ingin mengetahui faktor risiko terjadinya penyakit jantung koroner .

Kerangka konsep :

Age Race Smoke High Cholesterol Coronary Heart Disease Hypertension Diabetes Mellitus Number of exercise Weight

Diperiksa dahulu apakah terdapat multikolinieritas antar variabel

dependen, dengan melihat nilai r

Page 10: Regresi Logistik Modul

10

Nilai r seluruhnya < 0.8 Tidak ada korelasi yang lebih dari 0.8, sehingga koliniearitas bukan masalah serius

Mencari covariat potensial yang akan dimasukkan kedalam model dengan

cara melakukan screening untuk menseleksi variabel

a. Variabel kategori menggunakan uji crosstab yaitu : race, smoke

high cholesterol

SCREENING CANDIDAT MODEL

Variabel kategori race

smoking

Correlations

1 .236** .181*

. .001 .010

200 200 200

.236** 1 .142*

.001 . .044

200 200 200

.181* .142* 1

.010 .044 .

200 200 200

Pearson Correlation

Sig. (2-tailed)

N

Pearson Correlation

Sig. (2-tailed)

N

Pearson Correlation

Sig. (2-tailed)

N

Age

Number of

exercises/week

WEIGHT1

Age

Number of

exercises/

week WEIGHT1

Correlation is signif icant at the 0.01 level (2-tailed).**.

Correlation is signif icant at the 0.05 level (2-tailed).*.

Chi-Square Tests

5.593a 2 .061

5.529 2 .063

2.790 1 .095

200

Pearson Chi-Square

Likelihood Ratio

Linear-by-Linear

Association

N of Valid Cases

Value df

Asy mp. Sig.

(2-sided)

0 cells (.0%) hav e expected count less than 5. The

minimum expected count is 9.75.

a.

Page 11: Regresi Logistik Modul

11

high cholesterol

hypertension

diabetes melitus

Chi-Square Tests

6.569b 1 .010

5.806 1 .016

6.520 1 .011

.014 .008

6.536 1 .011

200

Pearson Chi-Square

Continuity Correctiona

Likelihood Ratio

Fisher's Exact Test

Linear-by-Linear

Association

N of Valid Cases

Value df

Asy mp. Sig.

(2-sided)

Exact Sig.

(2-sided)

Exact Sig.

(1-sided)

Computed only for a 2x2 tablea.

0 cells (.0%) have expected count less than 5. The minimum expected count is

26.65.

b.

Chi-Square Tests

15.629b 1 .000

14.043 1 .000

14.637 1 .000

.000 .000

15.551 1 .000

200

Pearson Chi-Square

Continuity Correctiona

Likelihood Ratio

Fisher's Exact Test

Linear-by-Linear

Association

N of Valid Cases

Value df

Asy mp. Sig.

(2-sided)

Exact Sig.

(2-sided)

Exact Sig.

(1-sided)

Computed only for a 2x2 tablea.

0 cells (.0%) have expected count less than 5. The minimum expected count is

10.40.

b.

Chi-Square Tests

3.884b 1 .049

2.732 1 .098

3.600 1 .058

.060 .053

3.864 1 .049

200

Pearson Chi-Square

Continuity Correctiona

Likelihood Ratio

Fisher's Exact Test

Linear-by-Linear

Association

N of Valid Cases

Value df

Asy mp. Sig.

(2-sided)

Exact Sig.

(2-sided)

Exact Sig.

(1-sided)

Computed only for a 2x2 tablea.

1 cells (25.0%) have expected count less than 5. The minimum expected count is

3.90.

b.

Page 12: Regresi Logistik Modul

12

Tabel hasil uji bivariat variabel independen kategori dengan CHD

Variabel Independen Kategorik

Hasil screening nilai P

1. Race 2. Smoke 3. Cholesterol 4. Hipertension 5. Diabetes melitus

0.061 0.08 0.00

0.053 0.078

Semua terpilih sebagai variabel kandidat dalam model karena nilai p<0.25

b. Variabel kontinyu menggunakan uji t yaitu; age, number dan weight

variabel kontinyu

Chi-Square Tests

2.681b 1 .102

2.041 1 .153

2.570 1 .109

.143 .078

2.667 1 .102

200

Pearson Chi-Square

Continuity Correctiona

Likelihood Ratio

Fisher's Exact Test

Linear-by-Linear

Association

N of Valid Cases

Value df

Asy mp. Sig.

(2-sided)

Exact Sig.

(2-sided)

Exact Sig.

(1-sided)

Computed only for a 2x2 tablea.

0 cells (.0%) have expected count less than 5. The minimum expected count is

10.07.

b.

Independent Samples Test

3.824 .052 1.575 198 .117 1.25 .796 -.316 2.823

1.692 152.544 .093 1.25 .741 -.210 2.717

2.409 .122 2.655 198 .009 59.92 22.564 15.420 104.415

2.858 153.223 .005 59.92 20.963 18.504 101.331

.037 .848 1.197 198 .233 .19 .159 -.123 .504

1.226 134.605 .222 .19 .155 -.117 .497

Equal variances

assumed

Equal variances

not assumed

Equal variances

assumed

Equal variances

not assumed

Equal variances

assumed

Equal variances

not assumed

Age

WEIGHT1

Number of

exercises/week

F Sig.

Levene's Test f or

Equality of Variances

t df Sig. (2-tailed)

Mean

Dif f erence

Std. Error

Dif f erence Lower Upper

95% Conf idence

Interv al of the

Dif f erence

t-test for Equality of Means

Page 13: Regresi Logistik Modul

13

Tabel hasil uji bivariat variabel independen kontinyu dengan CHD

Variabel Independen Kontinyu

Hasil screening nilai P

1. Age 2. number of exercise 3. weight

0.117 0.233 0.09

Semua variabel kontinyu terpilih dalam model karena memiliki nilai p>0.25

Maka terbentuk variabel yang akan masuk kedalam candidat model.

Model ini disebut juga sebagai main effects model.

Melakukan pemilihan variabel dengan memasukkan semua variabel yang

telah terpilih sebagai candidat model.

Jangan lupa bahwa variabel race memiliki kategori lebih dari 2 (variabel

dummy), sehingga harus dilakukan kategori, reference group adalah first.

Dari model yang lengkap kemudian secara bertahap dihilangkan satu

persatu variabel yang memiliki nilai p > 0.05, dimulai dari variabel dengan

nilai p tertinggi. Model di run kembali sehingga didapatkan masing-masing

variabel memiliki nilai p yang < 0.05

PEMILIHAN MODEL DENGAN METODE ENTER

Number of exercise dikeluarkan

Variables in the Equation

-.037 .038 .984 1 .321 .963

8.078 2 .018

1.371 .498 7.576 1 .006 3.940

.749 .442 2.875 1 .090 2.115

.849 .398 4.558 1 .033 2.337

1.377 .453 9.243 1 .002 3.964

1.805 .712 6.433 1 .011 6.083

.408 .445 .842 1 .359 1.504

-.008 .174 .002 1 .962 .992

-.003 .001 5.987 1 .014 .997

.962 1.202 .641 1 .423 2.618

AGE

RACE

RACE(1)

RACE(2)

SMOKE

CHOL

HT

DM

EXER

WEIGHT1

Constant

Step

1a

B S.E. Wald df Sig. Exp(B)

Variable(s) entered on step 1: AGE, RACE, SMOKE, CHOL, HT, DM, EXER, WEIGHT1.a.

Page 14: Regresi Logistik Modul

14

Diabetes melitus dikeluarkan

Age dikeluarkan

Tabel hasil pemilihan variabel yang dikeluarkan

Variabel yang dikeluarkan

P value

1. Exercise 2. Diabetes Mellitus 3. Age

0.960 0.357 0.259

Dilakukan test interaksi berdasarkan substansi. Dari model yang telah

ada, dilakukan satu persatu kemungkinan adanya interaksi. Lakukan

pemilihan variabel interaksi seperti langkah diatas.

Variables in the Equation

-.038 .037 1.031 1 .310 .963

8.148 2 .017

1.372 .497 7.610 1 .006 3.945

.752 .439 2.936 1 .087 2.120

.851 .395 4.640 1 .031 2.342

1.377 .453 9.242 1 .002 3.963

1.808 .709 6.504 1 .011 6.101

.409 .444 .850 1 .357 1.506

-.003 .001 6.034 1 .014 .997

.963 1.201 .644 1 .422 2.621

AGE

RACE

RACE(1)

RACE(2)

SMOKE

CHOL

HT

DM

WEIGHT1

Constant

Step

1a

B S.E. Wald df Sig. Exp(B)

Variable(s) entered on step 1: AGE, RACE, SMOKE, CHOL, HT, DM, WEIGHT1.a.

Variables in the Equation

-.041 .037 1.276 1 .259 .959

7.939 2 .019

1.346 .498 7.315 1 .007 3.842

.756 .436 3.007 1 .083 2.129

.860 .394 4.776 1 .029 2.364

1.434 .450 10.165 1 .001 4.197

1.745 .707 6.097 1 .014 5.725

-.003 .001 6.137 1 .013 .997

1.139 1.178 .935 1 .334 3.125

AGE

RACE

RACE(1)

RACE(2)

SMOKE

CHOL

HT

WEIGHT1

Constant

Step

1a

B S.E. Wald df Sig. Exp(B)

Variable(s) entered on step 1: AGE, RACE, SMOKE, CHOL, HT, WEIGHT1.a.

Page 15: Regresi Logistik Modul

15

PEMILIHAN VARIABEL INTERAKSI

Variables in the Equation

3.663 2 .160

1.157 .752 2.367 1 .124 3.180

1.032 .579 3.178 1 .075 2.807

.990 .579 2.922 1 .087 2.690

1.384 .443 9.755 1 .002 3.993

1.752 .728 5.794 1 .016 5.764

-.004 .001 6.681 1 .010 .996

2.185 2 .335

.696 1.039 .449 1 .503 2.007

-.904 .903 1.002 1 .317 .405

.223 1.036 .046 1 .829 1.250

RACE

RACE(1)

RACE(2)

SMOKE

CHOL

HT

WEIGHT1

RACE * SMOKE

RACE(1) by SMOKE

RACE(2) by SMOKE

Constant

Step

1a

B S.E. Wald df Sig. Exp(B)

Variable(s) entered on step 1: RACE, SMOKE, CHOL, HT, WEIGHT1, RACE * SMOKE .a.

Variables in the Equation

10.666 2 .005

1.694 .533 10.099 1 .001 5.440

.889 .470 3.575 1 .059 2.433

.829 .392 4.469 1 .035 2.292

1.765 .622 8.040 1 .005 5.842

1.788 .720 6.158 1 .013 5.975

-.004 .001 7.425 1 .006 .996

1.860 2 .395

-1.760 1.302 1.829 1 .176 .172

-.550 .944 .340 1 .560 .577

.315 .955 .108 1 .742 1.370

RACE

RACE(1)

RACE(2)

SMOKE

CHOL

HT

WEIGHT1

CHOL * RACE

CHOL by RACE(1)

CHOL by RACE(2)

Constant

Step

1a

B S.E. Wald df Sig. Exp(B)

Variable(s) entered on step 1: RACE, SMOKE, CHOL, HT, WEIGHT1, CHOL * RACE .a.

Variables in the Equation

7.915 2 .019

1.372 .515 7.096 1 .008 3.942

.787 .435 3.278 1 .070 2.197

.873 .393 4.935 1 .026 2.395

1.327 .440 9.080 1 .003 3.769

1.596 1.033 2.387 1 .122 4.932

-.004 .001 7.133 1 .008 .996

.190 2 .910

.727 1.735 .175 1 .675 2.068

.050 1.612 .001 1 .975 1.052

.403 .968 .174 1 .677 1.497

RACE

RACE(1)

RACE(2)

SMOKE

CHOL

HT

WEIGHT1

HT * RACE

HT by RACE(1)

HT by RACE(2)

Constant

Step

1a

B S.E. Wald df Sig. Exp(B)

Variable(s) entered on step 1: RACE, SMOKE, CHOL, HT, WEIGHT1, HT * RACE .a.

Page 16: Regresi Logistik Modul

16

Variables in the Equation

1.751 2 .417

1.613 2.009 .645 1 .422 5.019

2.717 2.153 1.592 1 .207 15.131

.882 .392 5.048 1 .025 2.415

1.350 .439 9.461 1 .002 3.856

1.684 .708 5.661 1 .017 5.385

-.003 .002 2.109 1 .146 .997

.872 2 .646

.000 .003 .014 1 .904 1.000

-.003 .004 .832 1 .362 .997

-.200 1.302 .024 1 .878 .819

RACE

RACE(1)

RACE(2)

SMOKE

CHOL

HT

WEIGHT1

RACE * WEIGHT1

RACE(1) by WEIGHT1

RACE(2) by WEIGHT1

Constant

Step

1a

B S.E. Wald df Sig. Exp(B)

Variable(s) entered on step 1: RACE, SMOKE, CHOL, HT, WEIGHT1, RACE * WEIGHT1 .a.

Variables in the Equation

9.333 2 .009

1.469 .501 8.617 1 .003 4.346

.799 .429 3.464 1 .063 2.223

.793 .404 3.857 1 .050 2.211

1.366 .440 9.643 1 .002 3.921

1.344 .887 2.292 1 .130 3.833

-.004 .001 7.596 1 .006 .996

1.068 1.403 .579 1 .447 2.908

.511 .981 .271 1 .603 1.666

RACE

RACE(1)

RACE(2)

SMOKE

CHOL

HT

WEIGHT1

HT by SMOKE

Constant

Step

1a

B S.E. Wald df Sig. Exp(B)

Variable(s) entered on step 1: RACE, SMOKE, CHOL, HT, WEIGHT1, HT * SMOKE .a.

Variables in the Equation

8.830 2 .012

1.438 .497 8.383 1 .004 4.213

.715 .432 2.733 1 .098 2.044

-.959 1.716 .312 1 .576 .383

1.371 .441 9.682 1 .002 3.941

1.677 .716 5.480 1 .019 5.350

-.005 .002 6.275 1 .012 .995

.003 .003 1.190 1 .275 1.003

1.412 1.397 1.021 1 .312 4.104

RACE

RACE(1)

RACE(2)

SMOKE

CHOL

HT

WEIGHT1

SMOKE by WEIGHT1

Constant

Step

1a

B S.E. Wald df Sig. Exp(B)

Variable(s) entered on step 1: RACE, SMOKE, CHOL, HT, WEIGHT1, SMOKE * WEIGHT1 .a.

Page 17: Regresi Logistik Modul

17

Variables in the Equation

9.032 2 .011

1.429 .494 8.367 1 .004 4.174

.772 .429 3.237 1 .072 2.163

.886 .390 5.173 1 .023 2.426

1.266 .445 8.087 1 .004 3.546

1.611 .747 4.649 1 .031 5.009

-.004 .001 7.080 1 .008 .996

4.654 15.507 .090 1 .764 104.990

.335 .945 .125 1 .723 1.398

RACE

RACE(1)

RACE(2)

SMOKE

CHOL

HT

WEIGHT1

CHOL by HT

Constant

Step

1a

B S.E. Wald df Sig. Exp(B)

Variable(s) entered on step 1: RACE, SMOKE, CHOL, HT, WEIGHT1, CHOL * HT .a.

Variables in the Equation

9.052 2 .011

1.425 .494 8.309 1 .004 4.159

.793 .429 3.423 1 .064 2.211

.861 .391 4.855 1 .028 2.366

2.087 2.358 .783 1 .376 8.059

1.750 .710 6.081 1 .014 5.757

-.004 .001 5.925 1 .015 .996

-.001 .004 .108 1 .743 .999

.247 .985 .063 1 .802 1.280

RACE

RACE(1)

RACE(2)

SMOKE

CHOL

HT

WEIGHT1

CHOL by WEIGHT1

Constant

Step

1a

B S.E. Wald df Sig. Exp(B)

Variable(s) entered on step 1: RACE, SMOKE, CHOL, HT, WEIGHT1, CHOL * WEIGHT1 .a.

Variables in the Equation

9.079 2 .011

1.430 .495 8.331 1 .004 4.178

.794 .429 3.427 1 .064 2.213

.872 .394 4.912 1 .027 2.392

1.326 .437 9.195 1 .002 3.765

1.877 2.670 .494 1 .482 6.532

-.004 .002 5.863 1 .015 .996

.000 .003 .002 1 .967 1.000

.328 1.035 .100 1 .751 1.388

RACE

RACE(1)

RACE(2)

SMOKE

CHOL

HT

WEIGHT1

HT by WEIGHT1

Constant

Step

1a

B S.E. Wald df Sig. Exp(B)

Variable(s) entered on step 1: RACE, SMOKE, CHOL, HT, WEIGHT1, HT * WEIGHT1 .a.

Page 18: Regresi Logistik Modul

18

Hasil pengujian interaksi dapat dirangkumkan dalam tabel dibawah ini;

Tabel hasil uji variabel interaksi

Variabel interaksi

P value

Race1 by smoke Race2 by smoke Race1 by cholesterol Race2 by cholesterol Race1 by hipertension Race2 by hipertension Race1 by weight Race2 by weight Smoke by hipertension Smoke by weight Cholesterol by Hipertension Cholesterol by wight Hipertension by weight

0.503 0.317 0.176 0.560 0.675 0.975 0.904 0.362 0.447 0.275 0.764 0.743 0.967

Dari hasil penelitian didapatkan tidak terdapat interaksi didalam model.

Terbentuk model regresi logistik yang diinginkan

a. omnibust test,

model harus significant p<0.05 yang menunjukkan bahwa model

appropriate

Variables in the Equation

.870 .390 4.974 1 .026 2.387 1.111 5.128

1.326 .437 9.219 1 .002 3.768 1.600 8.870

-.037 .014 7.248 1 .007 .964 .938 .990

9.077 2 .011

1.429 .495 8.328 1 .004 4.176 1.582 11.025

.794 .429 3.425 1 .064 2.212 .954 5.126

1.769 .712 6.177 1 .013 5.867 1.454 23.682

.346 .946 .134 1 .715 1.413

SMOKE

CHOL

WEIGHT

RACE

RACE(1)

RACE(2)

HT

Constant

Step

1a

B S.E. Wald df Sig. Exp(B) Lower Upper

95.0% C.I.f or

EXP(B)

Variable(s) entered on step 1: SMOKE, CHOL, WEIGHT, RACE, HT.a.

Page 19: Regresi Logistik Modul

19

b. Dilihat overall percentage pada classification table Dengan ketepatan dari model ini adalah 76.5%

c. Model pada penelitian ini adalah : Z = 0.346 + 1.429 race1 + 0.794 race2 + 0.870 smoke +1.326 cholesterol + 1.769 hipertension – 0.037 weight1

Omnibus Tests of Model Coefficients

39.823 6 .000

39.823 6 .000

39.823 6 .000

Step

Block

Model

Step 1

Chi-square df Sig.

Classification Tablea

123 12 91.1

35 30 46.2

76.5

ObservedNo

Yes

Coronary heart

disease

Overall Percentage

Step 1No Yes

Coronary heart

disease Percentage

Correct

Predicted

The cut value is .500a.

Variables in the Equation

.870 .390 4.974 1 .026 2.387 1.111 5.128

1.326 .437 9.219 1 .002 3.768 1.600 8.870

-.037 .014 7.248 1 .007 .964 .938 .990

9.077 2 .011

1.429 .495 8.328 1 .004 4.176 1.582 11.025

.794 .429 3.425 1 .064 2.212 .954 5.126

1.769 .712 6.177 1 .013 5.867 1.454 23.682

.346 .946 .134 1 .715 1.413

SMOKE

CHOL

WEIGHT

RACE

RACE(1)

RACE(2)

HT

Constant

Step

1a

B S.E. Wald df Sig. Exp(B) Lower Upper

95.0% C.I.f or

EXP(B)

Variable(s) entered on step 1: SMOKE, CHOL, WEIGHT, RACE, HT.a.

Page 20: Regresi Logistik Modul

20

PEMILIHAN MODEL DENGAN METODE FORWARD

Omnibus Tests of Model Coefficients

14.637 1 .000

14.637 1 .000

14.637 1 .000

5.639 1 .018

20.276 2 .000

20.276 2 .000

7.157 1 .007

27.433 3 .000

27.433 3 .000

7.274 2 .026

34.708 5 .000

34.708 5 .000

5.116 1 .024

39.823 6 .000

39.823 6 .000

Step

Block

Model

Step

Block

Model

Step

Block

Model

Step

Block

Model

Step

Block

Model

Step 1

Step 2

Step 3

Step 4

Step 5

Chi-square df Sig.

Classification Tablea

123 12 91.1

45 20 30.8

71.5

125 10 92.6

45 20 30.8

72.5

124 11 91.9

42 23 35.4

73.5

121 14 89.6

41 24 36.9

72.5

123 12 91.1

35 30 46.2

76.5

Observed

No

Yes

Coronary heart

disease

Overall Percentage

No

Yes

Coronary heart

disease

Overall Percentage

No

Yes

Coronary heart

disease

Overall Percentage

No

Yes

Coronary heart

disease

Overall Percentage

No

Yes

Coronary heart

disease

Overall Percentage

Step 1

Step 2

Step 3

Step 4

Step 5

No Yes

Coronary heart

disease Percentage

Correct

Predicted

The cut value is .500a.

Page 21: Regresi Logistik Modul

21

PEMILIHAN MODEL DENGAN METODE BACKWARD

Variables in the Equation

1.516 .405 14.047 1 .000 4.556

-1.006 .174 33.311 1 .000 .366

1.431 .410 12.195 1 .000 4.184

-.003 .001 4.925 1 .026 .997

.781 .805 .939 1 .332 2.183

1.450 .418 12.025 1 .001 4.263

1.874 .724 6.693 1 .010 6.514

-.004 .001 7.629 1 .006 .996

1.221 .836 2.133 1 .144 3.390

7.184 2 .028

1.287 .481 7.157 1 .007 3.623

.367 .371 .981 1 .322 1.444

1.510 .428 12.417 1 .000 4.526

1.848 .735 6.318 1 .012 6.345

-.004 .001 9.036 1 .003 .996

1.174 .888 1.748 1 .186 3.236

9.077 2 .011

1.429 .495 8.328 1 .004 4.176

.794 .429 3.425 1 .064 2.212

.870 .390 4.974 1 .026 2.387

1.326 .437 9.219 1 .002 3.768

1.769 .712 6.177 1 .013 5.867

-.004 .001 7.248 1 .007 .996

.346 .946 .134 1 .715 1.413

CHOL

Constant

Step

1a

CHOL

WEIGHT1

Constant

Step

2b

CHOL

HT

WEIGHT1

Constant

Step

3c

RACE

RACE(1)

RACE(2)

CHOL

HT

WEIGHT1

Constant

Step

4d

RACE

RACE(1)

RACE(2)

SMOKE

CHOL

HT

WEIGHT1

Constant

Step

5e

B S.E. Wald df Sig. Exp(B)

Variable(s) entered on step 1: CHOL.a.

Variable(s) entered on step 2: WEIGHT1.b.

Variable(s) entered on step 3: HT.c.

Variable(s) entered on step 4: RACE.d.

Variable(s) entered on step 5: SMOKE.e.

Omnibus Tests of Model Coefficients

39.823 6 .000

39.823 6 .000

39.823 6 .000

Step

Block

Model

Step 1

Chi-square df Sig.

Classification Tablea

123 12 91.1

35 30 46.2

76.5

ObservedNo

Yes

Coronary heart

disease

Overall Percentage

Step 1No Yes

Coronary heart

disease Percentage

Correct

Predicted

The cut value is .500a.

Page 22: Regresi Logistik Modul

22

Interpretasi model

Ternyata hasil yang diperoleh pada ke-3 metode pemilihan variabel, baik

pada metode enter, backward, forward pada penelitian ini menunjukkan

kesamaan hasil.

Interpretasi dari model yang terbentuk adalah bahwa faktor-faktor yang

mempengaruhi penyakit jantung koroner adalah Ras, Merokok, Cholesterol,

hipertensi dan berat badan. Yang paling besar pengaruhnya dalam kejadian

penyakit jantung koroner adalah Hipertensi. Dimana risiko penyakit jantung

koroner pada orang yang Hipertensi adalah 6 kali dibandingkan dengan yang

tidak hipertensi dengan 95% CI (1.454 – 23.682) setelah dikontrol oleh variabel

ras, merokok, kolesterol, dan berat badan.

Risiko Penyakit jantung koroner pada orang kulit hitam adalah 4 kali

dibandingkan dengan orangkulit putih dengan 95% CI (1.454 – 23.682) setelah

dikontrol oleh variabel hipertensi, merokok, kolesterol, dan berat badan.

Sedangkan untuk kulit lainnya Odds Penyakit jantung koroner adalah 2 kali

dibandingkan dengan yang tidak hipertensi dengan 95% CI (0.954 – 5.126)

setelah dikontrol oleh variabel hipertensi, merokok, kolesterol, dan berat badan.

Risiko Penyakit jantung koroner pada orang yang merokok adalah 2 kali

dibandingkan dengan yang tidak hipertensi dengan 95% CI (1.111 - 5.128)

setelah dikontrol oleh variabel ras, hipertensi, kolesterol, dan berat badan.

Variables in the Equation

9.077 2 .011

1.429 .495 8.328 1 .004 4.176

.794 .429 3.425 1 .064 2.212

.870 .390 4.974 1 .026 2.387

1.326 .437 9.219 1 .002 3.768

1.769 .712 6.177 1 .013 5.867

-.004 .001 7.248 1 .007 .996

.346 .946 .134 1 .715 1.413

RACE

RACE(1)

RACE(2)

SMOKE

CHOL

HT

WEIGHT1

Constant

Step

1a

B S.E. Wald df Sig. Exp(B)

Variable(s) entered on step 1: RACE, SMOKE, CHOL, HT, WEIGHT1.a.

Page 23: Regresi Logistik Modul

23

Risiko Penyakit jantung koroner pada orang dengan kolesterol tinggi

adalah 4 kali dibandingkan dengan yang tidak hipertensi dengan 95% CI (1.600

– 8.870) setelah dikontrol oleh variabel ras, merokok, hipertensi, dan berat

badan.

Kenaikan berat badan setiap 100 gram (0.1 kg) merupakan faktor

pencegah untuk terjadinya Penyakit jantung koroner yaitu 0.964 dengan 95% CI

(0.938 – 0.990) setelah dikontrol oleh variabel ras, merokok, kolesterol, dan

hipertensi.

2. MODEL ESTIMASI

Selanjutnya akan dibahas langkah dalam strategi pemodelan regresi logistik

dengan tujuan untuk mengestimasi hubungan paparan dan penyakit.

Langkah untuk melakukan strategi pemodelan dibutuhkan 3 tahap:

1. Variabel specification

peneliti melakukan penelusuran literature unttuk membatasi pada variabel

independen yang memang bermakna secara klinik maupun biologik.

Variabel ini dapat didefinsikan pada model sebagai langkah awal yang

paling mungkin masuk dalam model.

2. Interaction assesment

Bila terdapat interaksi maka OR dilaporkan terpisah

3. Confounding assesment followed by consideration of precision

Model terakhir adalah model dengan variabel interaksi dan konfounding

yang terpilih.

LANGKAH PEMBUATAN MODEL Langkah untuk melakukan spesifikasi variabel secara jelas, dilakukan

pemodelan secara lengkap, mencakup semua variabel utama, kandidat

konfounding dan kandidat interaksi, yaitu:

Page 24: Regresi Logistik Modul

24

1. Hierarchically Well-Formulated Models

Merupakan initial model. Model memiliki seluruh lower order component of

any term in the model.

2. The Hierarichal Backward Elimination Approach

Setelah didapatkan initial model strategi selanjutnya adalah prosedur

Hierarichal Backward Elimination Approach untuk mengeluarkan variabel.

Uji statistik digunakan untuk menguji interaksi. Tapi untuk mengeliminasi

confounders tidak menggunakan uji statistik. Strategi ini prisip kerjanya

adalah dari large starting model smaller final model.

Initial model

interaction

confounder

3. The Hierarchy Principles for retaining variables

Jika suatu variabel terdapat dalam model , maka semua lower-order

components juga harus ada dalam model.

CONTOH PEMODELAN ESTIMASI

Model untuk mengetahui hubungan merokok dengan terjadinya penyakit jantung

koroner, data yang digunakan adalah data CHD.

Eliminate EViEj

Eliminate Vi dan ViVj

Eliminate EVi

Page 25: Regresi Logistik Modul

25

Tujuan penelitian:

Ingin mengetahui hubungan antara merokok dan kejadian penyakit jantung

koroner, dengan dikontrol oleh variabel independen lainnya.

Kerangka konsep:

Smoke Coronary Heart Diseases

Age

Race High Cholesterol

Hypertension Diabetes Mellitus

Number of exercise Weight

Langkah pemodelan yang dilakukan adalah :

1. Variable spesification.

Melakukan pemodelan lengkap (Hierarchically Well Formulated Model)

dengan mencakup semua variabel utama, variabel confounding dan

kandidat interaksi

Variabel dependen adalah : Coronary Heart Diseases Variabel Independen yaitu : Variabel Resiko adalah

Smoke,

Page 26: Regresi Logistik Modul

26

Variabel Confounder adalah

Age,

Race,

High cholelesterol,

Hypertension ,

Diabetes mellitus,

Number of exercise,

Weight (pada variabel weight dilakukan compute dengan mengalikan dengan 10, agar desimal pada variabel weight menjadi satuan. Hal ini dilakukan untuk memperhitungkan kenaikan dalam 1 unit untuk perhitungan OR agar tidak berlipat banyak)

Variabel Interaksi adalah :

Smoke*Age

Smoke*Race

Smoke*Hypertension

Smoke*weight

VARIABEL SPESIFICATION: MODEL HWF

2. Melakukan Interaction assesment,

Variables in the Equation

-.086 .056 2.353 1 .125 .918

1.698 2 .428

.777 .801 .942 1 .332 2.176

.760 .608 1.562 1 .211 2.137

-2.326 2.555 .829 1 .363 .098

1.447 .462 9.792 1 .002 4.251

1.571 .928 2.865 1 .091 4.813

.664 .469 2.005 1 .157 1.942

-.031 .182 .030 1 .863 .969

-.004 .002 3.773 1 .052 .996

.089 .078 1.280 1 .258 1.093

2.406 2 .300

1.150 1.094 1.106 1 .293 3.159

-.684 .939 .531 1 .466 .504

.515 1.517 .115 1 .734 1.674

.002 .003 .311 1 .577 1.002

2.670 1.844 2.096 1 .148 14.445

AGE

RACE

RACE(1)

RACE(2)

SMOKE

CHOL

HT

DM

EXER

WEIGHT1

AGE by SMOKE

RACE * SMOKE

RACE(1) by SMOKE

RACE(2) by SMOKE

HT by SMOKE

SMOKE by WEIGHT1

Constant

Step

1a

B S.E. Wald df Sig. Exp(B)

Variable(s) entered on step 1: AGE, RACE, SMOKE, CHOL, HT, DM, EXER, WEIGHT1, AGE * SMOKE ,

RACE * SMOKE , HT * SMOKE , SMOKE * WEIGHT1 .

a.

Page 27: Regresi Logistik Modul

27

yang dilakukan dengan menghilangkan Interaksi yang memiliki p value

yang tertinggi dan di run kembali satu persatu sampai ditemukan Interaksi

yang signifikan. Didapatkan hasil nilai p dari masing-masing interaksi

sebagai berikut :

INTERACTION SPESIFICATION

Seluruh kemungkinan interaksi yang ada dimasukkan dalam model

Variables in the Equation

-.086 .056 2.365 1 .124 .917

1.671 2 .434

.772 .804 .923 1 .337 2.164

.756 .609 1.539 1 .215 2.130

-2.470 2.505 .973 1 .324 .085

1.432 .460 9.676 1 .002 4.188

1.770 .735 5.792 1 .016 5.868

.673 .468 2.072 1 .150 1.961

-.028 .181 .025 1 .875 .972

-.004 .002 3.892 1 .049 .996

.088 .078 1.263 1 .261 1.092

2.377 2 .305

1.122 1.088 1.063 1 .302 3.070

-.696 .938 .551 1 .458 .499

.002 .003 .505 1 .477 1.002

2.706 1.844 2.153 1 .142 14.967

AGE

RACE

RACE(1)

RACE(2)

SMOKE

CHOL

HT

DM

EXER

WEIGHT1

AGE by SMOKE

RACE * SMOKE

RACE(1) by SMOKE

RACE(2) by SMOKE

SMOKE by WEIGHT1

Constant

Step

1a

B S.E. Wald df Sig. Exp(B)

Variable(s) entered on step 1: AGE, RACE, SMOKE, CHOL, HT, DM, EXER, WEIGHT1, AGE * SMOKE ,

RACE * SMOKE , SMOKE * WEIGHT1 .

a.

Page 28: Regresi Logistik Modul

28

Variables in the Equation

-.091 .055 2.695 1 .101 .913

1.896 2 .387

.687 .791 .754 1 .385 1.987

.824 .601 1.880 1 .170 2.279

-1.312 1.889 .482 1 .487 .269

1.420 .461 9.510 1 .002 4.138

1.841 .730 6.360 1 .012 6.302

.629 .462 1.850 1 .174 1.875

-.016 .180 .008 1 .930 .984

-.003 .001 5.042 1 .025 .997

.093 .078 1.447 1 .229 1.098

3.233 2 .199

1.270 1.072 1.404 1 .236 3.561

-.781 .930 .705 1 .401 .458

2.066 1.572 1.727 1 .189 7.892

AGE

RACE

RACE(1)

RACE(2)

SMOKE

CHOL

HT

DM

EXER

WEIGHT1

AGE by SMOKE

RACE * SMOKE

RACE(1) by SMOKE

RACE(2) by SMOKE

Constant

Step

1a

B S.E. Wald df Sig. Exp(B)

Variable(s) entered on step 1: AGE, RACE, SMOKE, CHOL, HT, DM, EXER, WEIGHT1, AGE * SMOKE

, RACE * SMOKE .

a.

Variables in the Equation

-.077 .053 2.115 1 .146 .925

6.884 2 .032

1.279 .506 6.403 1 .011 3.595

.718 .444 2.617 1 .106 2.050

-1.070 1.730 .383 1 .536 .343

1.328 .451 8.676 1 .003 3.774

1.836 .716 6.574 1 .010 6.271

.506 .454 1.244 1 .265 1.659

-.019 .175 .011 1 .915 .981

-.003 .001 5.854 1 .016 .997

.085 .075 1.286 1 .257 1.089

1.844 1.449 1.621 1 .203 6.325

AGE

RACE

RACE(1)

RACE(2)

SMOKE

CHOL

HT

DM

EXER

WEIGHT1

AGE by SMOKE

Constant

Step

1a

B S.E. Wald df Sig. Exp(B)

Variable(s) entered on step 1: AGE, RACE, SMOKE, CHOL, HT, DM, EXER, WEIGHT1, AGE *

SMOKE .

a.

Page 29: Regresi Logistik Modul

29

Tabel hasil uji variabel interaksi

Jenis Interaksi yang dihilangkan

P value

Hipertensi by smoke Smoke by weight Race by smoke Age by smoke

0.734 0.477 0.401 0.257

Dari hasil diatas ternyata tidak terdapat interaksi yang significan didalam

model.

Variables in the Equation

-.037 .038 .984 1 .321 .963

8.078 2 .018

1.371 .498 7.576 1 .006 3.940

.749 .442 2.875 1 .090 2.115

.849 .398 4.558 1 .033 2.337

1.377 .453 9.243 1 .002 3.964

1.805 .712 6.433 1 .011 6.083

.408 .445 .842 1 .359 1.504

-.008 .174 .002 1 .962 .992

-.003 .001 5.987 1 .014 .997

.962 1.202 .641 1 .423 2.618

AGE

RACE

RACE(1)

RACE(2)

SMOKE

CHOL

HT

DM

EXER

WEIGHT1

Constant

Step

1a

B S.E. Wald df Sig. Exp(B)

Variable(s) entered on step 1: AGE, RACE, SMOKE, CHOL, HT, DM, EXER, WEIGHT1.a.

Variables in the Equation

-.037 .038 .984 1 .321 .963

8.078 2 .018

1.371 .498 7.576 1 .006 3.940

.749 .442 2.875 1 .090 2.115

.849 .398 4.558 1 .033 2.337

1.377 .453 9.243 1 .002 3.964

1.805 .712 6.433 1 .011 6.083

.408 .445 .842 1 .359 1.504

-.008 .174 .002 1 .962 .992

-.003 .001 5.987 1 .014 .997

.962 1.202 .641 1 .423 2.618

AGE

RACE

RACE(1)

RACE(2)

SMOKE

CHOL

HT

DM

EXER

WEIGHT1

Constant

Step

1a

B S.E. Wald df Sig. Exp(B)

Variable(s) entered on step 1: AGE, RACE, SMOKE, CHOL, HT, DM, EXER, WEIGHT1.a.

Page 30: Regresi Logistik Modul

30

Maka full model pada penelitian ini adalah :

Z = 0.962 - 0.037 age +1.371 race1 + 0.749 race2 + 0.849 smoke +1.377

chol + 1.805 ht +0.408 DM – 0.008 exer – 0.003 weight1

Dengan OR smoke full model adalah 2.337, yaitu OR smoke yang telah

terkontrol oleh variabel lainnya.

3. Confounder assesment

Dilakukan dengan cara Hierarchical Backward Elimination yaitu ;

membandingkan OR full model dengan OR Reduced Model. Bila besar

perubahan OR yang terjadi kurang dari 10 % maka model yang digunakan

adalah Reduced Model Tujuannya adalah untuk mendapatkan validitas.

Langkah yang dilakukan adalah dengan menghilangkan variabel yang

memiliki nilai p value yang tertinggi, kemudian di run kembali dan

dibandingkan ; Delta antara OR Reduced model dengan OR full model

dibagi dengan OR full model .

Bila besarnya perubahan < 10 % maka digunakan Reduced model.

Bila besar perubahan OR > 10 % maka variabel tersebut

dimasukkan kembali, Selanjutnya dilihat variabel lainnya untuk

dikeluarkan dan diperbandingkan kembali, satu persatu.

CONFOUNDING ASSESMENT

Page 31: Regresi Logistik Modul

31

Variables in the Equation

-.038 .037 1.031 1 .310 .963

8.148 2 .017

1.372 .497 7.610 1 .006 3.945

.752 .439 2.936 1 .087 2.120

.851 .395 4.640 1 .031 2.342

1.377 .453 9.242 1 .002 3.963

1.808 .709 6.504 1 .011 6.101

.409 .444 .850 1 .357 1.506

-.003 .001 6.034 1 .014 .997

.963 1.201 .644 1 .422 2.621

AGE

RACE

RACE(1)

RACE(2)

SMOKE

CHOL

HT

DM

WEIGHT1

Constant

Step

1a

B S.E. Wald df Sig. Exp(B)

Variable(s) entered on step 1: AGE, RACE, SMOKE, CHOL, HT, DM, WEIGHT1.a.

Variables in the Equation

-.041 .037 1.276 1 .259 .959

7.939 2 .019

1.346 .498 7.315 1 .007 3.842

.756 .436 3.007 1 .083 2.129

.860 .394 4.776 1 .029 2.364

1.434 .450 10.165 1 .001 4.197

1.745 .707 6.097 1 .014 5.725

-.003 .001 6.137 1 .013 .997

1.139 1.178 .935 1 .334 3.125

AGE

RACE

RACE(1)

RACE(2)

SMOKE

CHOL

HT

WEIGHT1

Constant

Step

1a

B S.E. Wald df Sig. Exp(B)

Variable(s) entered on step 1: AGE, RACE, SMOKE, CHOL, HT, WEIGHT1.a.

Variables in the Equation

9.077 2 .011

1.429 .495 8.328 1 .004 4.176

.794 .429 3.425 1 .064 2.212

.870 .390 4.974 1 .026 2.387

1.326 .437 9.219 1 .002 3.768

1.769 .712 6.177 1 .013 5.867

-.004 .001 7.248 1 .007 .996

.346 .946 .134 1 .715 1.413

RACE

RACE(1)

RACE(2)

SMOKE

CHOL

HT

WEIGHT1

Constant

Step

1a

B S.E. Wald df Sig. Exp(B)

Variable(s) entered on step 1: RACE, SMOKE, CHOL, HT, WEIGHT1.a.

Variables in the Equation

.560 .332 2.845 1 .092 1.751

1.324 .426 9.665 1 .002 3.758

1.812 .703 6.637 1 .010 6.120

-.004 .001 6.991 1 .008 .997

.877 .851 1.064 1 .302 2.405

SMOKE

CHOL

HT

WEIGHT1

Constant

Step

1a

B S.E. Wald df Sig. Exp(B)

Variable(s) entered on step 1: SMOKE, CHOL, HT, WEIGHT1.a.

Page 32: Regresi Logistik Modul

32

Dari hasil out put penelitian dapat diringkaskan dalam tabel dibawah ini :

Variables in the Equation

.870 .390 4.974 1 .026 2.387

1.326 .437 9.219 1 .002 3.768

1.769 .712 6.177 1 .013 5.867

-.004 .001 7.248 1 .007 .996

9.077 2 .011

1.429 .495 8.328 1 .004 4.176

.794 .429 3.425 1 .064 2.212

.346 .946 .134 1 .715 1.413

SMOKE

CHOL

HT

WEIGHT1

RACE

RACE(1)

RACE(2)

Constant

Step

1a

B S.E. Wald df Sig. Exp(B)

Variable(s) entered on step 1: SMOKE, CHOL, HT, WEIGHT1, RACE.a.

Variables in the Equation

.872 .383 5.193 1 .023 2.391

1.319 .429 9.472 1 .002 3.740

-.003 .001 4.693 1 .030 .997

9.551 2 .008

1.428 .488 8.554 1 .003 4.172

.831 .418 3.949 1 .047 2.296

-.123 .907 .018 1 .893 .885

SMOKE

CHOL

WEIGHT1

RACE

RACE(1)

RACE(2)

Constant

Step

1a

B S.E. Wald df Sig. Exp(B)

Variable(s) entered on step 1: SMOKE, CHOL, WEIGHT1, RACE.a.

Variables in the Equation

.976 .371 6.915 1 .009 2.654

1.377 .422 10.675 1 .001 3.964

9.109 2 .011

1.230 .467 6.939 1 .008 3.420

.980 .407 5.804 1 .016 2.665

-1.965 .360 29.863 1 .000 .140

SMOKE

CHOL

RACE

RACE(1)

RACE(2)

Constant

Step

1a

B S.E. Wald df Sig. Exp(B)

Variable(s) entered on step 1: SMOKE, CHOL, RACE.a.

Variables in the Equation

1.063 .368 8.345 1 .004 2.896

9.854 2 .007

1.382 .480 8.273 1 .004 3.983

.895 .405 4.886 1 .027 2.447

-.003 .001 5.752 1 .016 .997

.155 .871 .031 1 .859 1.167

SMOKE

RACE

RACE(1)

RACE(2)

WEIGHT1

Constant

Step

1a

B S.E. Wald df Sig. Exp(B)

Variable(s) entered on step 1: SMOKE, RACE, WEIGHT1.a.

Page 33: Regresi Logistik Modul

33

Smoke

High cholesterol Weight Race

Coronary Heart Disease

Tabel hasil uji confounder

Confounder yang dikeluarkan

P value

OR Smoke Reduced

Model

Delta OR

Red dg OR full model

Besar

perubahan OR (%)

Exercise Diabetes mellitus Age Race Hypertension Weight1 Cholesterol

0.962 0.357 0.259 0.064 0.013 0.030 0.02

2.342 2.364 2.387 1.751 2.391 2.654 2.896

0.005 0.027 0.05

0.586 0.054 0.317 0.559

0.214 1.155 2.139 25.07 2.31

13.56 23.92

Dari hasil diatas didapatkan bahwa variabel confounder yang masuk

kedalam model adalah variabel Race(Cat), Weight1, Cholesterol dengan

OR Smoke pada Reduced Model adalah 2.391

4. Final Model , yaitu model yang paling parsimonious dalam penelitian ini

adalah :

Page 34: Regresi Logistik Modul

34

Interpretasi model

Merokok memiliki hubungan dengan Penyakit Jantung Koroner setelah

dikontrol oleh Ras, Berat Badan dan Kadar Kholesterol. Dimana risiko untuk

menderita Penyakit jantung koroner pada orang yang merokok adalah 2 kali

dibanding orang yang tidak merokok setelah dikontrol variabel ras, berat badan

dan kadar kolesterol. 95% CI OR adalah (1.13-5.062)

Omnibus Tests of Model Coefficients

33.309 5 .000

33.309 5 .000

33.309 5 .000

Step

Block

Model

Step 1

Chi-square df Sig.

Classification Tablea

123 12 91.1

39 26 40.0

74.5

ObservedNo

Yes

Coronary heart

disease

Overall Percentage

Step 1No Yes

Coronary heart

disease Percentage

Correct

Predicted

The cut value is .500a.

Variables in the Equation

.872 .383 5.193 1 .023 2.391 1.130 5.062

1.319 .429 9.472 1 .002 3.740 1.615 8.665

-.003 .001 4.693 1 .030 .997 .995 1.000

9.551 2 .008

1.428 .488 8.554 1 .003 4.172 1.602 10.867

.831 .418 3.949 1 .047 2.296 1.012 5.210

-.123 .907 .018 1 .893 .885

SMOKE

CHOL

WEIGHT1

RACE

RACE(1)

RACE(2)

Constant

Step

1a

B S.E. Wald df Sig. Exp(B) Lower Upper

95.0% C.I. for EXP(B)

Variable(s) entered on step 1: SMOKE, CHOL, WEIGHT1, RACE.a.

Page 35: Regresi Logistik Modul

35

DAFTAR PUSTAKA Bland M, 1996

An Introduction to Medical Statistics. Second edition. Oxford University Press. USA

Hosmer D, Lemeshow, 2000

Applied Logistic Regression . second edition. Jhon Willey & son, inc. USA Kleinbaum D, 1996

Statistic in the health science. Logistic Regression A Self-learning text. Springer-Verlag , New York

Kleinbaum D, Kupper L, Morgenstern H, 1996 Epidemiologic Research. Principles and Quantitative Methods. Van Nostrand Reinhold Company. New York

Pagano M, Gauvreu K, 1997 Principles of Biostatistic Duxburry Press, California. Riono P, 1992

Aplikasi regresi Logistik. Fakultas Kesehatan Masyarakat Universitas Indonesia