regresi logistik modul
DESCRIPTION
idnTRANSCRIPT
MODUL MATA KULIAH
ANALISIS MULTIVARIAT APLIKASI REGRESI LOGISTIK
Oleh
Prof. Dr. dr. RIZANDA MACHMUD, M.Kes
PROGRAM STUDI S3 KEDOKTERAN FAKULTAS KEDOKTERAN
PROGRAM PASCASARJANA UNIVERSITAS ANDALAS
2
DAFTAR ISI
DAFTAR ISI .......................................................................................................... 2
I. PENGANTAR REGRESI LOGISTIK .............................................................. 3
II. MODEL REGRESI LOGISTIK ....................................................................... 4
III. STUDY DESIGN ISSUE............................................................................. 5
IV. STRATEGI PEMODELAN REGRESI LOGISTIK ....................................... 6
1. MODEL PREDIKSI ................................................................................. 7
2. MODEL ESTIMASI ............................................................................... 23
DAFTAR PUSTAKA ............................................................................................ 35
3
I. PENGANTAR REGRESI LOGISTIK
Analisis regresi logistik adalah suatu pendekatan model matematis yang
dapat digunakan untuk menggambarkan hubungan antara banyak variabel
independen dengan variabel dependen yang bersifat dikotomus. Variabel
independen dapat bertipe apa saja, dan asumsi distribusi variabel adalah bebas
(Kleinbaum, 1996).
Fungsi logistik merupakan fungsi matematik dengan rumus:
ƒ(z) = ze1
1
Saat ini modelling prosedur dengan menggunakan regressi logistik paling
populer dibandingkan modelling prosedur lainnya yang digunakan untuk anlisa
epidemioligik bila ukuran penyakit yang digunakan adalah dikotomus.
Penjelasannya adalah sebagai berikut:
Terlihat pada gambar fungsi logistik terletak pada nilai z antara -∞ dan +∞.
Pada saat nilai z= -∞ maka ƒ(z) =0 dan pada saat z= +∞ maka ƒ(z) =1
Jadi nilai ƒ(z) akan berkisar antara 0 dan1. Sehingga model logistik dapat
digunakan untuk menggambarkan probabilitas yang selalu memiliki nilai antara 0
dan 1. Pada epidemiologi, probabilitas ini dikenal sebagai risiko untuk terjadinya
penyakit.
Alasan lainnya mengapa fungsi logistik ini populer untuk analisis data
epidemiologik adalah bentuk dari kurva logistik. Seperti terlihat pada gambar,
nilai ƒ(z) meningkat secara perlahan pada saat z berubah dari -∞ ke arah 0,
kemudian ƒ(z) meningkat secara cepat dan kemudian peningkatannya kembali
perlahan pada saat ƒ(z) mendekati 1 ketika z meningkat menjadi +∞. Hasilnya
adalah kurva yang berbentuk S.
Kurva yang berbentuk S ini dianggap cocok untuk menggambarkan
peningkatan risiko terjadinya outcome pada penelitia epidemiologi, jikaz
dianggap sebagai indeks yang menggabungkan efek dari berbagai faktor risiko
dan ƒ(z) merupakan risiko pada nilai z tertentu. Bentuk kurva S menunjukkan
4
efek z pada risiko individu minimal pada nilai z kecil sampai pada satu batas
ambang tertentu dan tetap tinggi saat risiko mendekati 1 dan nilai z cukup besar.
Menurut ahli epidemiologi, konsep ambang batas (threshold) ini dapat
digunakan pada berbagai keadaan penyakit. Jadi bentuk kurva logistik dapat
digunakan secara luas pada analisis multivariabel pada penelitian epidemiologi.
1
ƒ(z) = ze1
1=0 ½ ƒ(z) =
ze1
1=1
- ∞ 0 +∞
Z
threshold
Range : 0 ≤ ƒ(z) ≤ 1
Individual risk : 0 ≤ probability ≤ 1
II. MODEL REGRESI LOGISTIK
Model regresi logistik dituliskan dalam bentuk penjumlahan linier yaitu:
Z = α +β1X1 + β2X2 + …+βkXk
dimana X1,X2 dan Xk merupakan variabel independen. Jadi z merupakan
indeks yang menggabungkan x. Kemudian nilai z pada fungsi logistik diganti
penjumlahan linier sehingga fungsi logistik dapat dituliskan:
5
ƒ(z) = )....( 22111
1kke
Dimana f(z) merupakan probabilitas untuk terjadinya suatu keluaran. Pada
penelitian kesehatan, probabilitas ini untuk terjadinya penyakit (1) atau tidak
terjadinya penyakit (0) pada kombinasi variabel independen. Jadi fungsi logistik
dapat dituliskan sebagai berikut:
P(D) = ).....( 22111
1kke
Pada model logistik, α dan βi merupakan parameter yang tidak diketahui
yang perlu di estimasi dengan menggunakan data yang ada. Estimasi parameter
dilakukan dengan menggunakan metode maximum likelihood dengan fungsi
likelihood:
L =
n
l
il
k
i
i
n
l
il
k
i
i
1 1
1 1
exp1
exp
Estimasi parameter terlalu kompleks untuk dilakukan dengan perhitungan
manual, sehingga perhitungan dilakukan dengan perangkat lunak statistik.
Hasil turunan matematik pada fungsi logistik menunjukkan bahwa ekponen β i
adalah OR.
III. STUDY DESIGN ISSUE
Analisis regresi logistik digunakan pada disain cohort, dan dapat juga pada
disain case control maupun pada cross sectional. Meskipun logistik modelling
dapat digunakan untuk disain case control dan cross sectional, tapi terdapat
keterbatasan analisa untuk disain ini. Pada disain kohort, model logistik dapat
digunakan untuk memprediksi risiko individual, tapi pada disain case control dan
cross sectional kita tidak memprediksi individual risk, hanya bisa memakai hasil
estimasi OR saja.
6
Tabel penggunaan interpretasi Interpretasi cohort Case control Cross sectional
P (D) ya tidak tidak
OR ya ya ya
IV. STRATEGI PEMODELAN REGRESI LOGISTIK
Ada secara tipikal 2 tujuan (goals) dalam mathematical modeling pada regresi
logistik:
1. untuk mendapatkan valid estimasi dari hubungan suatu exposure-
penyakit, disebut model Estimasi
2. untuk mendapatkan model prediksi yang dianggap terbaik untuk
memprediksi kejadian variabel dependen (outcome), disebut model
Prediksi
Tergantung dari tujuan peneliti, maka strategi yang digunakan juga berbeda
untuk masing-masing tujuan (different strategies for different goals).
Pada tabel akan dijelaskan lebih lanjut perbedaan kedua model tersebut.
Tabel Perbedaan model prediksi dan model estimasi
Perbedaan
Model Prediksi
Model Estimasi
Kedudukan variabel pada model
semua variabel dianggap sama penting, sehingga dapat dilakukan estimasi beberapa koefisien sekaligus
diutamakan adalah nilai koefisien regresi suatu determinan yang ingin dipelajari, sedangkan variabel lain dipertimbangkan sebagai kontrol.
Bentuk model
Model yang paling tepat dan paling sederhana (parsimoni)
Modelnya relatif lebih kaya dibandingkan model prediksi
7
Hal penting yang harus diperhatikan pada waktu kita melakukan strategi
pemodelan adalah sebagai berikut:
Kita harus melakukan check untuk kemungkinan terjadinya
multicollinearity.
Juga harus diperhatikan Influential observation. Individual data dapat
mempengaruhi koefisien regresi, seperti contoh outlier. Koefisien dapat
berubah bila outlier dikeluarkan dari analisis.
Bila variabel independen memiliki kategori lebih dari 2 kategori, maka
variabel tersebut disebut variabel dummy, pada analisa harus dilakukan
kategorisasi. Akibat bila tidak dilakukan pengkategorian, hubungan antara
variabel dependen dan independen (OR) dianalisakan sebagai numerik
bukan kelompok, ini dapat menimbulkan salah interpretasi. Cara
pengkategorian akan dijelaskan pada contoh latihan.
Identifikasi untuk variabel independen yang kontinu, adalah mengganti
variabel kontinyu dengan variabel yang bersifat kategorikal. Pembagian ini
berdasarkan pembagian kuartil dan kemudian dilakukan plotting koefisien
estimasi dengan titik tengah kuartil. Kalau dianggap tidak linier, maka
dianjurkan untuk dirubah menjadi dikotom atau tetap sebagai variabel
kontinyu kalau hanya bertindak sebagai variabel kontrol.
Untuk variabel yang bersifat kontinyu, diusahakan agar data/nilai variabel
tidak dalam bentuk desimal. Karena OR yang terbentuk, akan
diperhitungkan sesuai kenaikan per desimal tersebut. Dampaknya nilai
OR akan menjadi besar dalam bentuk ratusan atau ribuan.
1. MODEL PREDIKSI
Ketika tujuannya adalah untuk prediksi, maka bisa menggunakan computer
algorithms, seperti backward elimination atau semua kemungkinan regression,
sesuai dengan paket yang ada dalam komputer.
Langkah-langkah yang dilakukan dalam memprediksi model adalah :
8
Mencari covariat potensial yang akan dimasukkan kedalam model dengan
cara melakukan screening untuk menseleksi variabel
a. Variabel kategori menggunakan uji crosstab
b. Variabel kontinyu menggunakan uji t
analisis bivariat masing-masing variabel independen dengan variabel
dependen, bila nilai p yang didapat < 0.25 dimasukkan sebagai covariat
potensial. Kriteria ini ditetapkan berdasarkan pengalaman empirik,
penggunaan nilai α yang lazim 0.05 seringkali tidak berhasil
mengidentifikasikan variabel yang dianggap penting.
Maka terbentuk variabel yang akan masuk kedalam candidat model.
Model ini disebut juga sebagai main effects model.
Melakukan pemilihan variabel dengan memasukkan semua variabel yang
telah terpilih sebagai candidat model.
Pemilihan variabel yang dilakukan dalam memilih variabel dapat dilakukan
dengan 2 cara (tersedia dalam paket komputer), seperti:
a. Pemilihan dengan manual; Enter
b. Pemilihan variabel oleh komputer; Forward, Backward dan
Stepwise
Kesemua cara ini memiliki tujuan yang sama yaitu mendapatkan model
yang parsimoni. Kecenderungan peneliti adalah memilih dengan metode
enter, karena peneliti dapat memilih variabel yang masuk atau
mengeluarkan variabel yang bisa diterangkan secara substantif keilmuan.
Untuk pemilihan variabel dengan komputer, setelah kita masukkan
seluruh candidat model maka akan keluar langsung hasil model yang
parsimonimenurut komputer. Untuk selanjutnya akan dibicarakan dengan
cara enter.
Dari model yang lengkap kemudian secara bertahap dihilangkan satu
persatu variabel yang memiliki nilai p > 0.05, dimulai dari variabel dengan
nilai p tertinggi. Model di run kembali sehingga didapatkan masing-masing
variabel memiliki nilai p yang < 0.05
9
Dilakukan test interaksi berdasarkan substansi. Dari model yang telah
ada, dilakukan satu persatu kemungkinan adanya interaksi. Lakukan
pemilihan variabel interaksi seperti langkah diatas.
Terbentuk model regresi logistik yang diinginkan
CONTOH PEMODELAN PREDIKSI
Model untuk mengetahui faktor risiko terjadinya penyakit jantung koroner, data
yang digunakan adalah data CHD.
Tujuan penelitian
ingin mengetahui faktor risiko terjadinya penyakit jantung koroner .
Kerangka konsep :
Age Race Smoke High Cholesterol Coronary Heart Disease Hypertension Diabetes Mellitus Number of exercise Weight
Diperiksa dahulu apakah terdapat multikolinieritas antar variabel
dependen, dengan melihat nilai r
10
Nilai r seluruhnya < 0.8 Tidak ada korelasi yang lebih dari 0.8, sehingga koliniearitas bukan masalah serius
Mencari covariat potensial yang akan dimasukkan kedalam model dengan
cara melakukan screening untuk menseleksi variabel
a. Variabel kategori menggunakan uji crosstab yaitu : race, smoke
high cholesterol
SCREENING CANDIDAT MODEL
Variabel kategori race
smoking
Correlations
1 .236** .181*
. .001 .010
200 200 200
.236** 1 .142*
.001 . .044
200 200 200
.181* .142* 1
.010 .044 .
200 200 200
Pearson Correlation
Sig. (2-tailed)
N
Pearson Correlation
Sig. (2-tailed)
N
Pearson Correlation
Sig. (2-tailed)
N
Age
Number of
exercises/week
WEIGHT1
Age
Number of
exercises/
week WEIGHT1
Correlation is signif icant at the 0.01 level (2-tailed).**.
Correlation is signif icant at the 0.05 level (2-tailed).*.
Chi-Square Tests
5.593a 2 .061
5.529 2 .063
2.790 1 .095
200
Pearson Chi-Square
Likelihood Ratio
Linear-by-Linear
Association
N of Valid Cases
Value df
Asy mp. Sig.
(2-sided)
0 cells (.0%) hav e expected count less than 5. The
minimum expected count is 9.75.
a.
11
high cholesterol
hypertension
diabetes melitus
Chi-Square Tests
6.569b 1 .010
5.806 1 .016
6.520 1 .011
.014 .008
6.536 1 .011
200
Pearson Chi-Square
Continuity Correctiona
Likelihood Ratio
Fisher's Exact Test
Linear-by-Linear
Association
N of Valid Cases
Value df
Asy mp. Sig.
(2-sided)
Exact Sig.
(2-sided)
Exact Sig.
(1-sided)
Computed only for a 2x2 tablea.
0 cells (.0%) have expected count less than 5. The minimum expected count is
26.65.
b.
Chi-Square Tests
15.629b 1 .000
14.043 1 .000
14.637 1 .000
.000 .000
15.551 1 .000
200
Pearson Chi-Square
Continuity Correctiona
Likelihood Ratio
Fisher's Exact Test
Linear-by-Linear
Association
N of Valid Cases
Value df
Asy mp. Sig.
(2-sided)
Exact Sig.
(2-sided)
Exact Sig.
(1-sided)
Computed only for a 2x2 tablea.
0 cells (.0%) have expected count less than 5. The minimum expected count is
10.40.
b.
Chi-Square Tests
3.884b 1 .049
2.732 1 .098
3.600 1 .058
.060 .053
3.864 1 .049
200
Pearson Chi-Square
Continuity Correctiona
Likelihood Ratio
Fisher's Exact Test
Linear-by-Linear
Association
N of Valid Cases
Value df
Asy mp. Sig.
(2-sided)
Exact Sig.
(2-sided)
Exact Sig.
(1-sided)
Computed only for a 2x2 tablea.
1 cells (25.0%) have expected count less than 5. The minimum expected count is
3.90.
b.
12
Tabel hasil uji bivariat variabel independen kategori dengan CHD
Variabel Independen Kategorik
Hasil screening nilai P
1. Race 2. Smoke 3. Cholesterol 4. Hipertension 5. Diabetes melitus
0.061 0.08 0.00
0.053 0.078
Semua terpilih sebagai variabel kandidat dalam model karena nilai p<0.25
b. Variabel kontinyu menggunakan uji t yaitu; age, number dan weight
variabel kontinyu
Chi-Square Tests
2.681b 1 .102
2.041 1 .153
2.570 1 .109
.143 .078
2.667 1 .102
200
Pearson Chi-Square
Continuity Correctiona
Likelihood Ratio
Fisher's Exact Test
Linear-by-Linear
Association
N of Valid Cases
Value df
Asy mp. Sig.
(2-sided)
Exact Sig.
(2-sided)
Exact Sig.
(1-sided)
Computed only for a 2x2 tablea.
0 cells (.0%) have expected count less than 5. The minimum expected count is
10.07.
b.
Independent Samples Test
3.824 .052 1.575 198 .117 1.25 .796 -.316 2.823
1.692 152.544 .093 1.25 .741 -.210 2.717
2.409 .122 2.655 198 .009 59.92 22.564 15.420 104.415
2.858 153.223 .005 59.92 20.963 18.504 101.331
.037 .848 1.197 198 .233 .19 .159 -.123 .504
1.226 134.605 .222 .19 .155 -.117 .497
Equal variances
assumed
Equal variances
not assumed
Equal variances
assumed
Equal variances
not assumed
Equal variances
assumed
Equal variances
not assumed
Age
WEIGHT1
Number of
exercises/week
F Sig.
Levene's Test f or
Equality of Variances
t df Sig. (2-tailed)
Mean
Dif f erence
Std. Error
Dif f erence Lower Upper
95% Conf idence
Interv al of the
Dif f erence
t-test for Equality of Means
13
Tabel hasil uji bivariat variabel independen kontinyu dengan CHD
Variabel Independen Kontinyu
Hasil screening nilai P
1. Age 2. number of exercise 3. weight
0.117 0.233 0.09
Semua variabel kontinyu terpilih dalam model karena memiliki nilai p>0.25
Maka terbentuk variabel yang akan masuk kedalam candidat model.
Model ini disebut juga sebagai main effects model.
Melakukan pemilihan variabel dengan memasukkan semua variabel yang
telah terpilih sebagai candidat model.
Jangan lupa bahwa variabel race memiliki kategori lebih dari 2 (variabel
dummy), sehingga harus dilakukan kategori, reference group adalah first.
Dari model yang lengkap kemudian secara bertahap dihilangkan satu
persatu variabel yang memiliki nilai p > 0.05, dimulai dari variabel dengan
nilai p tertinggi. Model di run kembali sehingga didapatkan masing-masing
variabel memiliki nilai p yang < 0.05
PEMILIHAN MODEL DENGAN METODE ENTER
Number of exercise dikeluarkan
Variables in the Equation
-.037 .038 .984 1 .321 .963
8.078 2 .018
1.371 .498 7.576 1 .006 3.940
.749 .442 2.875 1 .090 2.115
.849 .398 4.558 1 .033 2.337
1.377 .453 9.243 1 .002 3.964
1.805 .712 6.433 1 .011 6.083
.408 .445 .842 1 .359 1.504
-.008 .174 .002 1 .962 .992
-.003 .001 5.987 1 .014 .997
.962 1.202 .641 1 .423 2.618
AGE
RACE
RACE(1)
RACE(2)
SMOKE
CHOL
HT
DM
EXER
WEIGHT1
Constant
Step
1a
B S.E. Wald df Sig. Exp(B)
Variable(s) entered on step 1: AGE, RACE, SMOKE, CHOL, HT, DM, EXER, WEIGHT1.a.
14
Diabetes melitus dikeluarkan
Age dikeluarkan
Tabel hasil pemilihan variabel yang dikeluarkan
Variabel yang dikeluarkan
P value
1. Exercise 2. Diabetes Mellitus 3. Age
0.960 0.357 0.259
Dilakukan test interaksi berdasarkan substansi. Dari model yang telah
ada, dilakukan satu persatu kemungkinan adanya interaksi. Lakukan
pemilihan variabel interaksi seperti langkah diatas.
Variables in the Equation
-.038 .037 1.031 1 .310 .963
8.148 2 .017
1.372 .497 7.610 1 .006 3.945
.752 .439 2.936 1 .087 2.120
.851 .395 4.640 1 .031 2.342
1.377 .453 9.242 1 .002 3.963
1.808 .709 6.504 1 .011 6.101
.409 .444 .850 1 .357 1.506
-.003 .001 6.034 1 .014 .997
.963 1.201 .644 1 .422 2.621
AGE
RACE
RACE(1)
RACE(2)
SMOKE
CHOL
HT
DM
WEIGHT1
Constant
Step
1a
B S.E. Wald df Sig. Exp(B)
Variable(s) entered on step 1: AGE, RACE, SMOKE, CHOL, HT, DM, WEIGHT1.a.
Variables in the Equation
-.041 .037 1.276 1 .259 .959
7.939 2 .019
1.346 .498 7.315 1 .007 3.842
.756 .436 3.007 1 .083 2.129
.860 .394 4.776 1 .029 2.364
1.434 .450 10.165 1 .001 4.197
1.745 .707 6.097 1 .014 5.725
-.003 .001 6.137 1 .013 .997
1.139 1.178 .935 1 .334 3.125
AGE
RACE
RACE(1)
RACE(2)
SMOKE
CHOL
HT
WEIGHT1
Constant
Step
1a
B S.E. Wald df Sig. Exp(B)
Variable(s) entered on step 1: AGE, RACE, SMOKE, CHOL, HT, WEIGHT1.a.
15
PEMILIHAN VARIABEL INTERAKSI
Variables in the Equation
3.663 2 .160
1.157 .752 2.367 1 .124 3.180
1.032 .579 3.178 1 .075 2.807
.990 .579 2.922 1 .087 2.690
1.384 .443 9.755 1 .002 3.993
1.752 .728 5.794 1 .016 5.764
-.004 .001 6.681 1 .010 .996
2.185 2 .335
.696 1.039 .449 1 .503 2.007
-.904 .903 1.002 1 .317 .405
.223 1.036 .046 1 .829 1.250
RACE
RACE(1)
RACE(2)
SMOKE
CHOL
HT
WEIGHT1
RACE * SMOKE
RACE(1) by SMOKE
RACE(2) by SMOKE
Constant
Step
1a
B S.E. Wald df Sig. Exp(B)
Variable(s) entered on step 1: RACE, SMOKE, CHOL, HT, WEIGHT1, RACE * SMOKE .a.
Variables in the Equation
10.666 2 .005
1.694 .533 10.099 1 .001 5.440
.889 .470 3.575 1 .059 2.433
.829 .392 4.469 1 .035 2.292
1.765 .622 8.040 1 .005 5.842
1.788 .720 6.158 1 .013 5.975
-.004 .001 7.425 1 .006 .996
1.860 2 .395
-1.760 1.302 1.829 1 .176 .172
-.550 .944 .340 1 .560 .577
.315 .955 .108 1 .742 1.370
RACE
RACE(1)
RACE(2)
SMOKE
CHOL
HT
WEIGHT1
CHOL * RACE
CHOL by RACE(1)
CHOL by RACE(2)
Constant
Step
1a
B S.E. Wald df Sig. Exp(B)
Variable(s) entered on step 1: RACE, SMOKE, CHOL, HT, WEIGHT1, CHOL * RACE .a.
Variables in the Equation
7.915 2 .019
1.372 .515 7.096 1 .008 3.942
.787 .435 3.278 1 .070 2.197
.873 .393 4.935 1 .026 2.395
1.327 .440 9.080 1 .003 3.769
1.596 1.033 2.387 1 .122 4.932
-.004 .001 7.133 1 .008 .996
.190 2 .910
.727 1.735 .175 1 .675 2.068
.050 1.612 .001 1 .975 1.052
.403 .968 .174 1 .677 1.497
RACE
RACE(1)
RACE(2)
SMOKE
CHOL
HT
WEIGHT1
HT * RACE
HT by RACE(1)
HT by RACE(2)
Constant
Step
1a
B S.E. Wald df Sig. Exp(B)
Variable(s) entered on step 1: RACE, SMOKE, CHOL, HT, WEIGHT1, HT * RACE .a.
16
Variables in the Equation
1.751 2 .417
1.613 2.009 .645 1 .422 5.019
2.717 2.153 1.592 1 .207 15.131
.882 .392 5.048 1 .025 2.415
1.350 .439 9.461 1 .002 3.856
1.684 .708 5.661 1 .017 5.385
-.003 .002 2.109 1 .146 .997
.872 2 .646
.000 .003 .014 1 .904 1.000
-.003 .004 .832 1 .362 .997
-.200 1.302 .024 1 .878 .819
RACE
RACE(1)
RACE(2)
SMOKE
CHOL
HT
WEIGHT1
RACE * WEIGHT1
RACE(1) by WEIGHT1
RACE(2) by WEIGHT1
Constant
Step
1a
B S.E. Wald df Sig. Exp(B)
Variable(s) entered on step 1: RACE, SMOKE, CHOL, HT, WEIGHT1, RACE * WEIGHT1 .a.
Variables in the Equation
9.333 2 .009
1.469 .501 8.617 1 .003 4.346
.799 .429 3.464 1 .063 2.223
.793 .404 3.857 1 .050 2.211
1.366 .440 9.643 1 .002 3.921
1.344 .887 2.292 1 .130 3.833
-.004 .001 7.596 1 .006 .996
1.068 1.403 .579 1 .447 2.908
.511 .981 .271 1 .603 1.666
RACE
RACE(1)
RACE(2)
SMOKE
CHOL
HT
WEIGHT1
HT by SMOKE
Constant
Step
1a
B S.E. Wald df Sig. Exp(B)
Variable(s) entered on step 1: RACE, SMOKE, CHOL, HT, WEIGHT1, HT * SMOKE .a.
Variables in the Equation
8.830 2 .012
1.438 .497 8.383 1 .004 4.213
.715 .432 2.733 1 .098 2.044
-.959 1.716 .312 1 .576 .383
1.371 .441 9.682 1 .002 3.941
1.677 .716 5.480 1 .019 5.350
-.005 .002 6.275 1 .012 .995
.003 .003 1.190 1 .275 1.003
1.412 1.397 1.021 1 .312 4.104
RACE
RACE(1)
RACE(2)
SMOKE
CHOL
HT
WEIGHT1
SMOKE by WEIGHT1
Constant
Step
1a
B S.E. Wald df Sig. Exp(B)
Variable(s) entered on step 1: RACE, SMOKE, CHOL, HT, WEIGHT1, SMOKE * WEIGHT1 .a.
17
Variables in the Equation
9.032 2 .011
1.429 .494 8.367 1 .004 4.174
.772 .429 3.237 1 .072 2.163
.886 .390 5.173 1 .023 2.426
1.266 .445 8.087 1 .004 3.546
1.611 .747 4.649 1 .031 5.009
-.004 .001 7.080 1 .008 .996
4.654 15.507 .090 1 .764 104.990
.335 .945 .125 1 .723 1.398
RACE
RACE(1)
RACE(2)
SMOKE
CHOL
HT
WEIGHT1
CHOL by HT
Constant
Step
1a
B S.E. Wald df Sig. Exp(B)
Variable(s) entered on step 1: RACE, SMOKE, CHOL, HT, WEIGHT1, CHOL * HT .a.
Variables in the Equation
9.052 2 .011
1.425 .494 8.309 1 .004 4.159
.793 .429 3.423 1 .064 2.211
.861 .391 4.855 1 .028 2.366
2.087 2.358 .783 1 .376 8.059
1.750 .710 6.081 1 .014 5.757
-.004 .001 5.925 1 .015 .996
-.001 .004 .108 1 .743 .999
.247 .985 .063 1 .802 1.280
RACE
RACE(1)
RACE(2)
SMOKE
CHOL
HT
WEIGHT1
CHOL by WEIGHT1
Constant
Step
1a
B S.E. Wald df Sig. Exp(B)
Variable(s) entered on step 1: RACE, SMOKE, CHOL, HT, WEIGHT1, CHOL * WEIGHT1 .a.
Variables in the Equation
9.079 2 .011
1.430 .495 8.331 1 .004 4.178
.794 .429 3.427 1 .064 2.213
.872 .394 4.912 1 .027 2.392
1.326 .437 9.195 1 .002 3.765
1.877 2.670 .494 1 .482 6.532
-.004 .002 5.863 1 .015 .996
.000 .003 .002 1 .967 1.000
.328 1.035 .100 1 .751 1.388
RACE
RACE(1)
RACE(2)
SMOKE
CHOL
HT
WEIGHT1
HT by WEIGHT1
Constant
Step
1a
B S.E. Wald df Sig. Exp(B)
Variable(s) entered on step 1: RACE, SMOKE, CHOL, HT, WEIGHT1, HT * WEIGHT1 .a.
18
Hasil pengujian interaksi dapat dirangkumkan dalam tabel dibawah ini;
Tabel hasil uji variabel interaksi
Variabel interaksi
P value
Race1 by smoke Race2 by smoke Race1 by cholesterol Race2 by cholesterol Race1 by hipertension Race2 by hipertension Race1 by weight Race2 by weight Smoke by hipertension Smoke by weight Cholesterol by Hipertension Cholesterol by wight Hipertension by weight
0.503 0.317 0.176 0.560 0.675 0.975 0.904 0.362 0.447 0.275 0.764 0.743 0.967
Dari hasil penelitian didapatkan tidak terdapat interaksi didalam model.
Terbentuk model regresi logistik yang diinginkan
a. omnibust test,
model harus significant p<0.05 yang menunjukkan bahwa model
appropriate
Variables in the Equation
.870 .390 4.974 1 .026 2.387 1.111 5.128
1.326 .437 9.219 1 .002 3.768 1.600 8.870
-.037 .014 7.248 1 .007 .964 .938 .990
9.077 2 .011
1.429 .495 8.328 1 .004 4.176 1.582 11.025
.794 .429 3.425 1 .064 2.212 .954 5.126
1.769 .712 6.177 1 .013 5.867 1.454 23.682
.346 .946 .134 1 .715 1.413
SMOKE
CHOL
WEIGHT
RACE
RACE(1)
RACE(2)
HT
Constant
Step
1a
B S.E. Wald df Sig. Exp(B) Lower Upper
95.0% C.I.f or
EXP(B)
Variable(s) entered on step 1: SMOKE, CHOL, WEIGHT, RACE, HT.a.
19
b. Dilihat overall percentage pada classification table Dengan ketepatan dari model ini adalah 76.5%
c. Model pada penelitian ini adalah : Z = 0.346 + 1.429 race1 + 0.794 race2 + 0.870 smoke +1.326 cholesterol + 1.769 hipertension – 0.037 weight1
Omnibus Tests of Model Coefficients
39.823 6 .000
39.823 6 .000
39.823 6 .000
Step
Block
Model
Step 1
Chi-square df Sig.
Classification Tablea
123 12 91.1
35 30 46.2
76.5
ObservedNo
Yes
Coronary heart
disease
Overall Percentage
Step 1No Yes
Coronary heart
disease Percentage
Correct
Predicted
The cut value is .500a.
Variables in the Equation
.870 .390 4.974 1 .026 2.387 1.111 5.128
1.326 .437 9.219 1 .002 3.768 1.600 8.870
-.037 .014 7.248 1 .007 .964 .938 .990
9.077 2 .011
1.429 .495 8.328 1 .004 4.176 1.582 11.025
.794 .429 3.425 1 .064 2.212 .954 5.126
1.769 .712 6.177 1 .013 5.867 1.454 23.682
.346 .946 .134 1 .715 1.413
SMOKE
CHOL
WEIGHT
RACE
RACE(1)
RACE(2)
HT
Constant
Step
1a
B S.E. Wald df Sig. Exp(B) Lower Upper
95.0% C.I.f or
EXP(B)
Variable(s) entered on step 1: SMOKE, CHOL, WEIGHT, RACE, HT.a.
20
PEMILIHAN MODEL DENGAN METODE FORWARD
Omnibus Tests of Model Coefficients
14.637 1 .000
14.637 1 .000
14.637 1 .000
5.639 1 .018
20.276 2 .000
20.276 2 .000
7.157 1 .007
27.433 3 .000
27.433 3 .000
7.274 2 .026
34.708 5 .000
34.708 5 .000
5.116 1 .024
39.823 6 .000
39.823 6 .000
Step
Block
Model
Step
Block
Model
Step
Block
Model
Step
Block
Model
Step
Block
Model
Step 1
Step 2
Step 3
Step 4
Step 5
Chi-square df Sig.
Classification Tablea
123 12 91.1
45 20 30.8
71.5
125 10 92.6
45 20 30.8
72.5
124 11 91.9
42 23 35.4
73.5
121 14 89.6
41 24 36.9
72.5
123 12 91.1
35 30 46.2
76.5
Observed
No
Yes
Coronary heart
disease
Overall Percentage
No
Yes
Coronary heart
disease
Overall Percentage
No
Yes
Coronary heart
disease
Overall Percentage
No
Yes
Coronary heart
disease
Overall Percentage
No
Yes
Coronary heart
disease
Overall Percentage
Step 1
Step 2
Step 3
Step 4
Step 5
No Yes
Coronary heart
disease Percentage
Correct
Predicted
The cut value is .500a.
21
PEMILIHAN MODEL DENGAN METODE BACKWARD
Variables in the Equation
1.516 .405 14.047 1 .000 4.556
-1.006 .174 33.311 1 .000 .366
1.431 .410 12.195 1 .000 4.184
-.003 .001 4.925 1 .026 .997
.781 .805 .939 1 .332 2.183
1.450 .418 12.025 1 .001 4.263
1.874 .724 6.693 1 .010 6.514
-.004 .001 7.629 1 .006 .996
1.221 .836 2.133 1 .144 3.390
7.184 2 .028
1.287 .481 7.157 1 .007 3.623
.367 .371 .981 1 .322 1.444
1.510 .428 12.417 1 .000 4.526
1.848 .735 6.318 1 .012 6.345
-.004 .001 9.036 1 .003 .996
1.174 .888 1.748 1 .186 3.236
9.077 2 .011
1.429 .495 8.328 1 .004 4.176
.794 .429 3.425 1 .064 2.212
.870 .390 4.974 1 .026 2.387
1.326 .437 9.219 1 .002 3.768
1.769 .712 6.177 1 .013 5.867
-.004 .001 7.248 1 .007 .996
.346 .946 .134 1 .715 1.413
CHOL
Constant
Step
1a
CHOL
WEIGHT1
Constant
Step
2b
CHOL
HT
WEIGHT1
Constant
Step
3c
RACE
RACE(1)
RACE(2)
CHOL
HT
WEIGHT1
Constant
Step
4d
RACE
RACE(1)
RACE(2)
SMOKE
CHOL
HT
WEIGHT1
Constant
Step
5e
B S.E. Wald df Sig. Exp(B)
Variable(s) entered on step 1: CHOL.a.
Variable(s) entered on step 2: WEIGHT1.b.
Variable(s) entered on step 3: HT.c.
Variable(s) entered on step 4: RACE.d.
Variable(s) entered on step 5: SMOKE.e.
Omnibus Tests of Model Coefficients
39.823 6 .000
39.823 6 .000
39.823 6 .000
Step
Block
Model
Step 1
Chi-square df Sig.
Classification Tablea
123 12 91.1
35 30 46.2
76.5
ObservedNo
Yes
Coronary heart
disease
Overall Percentage
Step 1No Yes
Coronary heart
disease Percentage
Correct
Predicted
The cut value is .500a.
22
Interpretasi model
Ternyata hasil yang diperoleh pada ke-3 metode pemilihan variabel, baik
pada metode enter, backward, forward pada penelitian ini menunjukkan
kesamaan hasil.
Interpretasi dari model yang terbentuk adalah bahwa faktor-faktor yang
mempengaruhi penyakit jantung koroner adalah Ras, Merokok, Cholesterol,
hipertensi dan berat badan. Yang paling besar pengaruhnya dalam kejadian
penyakit jantung koroner adalah Hipertensi. Dimana risiko penyakit jantung
koroner pada orang yang Hipertensi adalah 6 kali dibandingkan dengan yang
tidak hipertensi dengan 95% CI (1.454 – 23.682) setelah dikontrol oleh variabel
ras, merokok, kolesterol, dan berat badan.
Risiko Penyakit jantung koroner pada orang kulit hitam adalah 4 kali
dibandingkan dengan orangkulit putih dengan 95% CI (1.454 – 23.682) setelah
dikontrol oleh variabel hipertensi, merokok, kolesterol, dan berat badan.
Sedangkan untuk kulit lainnya Odds Penyakit jantung koroner adalah 2 kali
dibandingkan dengan yang tidak hipertensi dengan 95% CI (0.954 – 5.126)
setelah dikontrol oleh variabel hipertensi, merokok, kolesterol, dan berat badan.
Risiko Penyakit jantung koroner pada orang yang merokok adalah 2 kali
dibandingkan dengan yang tidak hipertensi dengan 95% CI (1.111 - 5.128)
setelah dikontrol oleh variabel ras, hipertensi, kolesterol, dan berat badan.
Variables in the Equation
9.077 2 .011
1.429 .495 8.328 1 .004 4.176
.794 .429 3.425 1 .064 2.212
.870 .390 4.974 1 .026 2.387
1.326 .437 9.219 1 .002 3.768
1.769 .712 6.177 1 .013 5.867
-.004 .001 7.248 1 .007 .996
.346 .946 .134 1 .715 1.413
RACE
RACE(1)
RACE(2)
SMOKE
CHOL
HT
WEIGHT1
Constant
Step
1a
B S.E. Wald df Sig. Exp(B)
Variable(s) entered on step 1: RACE, SMOKE, CHOL, HT, WEIGHT1.a.
23
Risiko Penyakit jantung koroner pada orang dengan kolesterol tinggi
adalah 4 kali dibandingkan dengan yang tidak hipertensi dengan 95% CI (1.600
– 8.870) setelah dikontrol oleh variabel ras, merokok, hipertensi, dan berat
badan.
Kenaikan berat badan setiap 100 gram (0.1 kg) merupakan faktor
pencegah untuk terjadinya Penyakit jantung koroner yaitu 0.964 dengan 95% CI
(0.938 – 0.990) setelah dikontrol oleh variabel ras, merokok, kolesterol, dan
hipertensi.
2. MODEL ESTIMASI
Selanjutnya akan dibahas langkah dalam strategi pemodelan regresi logistik
dengan tujuan untuk mengestimasi hubungan paparan dan penyakit.
Langkah untuk melakukan strategi pemodelan dibutuhkan 3 tahap:
1. Variabel specification
peneliti melakukan penelusuran literature unttuk membatasi pada variabel
independen yang memang bermakna secara klinik maupun biologik.
Variabel ini dapat didefinsikan pada model sebagai langkah awal yang
paling mungkin masuk dalam model.
2. Interaction assesment
Bila terdapat interaksi maka OR dilaporkan terpisah
3. Confounding assesment followed by consideration of precision
Model terakhir adalah model dengan variabel interaksi dan konfounding
yang terpilih.
LANGKAH PEMBUATAN MODEL Langkah untuk melakukan spesifikasi variabel secara jelas, dilakukan
pemodelan secara lengkap, mencakup semua variabel utama, kandidat
konfounding dan kandidat interaksi, yaitu:
24
1. Hierarchically Well-Formulated Models
Merupakan initial model. Model memiliki seluruh lower order component of
any term in the model.
2. The Hierarichal Backward Elimination Approach
Setelah didapatkan initial model strategi selanjutnya adalah prosedur
Hierarichal Backward Elimination Approach untuk mengeluarkan variabel.
Uji statistik digunakan untuk menguji interaksi. Tapi untuk mengeliminasi
confounders tidak menggunakan uji statistik. Strategi ini prisip kerjanya
adalah dari large starting model smaller final model.
Initial model
interaction
confounder
3. The Hierarchy Principles for retaining variables
Jika suatu variabel terdapat dalam model , maka semua lower-order
components juga harus ada dalam model.
CONTOH PEMODELAN ESTIMASI
Model untuk mengetahui hubungan merokok dengan terjadinya penyakit jantung
koroner, data yang digunakan adalah data CHD.
Eliminate EViEj
Eliminate Vi dan ViVj
Eliminate EVi
25
Tujuan penelitian:
Ingin mengetahui hubungan antara merokok dan kejadian penyakit jantung
koroner, dengan dikontrol oleh variabel independen lainnya.
Kerangka konsep:
Smoke Coronary Heart Diseases
Age
Race High Cholesterol
Hypertension Diabetes Mellitus
Number of exercise Weight
Langkah pemodelan yang dilakukan adalah :
1. Variable spesification.
Melakukan pemodelan lengkap (Hierarchically Well Formulated Model)
dengan mencakup semua variabel utama, variabel confounding dan
kandidat interaksi
Variabel dependen adalah : Coronary Heart Diseases Variabel Independen yaitu : Variabel Resiko adalah
Smoke,
26
Variabel Confounder adalah
Age,
Race,
High cholelesterol,
Hypertension ,
Diabetes mellitus,
Number of exercise,
Weight (pada variabel weight dilakukan compute dengan mengalikan dengan 10, agar desimal pada variabel weight menjadi satuan. Hal ini dilakukan untuk memperhitungkan kenaikan dalam 1 unit untuk perhitungan OR agar tidak berlipat banyak)
Variabel Interaksi adalah :
Smoke*Age
Smoke*Race
Smoke*Hypertension
Smoke*weight
VARIABEL SPESIFICATION: MODEL HWF
2. Melakukan Interaction assesment,
Variables in the Equation
-.086 .056 2.353 1 .125 .918
1.698 2 .428
.777 .801 .942 1 .332 2.176
.760 .608 1.562 1 .211 2.137
-2.326 2.555 .829 1 .363 .098
1.447 .462 9.792 1 .002 4.251
1.571 .928 2.865 1 .091 4.813
.664 .469 2.005 1 .157 1.942
-.031 .182 .030 1 .863 .969
-.004 .002 3.773 1 .052 .996
.089 .078 1.280 1 .258 1.093
2.406 2 .300
1.150 1.094 1.106 1 .293 3.159
-.684 .939 .531 1 .466 .504
.515 1.517 .115 1 .734 1.674
.002 .003 .311 1 .577 1.002
2.670 1.844 2.096 1 .148 14.445
AGE
RACE
RACE(1)
RACE(2)
SMOKE
CHOL
HT
DM
EXER
WEIGHT1
AGE by SMOKE
RACE * SMOKE
RACE(1) by SMOKE
RACE(2) by SMOKE
HT by SMOKE
SMOKE by WEIGHT1
Constant
Step
1a
B S.E. Wald df Sig. Exp(B)
Variable(s) entered on step 1: AGE, RACE, SMOKE, CHOL, HT, DM, EXER, WEIGHT1, AGE * SMOKE ,
RACE * SMOKE , HT * SMOKE , SMOKE * WEIGHT1 .
a.
27
yang dilakukan dengan menghilangkan Interaksi yang memiliki p value
yang tertinggi dan di run kembali satu persatu sampai ditemukan Interaksi
yang signifikan. Didapatkan hasil nilai p dari masing-masing interaksi
sebagai berikut :
INTERACTION SPESIFICATION
Seluruh kemungkinan interaksi yang ada dimasukkan dalam model
Variables in the Equation
-.086 .056 2.365 1 .124 .917
1.671 2 .434
.772 .804 .923 1 .337 2.164
.756 .609 1.539 1 .215 2.130
-2.470 2.505 .973 1 .324 .085
1.432 .460 9.676 1 .002 4.188
1.770 .735 5.792 1 .016 5.868
.673 .468 2.072 1 .150 1.961
-.028 .181 .025 1 .875 .972
-.004 .002 3.892 1 .049 .996
.088 .078 1.263 1 .261 1.092
2.377 2 .305
1.122 1.088 1.063 1 .302 3.070
-.696 .938 .551 1 .458 .499
.002 .003 .505 1 .477 1.002
2.706 1.844 2.153 1 .142 14.967
AGE
RACE
RACE(1)
RACE(2)
SMOKE
CHOL
HT
DM
EXER
WEIGHT1
AGE by SMOKE
RACE * SMOKE
RACE(1) by SMOKE
RACE(2) by SMOKE
SMOKE by WEIGHT1
Constant
Step
1a
B S.E. Wald df Sig. Exp(B)
Variable(s) entered on step 1: AGE, RACE, SMOKE, CHOL, HT, DM, EXER, WEIGHT1, AGE * SMOKE ,
RACE * SMOKE , SMOKE * WEIGHT1 .
a.
28
Variables in the Equation
-.091 .055 2.695 1 .101 .913
1.896 2 .387
.687 .791 .754 1 .385 1.987
.824 .601 1.880 1 .170 2.279
-1.312 1.889 .482 1 .487 .269
1.420 .461 9.510 1 .002 4.138
1.841 .730 6.360 1 .012 6.302
.629 .462 1.850 1 .174 1.875
-.016 .180 .008 1 .930 .984
-.003 .001 5.042 1 .025 .997
.093 .078 1.447 1 .229 1.098
3.233 2 .199
1.270 1.072 1.404 1 .236 3.561
-.781 .930 .705 1 .401 .458
2.066 1.572 1.727 1 .189 7.892
AGE
RACE
RACE(1)
RACE(2)
SMOKE
CHOL
HT
DM
EXER
WEIGHT1
AGE by SMOKE
RACE * SMOKE
RACE(1) by SMOKE
RACE(2) by SMOKE
Constant
Step
1a
B S.E. Wald df Sig. Exp(B)
Variable(s) entered on step 1: AGE, RACE, SMOKE, CHOL, HT, DM, EXER, WEIGHT1, AGE * SMOKE
, RACE * SMOKE .
a.
Variables in the Equation
-.077 .053 2.115 1 .146 .925
6.884 2 .032
1.279 .506 6.403 1 .011 3.595
.718 .444 2.617 1 .106 2.050
-1.070 1.730 .383 1 .536 .343
1.328 .451 8.676 1 .003 3.774
1.836 .716 6.574 1 .010 6.271
.506 .454 1.244 1 .265 1.659
-.019 .175 .011 1 .915 .981
-.003 .001 5.854 1 .016 .997
.085 .075 1.286 1 .257 1.089
1.844 1.449 1.621 1 .203 6.325
AGE
RACE
RACE(1)
RACE(2)
SMOKE
CHOL
HT
DM
EXER
WEIGHT1
AGE by SMOKE
Constant
Step
1a
B S.E. Wald df Sig. Exp(B)
Variable(s) entered on step 1: AGE, RACE, SMOKE, CHOL, HT, DM, EXER, WEIGHT1, AGE *
SMOKE .
a.
29
Tabel hasil uji variabel interaksi
Jenis Interaksi yang dihilangkan
P value
Hipertensi by smoke Smoke by weight Race by smoke Age by smoke
0.734 0.477 0.401 0.257
Dari hasil diatas ternyata tidak terdapat interaksi yang significan didalam
model.
Variables in the Equation
-.037 .038 .984 1 .321 .963
8.078 2 .018
1.371 .498 7.576 1 .006 3.940
.749 .442 2.875 1 .090 2.115
.849 .398 4.558 1 .033 2.337
1.377 .453 9.243 1 .002 3.964
1.805 .712 6.433 1 .011 6.083
.408 .445 .842 1 .359 1.504
-.008 .174 .002 1 .962 .992
-.003 .001 5.987 1 .014 .997
.962 1.202 .641 1 .423 2.618
AGE
RACE
RACE(1)
RACE(2)
SMOKE
CHOL
HT
DM
EXER
WEIGHT1
Constant
Step
1a
B S.E. Wald df Sig. Exp(B)
Variable(s) entered on step 1: AGE, RACE, SMOKE, CHOL, HT, DM, EXER, WEIGHT1.a.
Variables in the Equation
-.037 .038 .984 1 .321 .963
8.078 2 .018
1.371 .498 7.576 1 .006 3.940
.749 .442 2.875 1 .090 2.115
.849 .398 4.558 1 .033 2.337
1.377 .453 9.243 1 .002 3.964
1.805 .712 6.433 1 .011 6.083
.408 .445 .842 1 .359 1.504
-.008 .174 .002 1 .962 .992
-.003 .001 5.987 1 .014 .997
.962 1.202 .641 1 .423 2.618
AGE
RACE
RACE(1)
RACE(2)
SMOKE
CHOL
HT
DM
EXER
WEIGHT1
Constant
Step
1a
B S.E. Wald df Sig. Exp(B)
Variable(s) entered on step 1: AGE, RACE, SMOKE, CHOL, HT, DM, EXER, WEIGHT1.a.
30
Maka full model pada penelitian ini adalah :
Z = 0.962 - 0.037 age +1.371 race1 + 0.749 race2 + 0.849 smoke +1.377
chol + 1.805 ht +0.408 DM – 0.008 exer – 0.003 weight1
Dengan OR smoke full model adalah 2.337, yaitu OR smoke yang telah
terkontrol oleh variabel lainnya.
3. Confounder assesment
Dilakukan dengan cara Hierarchical Backward Elimination yaitu ;
membandingkan OR full model dengan OR Reduced Model. Bila besar
perubahan OR yang terjadi kurang dari 10 % maka model yang digunakan
adalah Reduced Model Tujuannya adalah untuk mendapatkan validitas.
Langkah yang dilakukan adalah dengan menghilangkan variabel yang
memiliki nilai p value yang tertinggi, kemudian di run kembali dan
dibandingkan ; Delta antara OR Reduced model dengan OR full model
dibagi dengan OR full model .
Bila besarnya perubahan < 10 % maka digunakan Reduced model.
Bila besar perubahan OR > 10 % maka variabel tersebut
dimasukkan kembali, Selanjutnya dilihat variabel lainnya untuk
dikeluarkan dan diperbandingkan kembali, satu persatu.
CONFOUNDING ASSESMENT
31
Variables in the Equation
-.038 .037 1.031 1 .310 .963
8.148 2 .017
1.372 .497 7.610 1 .006 3.945
.752 .439 2.936 1 .087 2.120
.851 .395 4.640 1 .031 2.342
1.377 .453 9.242 1 .002 3.963
1.808 .709 6.504 1 .011 6.101
.409 .444 .850 1 .357 1.506
-.003 .001 6.034 1 .014 .997
.963 1.201 .644 1 .422 2.621
AGE
RACE
RACE(1)
RACE(2)
SMOKE
CHOL
HT
DM
WEIGHT1
Constant
Step
1a
B S.E. Wald df Sig. Exp(B)
Variable(s) entered on step 1: AGE, RACE, SMOKE, CHOL, HT, DM, WEIGHT1.a.
Variables in the Equation
-.041 .037 1.276 1 .259 .959
7.939 2 .019
1.346 .498 7.315 1 .007 3.842
.756 .436 3.007 1 .083 2.129
.860 .394 4.776 1 .029 2.364
1.434 .450 10.165 1 .001 4.197
1.745 .707 6.097 1 .014 5.725
-.003 .001 6.137 1 .013 .997
1.139 1.178 .935 1 .334 3.125
AGE
RACE
RACE(1)
RACE(2)
SMOKE
CHOL
HT
WEIGHT1
Constant
Step
1a
B S.E. Wald df Sig. Exp(B)
Variable(s) entered on step 1: AGE, RACE, SMOKE, CHOL, HT, WEIGHT1.a.
Variables in the Equation
9.077 2 .011
1.429 .495 8.328 1 .004 4.176
.794 .429 3.425 1 .064 2.212
.870 .390 4.974 1 .026 2.387
1.326 .437 9.219 1 .002 3.768
1.769 .712 6.177 1 .013 5.867
-.004 .001 7.248 1 .007 .996
.346 .946 .134 1 .715 1.413
RACE
RACE(1)
RACE(2)
SMOKE
CHOL
HT
WEIGHT1
Constant
Step
1a
B S.E. Wald df Sig. Exp(B)
Variable(s) entered on step 1: RACE, SMOKE, CHOL, HT, WEIGHT1.a.
Variables in the Equation
.560 .332 2.845 1 .092 1.751
1.324 .426 9.665 1 .002 3.758
1.812 .703 6.637 1 .010 6.120
-.004 .001 6.991 1 .008 .997
.877 .851 1.064 1 .302 2.405
SMOKE
CHOL
HT
WEIGHT1
Constant
Step
1a
B S.E. Wald df Sig. Exp(B)
Variable(s) entered on step 1: SMOKE, CHOL, HT, WEIGHT1.a.
32
Dari hasil out put penelitian dapat diringkaskan dalam tabel dibawah ini :
Variables in the Equation
.870 .390 4.974 1 .026 2.387
1.326 .437 9.219 1 .002 3.768
1.769 .712 6.177 1 .013 5.867
-.004 .001 7.248 1 .007 .996
9.077 2 .011
1.429 .495 8.328 1 .004 4.176
.794 .429 3.425 1 .064 2.212
.346 .946 .134 1 .715 1.413
SMOKE
CHOL
HT
WEIGHT1
RACE
RACE(1)
RACE(2)
Constant
Step
1a
B S.E. Wald df Sig. Exp(B)
Variable(s) entered on step 1: SMOKE, CHOL, HT, WEIGHT1, RACE.a.
Variables in the Equation
.872 .383 5.193 1 .023 2.391
1.319 .429 9.472 1 .002 3.740
-.003 .001 4.693 1 .030 .997
9.551 2 .008
1.428 .488 8.554 1 .003 4.172
.831 .418 3.949 1 .047 2.296
-.123 .907 .018 1 .893 .885
SMOKE
CHOL
WEIGHT1
RACE
RACE(1)
RACE(2)
Constant
Step
1a
B S.E. Wald df Sig. Exp(B)
Variable(s) entered on step 1: SMOKE, CHOL, WEIGHT1, RACE.a.
Variables in the Equation
.976 .371 6.915 1 .009 2.654
1.377 .422 10.675 1 .001 3.964
9.109 2 .011
1.230 .467 6.939 1 .008 3.420
.980 .407 5.804 1 .016 2.665
-1.965 .360 29.863 1 .000 .140
SMOKE
CHOL
RACE
RACE(1)
RACE(2)
Constant
Step
1a
B S.E. Wald df Sig. Exp(B)
Variable(s) entered on step 1: SMOKE, CHOL, RACE.a.
Variables in the Equation
1.063 .368 8.345 1 .004 2.896
9.854 2 .007
1.382 .480 8.273 1 .004 3.983
.895 .405 4.886 1 .027 2.447
-.003 .001 5.752 1 .016 .997
.155 .871 .031 1 .859 1.167
SMOKE
RACE
RACE(1)
RACE(2)
WEIGHT1
Constant
Step
1a
B S.E. Wald df Sig. Exp(B)
Variable(s) entered on step 1: SMOKE, RACE, WEIGHT1.a.
33
Smoke
High cholesterol Weight Race
Coronary Heart Disease
Tabel hasil uji confounder
Confounder yang dikeluarkan
P value
OR Smoke Reduced
Model
Delta OR
Red dg OR full model
Besar
perubahan OR (%)
Exercise Diabetes mellitus Age Race Hypertension Weight1 Cholesterol
0.962 0.357 0.259 0.064 0.013 0.030 0.02
2.342 2.364 2.387 1.751 2.391 2.654 2.896
0.005 0.027 0.05
0.586 0.054 0.317 0.559
0.214 1.155 2.139 25.07 2.31
13.56 23.92
Dari hasil diatas didapatkan bahwa variabel confounder yang masuk
kedalam model adalah variabel Race(Cat), Weight1, Cholesterol dengan
OR Smoke pada Reduced Model adalah 2.391
4. Final Model , yaitu model yang paling parsimonious dalam penelitian ini
adalah :
34
Interpretasi model
Merokok memiliki hubungan dengan Penyakit Jantung Koroner setelah
dikontrol oleh Ras, Berat Badan dan Kadar Kholesterol. Dimana risiko untuk
menderita Penyakit jantung koroner pada orang yang merokok adalah 2 kali
dibanding orang yang tidak merokok setelah dikontrol variabel ras, berat badan
dan kadar kolesterol. 95% CI OR adalah (1.13-5.062)
Omnibus Tests of Model Coefficients
33.309 5 .000
33.309 5 .000
33.309 5 .000
Step
Block
Model
Step 1
Chi-square df Sig.
Classification Tablea
123 12 91.1
39 26 40.0
74.5
ObservedNo
Yes
Coronary heart
disease
Overall Percentage
Step 1No Yes
Coronary heart
disease Percentage
Correct
Predicted
The cut value is .500a.
Variables in the Equation
.872 .383 5.193 1 .023 2.391 1.130 5.062
1.319 .429 9.472 1 .002 3.740 1.615 8.665
-.003 .001 4.693 1 .030 .997 .995 1.000
9.551 2 .008
1.428 .488 8.554 1 .003 4.172 1.602 10.867
.831 .418 3.949 1 .047 2.296 1.012 5.210
-.123 .907 .018 1 .893 .885
SMOKE
CHOL
WEIGHT1
RACE
RACE(1)
RACE(2)
Constant
Step
1a
B S.E. Wald df Sig. Exp(B) Lower Upper
95.0% C.I. for EXP(B)
Variable(s) entered on step 1: SMOKE, CHOL, WEIGHT1, RACE.a.
35
DAFTAR PUSTAKA Bland M, 1996
An Introduction to Medical Statistics. Second edition. Oxford University Press. USA
Hosmer D, Lemeshow, 2000
Applied Logistic Regression . second edition. Jhon Willey & son, inc. USA Kleinbaum D, 1996
Statistic in the health science. Logistic Regression A Self-learning text. Springer-Verlag , New York
Kleinbaum D, Kupper L, Morgenstern H, 1996 Epidemiologic Research. Principles and Quantitative Methods. Van Nostrand Reinhold Company. New York
Pagano M, Gauvreu K, 1997 Principles of Biostatistic Duxburry Press, California. Riono P, 1992
Aplikasi regresi Logistik. Fakultas Kesehatan Masyarakat Universitas Indonesia