regresi logistik modul
DESCRIPTION
analisis manajemen kesehatanTRANSCRIPT
MODUL MATA KULIAH
ANALISIS MULTIVARIAT APLIKASI REGRESI LOGISTIK
Oleh
Prof. Dr. dr. RIZANDA MACHMUD, M.Kes
PROGRAM STUDI S3 KEDOKTERAN PROGRAM PASCASARJANA UNIVERSITAS ANDALAS
KERJASAMA UNIVERSITAS RIAU
DAFTAR ISI
DAFTAR ISI...........................................................................................................2
I. PENGANTAR REGRESI LOGISTIK..............................................................3
II. MODEL REGRESI LOGISTIK........................................................................4
III. STUDY DESIGN ISSUE.............................................................................5
IV. STRATEGI PEMODELAN REGRESI LOGISTIK........................................6
1. MODEL PREDIKSI..................................................................................7
2. MODEL ESTIMASI................................................................................23
DAFTAR PUSTAKA............................................................................................35
2
I. PENGANTAR REGRESI LOGISTIK
Analisis regresi logistik adalah suatu pendekatan model matematis yang
dapat digunakan untuk menggambarkan hubungan antara banyak variabel
independen dengan variabel dependen yang bersifat dikotomus. Variabel
independen dapat bertipe apa saja, dan asumsi distribusi variabel adalah bebas
(Kleinbaum, 1996).
Fungsi logistik merupakan fungsi matematik dengan rumus:
ƒ(z) =
1
1+e−z
Saat ini modelling prosedur dengan menggunakan regressi logistik paling
populer dibandingkan modelling prosedur lainnya yang digunakan untuk anlisa
epidemioligik bila ukuran penyakit yang digunakan adalah dikotomus.
Penjelasannya adalah sebagai berikut:
Terlihat pada gambar fungsi logistik terletak pada nilai z antara -∞ dan +∞.
Pada saat nilai z= -∞ maka ƒ(z) =0 dan pada saat z= +∞ maka ƒ(z) =1
Jadi nilai ƒ(z) akan berkisar antara 0 dan1. Sehingga model logistik dapat
digunakan untuk menggambarkan probabilitas yang selalu memiliki nilai antara 0
dan 1. Pada epidemiologi, probabilitas ini dikenal sebagai risiko untuk terjadinya
penyakit.
Alasan lainnya mengapa fungsi logistik ini populer untuk analisis data
epidemiologik adalah bentuk dari kurva logistik. Seperti terlihat pada gambar,
nilai ƒ(z) meningkat secara perlahan pada saat z berubah dari -∞ ke arah 0,
kemudian ƒ(z) meningkat secara cepat dan kemudian peningkatannya kembali
perlahan pada saat ƒ(z) mendekati 1 ketika z meningkat menjadi +∞. Hasilnya
adalah kurva yang berbentuk S.
Kurva yang berbentuk S ini dianggap cocok untuk menggambarkan
peningkatan risiko terjadinya outcome pada penelitia epidemiologi, jikaz
dianggap sebagai indeks yang menggabungkan efek dari berbagai faktor risiko
dan ƒ(z) merupakan risiko pada nilai z tertentu. Bentuk kurva S menunjukkan
3
efek z pada risiko individu minimal pada nilai z kecil sampai pada satu batas
ambang tertentu dan tetap tinggi saat risiko mendekati 1 dan nilai z cukup besar.
Menurut ahli epidemiologi, konsep ambang batas (threshold) ini dapat
digunakan pada berbagai keadaan penyakit. Jadi bentuk kurva logistik dapat
digunakan secara luas pada analisis multivariabel pada penelitian epidemiologi.
1
ƒ(z) =
1
1+e−z =0 ½ ƒ(z) =
1
1+e−z =1
- ∞ 0 +∞
Z
threshold
Range : 0 ≤ ƒ(z) ≤ 1
Individual risk : 0 ≤ probability ≤ 1
II. MODEL REGRESI LOGISTIK
Model regresi logistik dituliskan dalam bentuk penjumlahan linier yaitu:
Z = α +β1X1 + β2X2 + …+βkXk
dimana X1,X2 dan Xk merupakan variabel independen. Jadi z merupakan
indeks yang menggabungkan x. Kemudian nilai z pada fungsi logistik diganti
penjumlahan linier sehingga fungsi logistik dapat dituliskan:
4
ƒ(z) =
1
1+e−(α+β1 χ1+β2 χ2+. . . .+βk χ k )
Dimana f(z) merupakan probabilitas untuk terjadinya suatu keluaran. Pada
penelitian kesehatan, probabilitas ini untuk terjadinya penyakit (1) atau tidak
terjadinya penyakit (0) pada kombinasi variabel independen. Jadi fungsi logistik
dapat dituliskan sebagai berikut:
P(D) =
1
1+e−(α+β1 χ1+β2 χ2+. . . ..+βk χk )
Pada model logistik, α dan βi merupakan parameter yang tidak diketahui
yang perlu di estimasi dengan menggunakan data yang ada. Estimasi parameter
dilakukan dengan menggunakan metode maximum likelihood dengan fungsi
likelihood:
L =
∏l=1
n
exp(α+∑i=1
k
βi χ il)∏l=1
n [1+exp(α+∑i=1
k
β i χ il)]Estimasi parameter terlalu kompleks untuk dilakukan dengan perhitungan
manual, sehingga perhitungan dilakukan dengan perangkat lunak statistik.
Hasil turunan matematik pada fungsi logistik menunjukkan bahwa ekponen βi
adalah OR.
III. STUDY DESIGN ISSUE
Analisis regresi logistik digunakan pada disain cohort, dan dapat juga pada
disain case control maupun pada cross sectional. Meskipun logistik modelling
dapat digunakan untuk disain case control dan cross sectional, tapi terdapat
keterbatasan analisa untuk disain ini. Pada disain kohort, model logistik dapat
digunakan untuk memprediksi risiko individual, tapi pada disain case control dan
cross sectional kita tidak memprediksi individual risk, hanya bisa memakai hasil
estimasi OR saja.
5
Tabel penggunaan interpretasi
Interpretasi cohort Case control Cross sectional
P (D) ya tidak tidak
OR ya ya ya
IV. STRATEGI PEMODELAN REGRESI LOGISTIK
Ada secara tipikal 2 tujuan (goals) dalam mathematical modeling pada regresi
logistik:
1. untuk mendapatkan valid estimasi dari hubungan suatu exposure-
penyakit, disebut model Estimasi
2. untuk mendapatkan model prediksi yang dianggap terbaik untuk
memprediksi kejadian variabel dependen (outcome), disebut model
Prediksi
Tergantung dari tujuan peneliti, maka strategi yang digunakan juga berbeda
untuk masing-masing tujuan (different strategies for different goals).
Pada tabel akan dijelaskan lebih lanjut perbedaan kedua model tersebut.
Tabel Perbedaan model prediksi dan model estimasi
Perbedaan Model Prediksi Model Estimasi
Kedudukan variabel pada model
semua variabel dianggap sama penting, sehingga dapat dilakukan estimasi beberapa koefisien sekaligus
diutamakan adalah nilai koefisien regresi suatu determinan yang ingin dipelajari, sedangkan variabel lain dipertimbangkan sebagai kontrol.
Bentuk model Model yang paling tepat dan paling sederhana (parsimoni)
Modelnya relatif lebih kaya dibandingkan model prediksi
6
Hal penting yang harus diperhatikan pada waktu kita melakukan strategi
pemodelan adalah sebagai berikut:
Kita harus melakukan check untuk kemungkinan terjadinya
multicollinearity.
Juga harus diperhatikan Influential observation. Individual data dapat
mempengaruhi koefisien regresi, seperti contoh outlier. Koefisien dapat
berubah bila outlier dikeluarkan dari analisis.
Bila variabel independen memiliki kategori lebih dari 2 kategori, maka
variabel tersebut disebut variabel dummy, pada analisa harus dilakukan
kategorisasi. Akibat bila tidak dilakukan pengkategorian, hubungan antara
variabel dependen dan independen (OR) dianalisakan sebagai numerik
bukan kelompok, ini dapat menimbulkan salah interpretasi. Cara
pengkategorian akan dijelaskan pada contoh latihan.
Identifikasi untuk variabel independen yang kontinu, adalah mengganti
variabel kontinyu dengan variabel yang bersifat kategorikal. Pembagian ini
berdasarkan pembagian kuartil dan kemudian dilakukan plotting koefisien
estimasi dengan titik tengah kuartil. Kalau dianggap tidak linier, maka
dianjurkan untuk dirubah menjadi dikotom atau tetap sebagai variabel
kontinyu kalau hanya bertindak sebagai variabel kontrol.
Untuk variabel yang bersifat kontinyu, diusahakan agar data/nilai variabel
tidak dalam bentuk desimal. Karena OR yang terbentuk, akan
diperhitungkan sesuai kenaikan per desimal tersebut. Dampaknya nilai
OR akan menjadi besar dalam bentuk ratusan atau ribuan.
1. MODEL PREDIKSI
Ketika tujuannya adalah untuk prediksi, maka bisa menggunakan computer
algorithms, seperti backward elimination atau semua kemungkinan regression,
sesuai dengan paket yang ada dalam komputer.
Langkah-langkah yang dilakukan dalam memprediksi model adalah :
7
Mencari covariat potensial yang akan dimasukkan kedalam model dengan
cara melakukan screening untuk menseleksi variabel
a. Variabel kategori menggunakan uji crosstab
b. Variabel kontinyu menggunakan uji t
analisis bivariat masing-masing variabel independen dengan variabel
dependen, bila nilai p yang didapat < 0.25 dimasukkan sebagai covariat
potensial. Kriteria ini ditetapkan berdasarkan pengalaman empirik,
penggunaan nilai α yang lazim 0.05 seringkali tidak berhasil
mengidentifikasikan variabel yang dianggap penting.
Maka terbentuk variabel yang akan masuk kedalam candidat model.
Model ini disebut juga sebagai main effects model.
Melakukan pemilihan variabel dengan memasukkan semua variabel yang
telah terpilih sebagai candidat model.
Pemilihan variabel yang dilakukan dalam memilih variabel dapat dilakukan
dengan 2 cara (tersedia dalam paket komputer), seperti:
a. Pemilihan dengan manual; Enter
b. Pemilihan variabel oleh komputer; Forward, Backward dan
Stepwise
Kesemua cara ini memiliki tujuan yang sama yaitu mendapatkan model
yang parsimoni. Kecenderungan peneliti adalah memilih dengan metode
enter, karena peneliti dapat memilih variabel yang masuk atau
mengeluarkan variabel yang bisa diterangkan secara substantif keilmuan.
Untuk pemilihan variabel dengan komputer, setelah kita masukkan
seluruh candidat model maka akan keluar langsung hasil model yang
parsimonimenurut komputer. Untuk selanjutnya akan dibicarakan dengan
cara enter.
Dari model yang lengkap kemudian secara bertahap dihilangkan satu
persatu variabel yang memiliki nilai p > 0.05, dimulai dari variabel dengan
nilai p tertinggi. Model di run kembali sehingga didapatkan masing-masing
variabel memiliki nilai p yang < 0.05
8
Dilakukan test interaksi berdasarkan substansi. Dari model yang telah
ada, dilakukan satu persatu kemungkinan adanya interaksi. Lakukan
pemilihan variabel interaksi seperti langkah diatas.
Terbentuk model regresi logistik yang diinginkan
CONTOH PEMODELAN PREDIKSI
Model untuk mengetahui faktor risiko terjadinya penyakit jantung koroner, data
yang digunakan adalah data CHD.
Tujuan penelitian
ingin mengetahui faktor risiko terjadinya penyakit jantung koroner .
Kerangka konsep :
AgeRaceSmokeHigh Cholesterol Coronary Heart DiseaseHypertensionDiabetes MellitusNumber of exerciseWeight
Diperiksa dahulu apakah terdapat multikolinieritas antar variabel
dependen, dengan melihat nilai r
9
Correlations
1 .236** .181*
. .001 .010
200 200 200
.236** 1 .142*
.001 . .044
200 200 200
.181* .142* 1
.010 .044 .
200 200 200
Pearson Correlat ion
Sig. (2-tailed)
N
Pearson Correlat ion
Sig. (2-tailed)
N
Pearson Correlat ion
Sig. (2-tailed)
N
Age
Number ofexercises/week
WEIGHT1
Age
Number ofexercises/
week WEIGHT1
Correlat ion is signif icant at the 0.01 level (2-tailed).**.
Correlat ion is signif icant at the 0.05 level (2-tailed).*.
Nilai r seluruhnya < 0.8 Tidak ada korelasi yang lebih dari 0.8, sehingga koliniearitas bukan masalah serius
Mencari covariat potensial yang akan dimasukkan kedalam model dengan
cara melakukan screening untuk menseleksi variabel
a. Variabel kategori menggunakan uji crosstab yaitu : race, smoke
high cholesterol
SCREENING CANDIDAT MODEL
Variabel kategorirace
Chi-Square Tests
5.593a 2 .061
5.529 2 .063
2.790 1 .095
200
Pears on Chi-Square
Lik el ihood Ratio
Linear-by -LinearAs s oc iation
N of Val id Cas es
Value dfAs y mp. Sig.
(2-s ided)
0 c el ls (.0%) hav e ex pec ted c ount les s than 5. Theminimum ex pec ted c ount is 9.75.
a.
smoking
10
Chi -Square Tests
6. 569b 1 . 010
5. 806 1 . 016
6. 520 1 . 011
. 014 . 008
6. 536 1 . 011
200
Pearson Chi-Square
Cont inuit y Cor rect ion a
Likelihood Rat io
Fisher 's Exact Test
Linear-by-LinearAssociat ion
N of Valid Cases
Value dfAsymp. Sig.
(2-sided)Exact Sig.(2-sided)
Exact Sig.(1-sided)
Comput ed only f or a 2x2 t ablea.
0 cells ( . 0%) have expect ed count less t han 5. The minimum expect ed count is26. 65.
b.
high cholesterol
Chi -Square Tests
15. 629b 1 . 000
14. 043 1 . 000
14. 637 1 . 000
. 000 . 000
15. 551 1 . 000
200
Pearson Chi-Square
Cont inuit y Cor rect ion a
Likelihood Rat io
Fisher 's Exact Test
Linear-by-LinearAssociat ion
N of Valid Cases
Value dfAsymp. Sig.
(2-sided)Exact Sig.(2-sided)
Exact Sig.(1-sided)
Comput ed only f or a 2x2 t ablea.
0 cells ( . 0%) have expect ed count less t han 5. The minimum expect ed count is10. 40.
b.
hypertension
Chi -Square Tests
3. 884b 1 . 049
2. 732 1 . 098
3. 600 1 . 058
. 060 . 053
3. 864 1 . 049
200
Pearson Chi-Square
Cont inuit y Cor rect ion a
Likelihood Rat io
Fisher 's Exact Test
Linear-by-LinearAssociat ion
N of Valid Cases
Value dfAsymp. Sig.
(2-sided)Exact Sig.(2-sided)
Exact Sig.(1-sided)
Comput ed only f or a 2x2 t ablea.
1 cells (25. 0%) have expect ed count less t han 5. The minimum expect ed count is3. 90.
b.
diabetes melitus
11
Chi -Square Tests
2. 681b 1 . 102
2. 041 1 . 153
2. 570 1 . 109
. 143 . 078
2. 667 1 . 102
200
Pearson Chi-Square
Cont inuit y Cor rect ion a
Likelihood Rat io
Fisher 's Exact Test
Linear-by-LinearAssociat ion
N of Valid Cases
Value dfAsymp. Sig.
(2-sided)Exact Sig.(2-sided)
Exact Sig.(1-sided)
Comput ed only f or a 2x2 t ablea.
0 cells ( . 0%) have expect ed count less t han 5. The minimum expect ed count is10. 07.
b.
Tabel hasil uji bivariat variabel independen kategori dengan CHD
Variabel Independen Kategorik Hasil screening nilai P
1. Race2. Smoke3. Cholesterol4. Hipertension5. Diabetes melitus
0.0610.080.00
0.0530.078
Semua terpilih sebagai variabel kandidat dalam model karena nilai p<0.25
b. Variabel kontinyu menggunakan uji t yaitu; age, number dan weight
variabel kontinyu
In d e p e n d e n t Sa mp le s T e s t
3 .8 2 4 .0 5 2 1 .5 7 5 1 9 8 .11 7 1 .2 5 .7 9 6 -.3 1 6 2 .8 2 3
1 .6 9 2 1 5 2 .5 4 4 .0 9 3 1 .2 5 .7 4 1 -.2 1 0 2 .7 1 7
2 .4 0 9 .1 2 2 2 .6 5 5 1 9 8 .0 0 9 5 9 .9 2 2 2 .5 6 4 1 5 .4 2 0 1 0 4 .4 1 5
2 .8 5 8 1 5 3 .2 2 3 .0 0 5 5 9 .9 2 2 0 .9 6 3 1 8 .5 0 4 1 0 1 .3 3 1
.0 3 7 .8 4 8 1 .1 9 7 1 9 8 .2 3 3 .1 9 .1 5 9 -.1 2 3 .5 0 4
1 .2 2 6 1 3 4 .6 0 5 .2 2 2 .1 9 .1 5 5 -.11 7 .4 9 7
Eq u a l v a ria n c e sa s s u me d
Eq u a l v a ria n c e sn o t a s s u me d
Eq u a l v a ria n c e sa s s u me d
Eq u a l v a ria n c e sn o t a s s u me d
Eq u a l v a ria n c e sa s s u me d
Eq u a l v a ria n c e sn o t a s s u me d
Ag e
WEIGHT 1
Nu mb e r o fe x e rc is e s /we e k
F Sig .
L e v e n e 's T e s t fo rEq u a lity o f Va ria n c e s
t d f Sig . (2 -ta ile d )Me a n
Diffe re n c eStd . Erro r
Diffe re n c e L o we r Up p e r
9 5 % Co n fid e n c eIn te rv a l o f th eDiffe re n c e
t-te s t fo r Eq u a lity o f Me a n s
12
Tabel hasil uji bivariat variabel independen kontinyu dengan CHD
Variabel Independen Kontinyu Hasil screening nilai P
1. Age2. number of exercise3. weight
0.1170.2330.09
Semua variabel kontinyu terpilih dalam model karena memiliki nilai p>0.25
Maka terbentuk variabel yang akan masuk kedalam candidat model.
Model ini disebut juga sebagai main effects model.
Melakukan pemilihan variabel dengan memasukkan semua variabel yang
telah terpilih sebagai candidat model.
Jangan lupa bahwa variabel race memiliki kategori lebih dari 2 (variabel
dummy), sehingga harus dilakukan kategori, reference group adalah first.
Dari model yang lengkap kemudian secara bertahap dihilangkan satu
persatu variabel yang memiliki nilai p > 0.05, dimulai dari variabel dengan
nilai p tertinggi. Model di run kembali sehingga didapatkan masing-masing
variabel memiliki nilai p yang < 0.05
PEMILIHAN MODEL DENGAN METODE ENTER
Number of exercise dikeluarkan
13
Vari abl es i n the Equat i on
- . 037 . 038 . 984 1 . 321 . 963
8. 078 2 . 018
1. 371 . 498 7. 576 1 . 006 3. 940
. 749 . 442 2. 875 1 . 090 2. 115
. 849 . 398 4. 558 1 . 033 2. 337
1. 377 . 453 9. 243 1 . 002 3. 964
1. 805 . 712 6. 433 1 . 011 6. 083
. 408 . 445 . 842 1 . 359 1. 504
- . 008 . 174 . 002 1 . 962 . 992
- . 003 . 001 5. 987 1 . 014 . 997
. 962 1. 202 . 641 1 . 423 2. 618
AG E
RACE
RACE(1)
RACE(2)
SMO KE
CHO L
HT
DM
EXER
WEI G HT1
Const ant
St ep1
a
B S. E. Wald df Sig. Exp( B)
Var iable(s) ent er ed on st ep 1: AG E, RACE, SMO KE, CHO L, HT, DM, EXER, WEI G HT1.a.
Diabetes melitus dikeluarkanVari abl es i n the Equat i on
- . 038 . 037 1. 031 1 . 310 . 963
8. 148 2 . 017
1. 372 . 497 7. 610 1 . 006 3. 945
. 752 . 439 2. 936 1 . 087 2. 120
. 851 . 395 4. 640 1 . 031 2. 342
1. 377 . 453 9. 242 1 . 002 3. 963
1. 808 . 709 6. 504 1 . 011 6. 101
. 409 . 444 . 850 1 . 357 1. 506
- . 003 . 001 6. 034 1 . 014 . 997
. 963 1. 201 . 644 1 . 422 2. 621
AG E
RACE
RACE(1)
RACE(2)
SMO KE
CHO L
HT
DM
WEI G HT1
Const ant
St ep1
a
B S. E. Wald df Sig. Exp( B)
Var iable( s) ent er ed on st ep 1: AG E, RACE, SMO KE, CHO L, HT, DM, WEI G HT1.a.
Age dikeluarkan
Vari abl es i n t he Equat i on
- . 041 . 037 1. 276 1 . 259 . 959
7. 939 2 . 019
1. 346 . 498 7. 315 1 . 007 3. 842
. 756 . 436 3. 007 1 . 083 2. 129
. 860 . 394 4. 776 1 . 029 2. 364
1. 434 . 450 10. 165 1 . 001 4. 197
1. 745 . 707 6. 097 1 . 014 5. 725
- . 003 . 001 6. 137 1 . 013 . 997
1. 139 1. 178 . 935 1 . 334 3. 125
AG E
RACE
RACE( 1)
RACE( 2)
SMO KE
CHO L
HT
WEI G HT1
Const ant
St ep1
a
B S. E. Wald df Sig. Exp( B)
Var iable( s) ent er ed on st ep 1: AG E, RACE, SMO KE, CHO L, HT, WEI G HT1.a.
Tabel hasil pemilihan variabel yang dikeluarkan
Variabel yang dikeluarkan P value
1. Exercise 0.960
14
2. Diabetes Mellitus3. Age
0.3570.259
Dilakukan test interaksi berdasarkan substansi. Dari model yang telah
ada, dilakukan satu persatu kemungkinan adanya interaksi. Lakukan
pemilihan variabel interaksi seperti langkah diatas.
PEMILIHAN VARIABEL INTERAKSI
Var i abl es i n t he Equat i on
3. 663 2 . 160
1. 157 . 752 2. 367 1 . 124 3. 180
1. 032 . 579 3. 178 1 . 075 2. 807
. 990 . 579 2. 922 1 . 087 2. 690
1. 384 . 443 9. 755 1 . 002 3. 993
1. 752 . 728 5. 794 1 . 016 5. 764
- . 004 . 001 6. 681 1 . 010 . 996
2. 185 2 . 335
. 696 1. 039 . 449 1 . 503 2. 007
- . 904 . 903 1. 002 1 . 317 . 405
. 223 1. 036 . 046 1 . 829 1. 250
RACE
RACE( 1)
RACE( 2)
SM O KE
CHO L
HT
WEI G HT1
RACE * SM O KE
RACE( 1) by SM O KE
RACE( 2) by SM O KE
Const ant
St ep1
a
B S. E. Wald df Sig. Exp( B)
Var iable( s) ent er ed on st ep 1: RACE, SM O KE, CHO L, HT, WEI G HT1, RACE * SM O KE .a.
Var i abl es i n t he Equat i on
10. 666 2 . 005
1. 694 . 533 10. 099 1 . 001 5. 440
. 889 . 470 3. 575 1 . 059 2. 433
. 829 . 392 4. 469 1 . 035 2. 292
1. 765 . 622 8. 040 1 . 005 5. 842
1. 788 . 720 6. 158 1 . 013 5. 975
- . 004 . 001 7. 425 1 . 006 . 996
1. 860 2 . 395
- 1. 760 1. 302 1. 829 1 . 176 . 172
- . 550 . 944 . 340 1 . 560 . 577
. 315 . 955 . 108 1 . 742 1. 370
RACE
RACE( 1)
RACE( 2)
SM O KE
CHO L
HT
WEI G HT1
CHO L * RACE
CHO L by RACE( 1)
CHO L by RACE( 2)
Const ant
St ep1
a
B S. E. Wald df Sig. Exp( B)
Var iable( s) ent er ed on st ep 1: RACE, SM O KE, CHO L, HT, WEI G HT1, CHO L * RACE .a.
15
Vari abl es i n t he Equat i on
7. 915 2 . 019
1. 372 . 515 7. 096 1 . 008 3. 942
. 787 . 435 3. 278 1 . 070 2. 197
. 873 . 393 4. 935 1 . 026 2. 395
1. 327 . 440 9. 080 1 . 003 3. 769
1. 596 1. 033 2. 387 1 . 122 4. 932
- . 004 . 001 7. 133 1 . 008 . 996
. 190 2 . 910
. 727 1. 735 . 175 1 . 675 2. 068
. 050 1. 612 . 001 1 . 975 1. 052
. 403 . 968 . 174 1 . 677 1. 497
RACE
RACE( 1)
RACE( 2)
SM O KE
CHO L
HT
WEI G HT1
HT * RACE
HT by RACE( 1)
HT by RACE( 2)
Const ant
St ep1
a
B S. E. Wald df Sig. Exp( B)
Var iable( s) ent er ed on st ep 1: RACE, SM O KE, CHO L, HT, WEI G HT1, HT * RACE .a.
Var i abl es i n t he Equat i on
1. 751 2 . 417
1. 613 2. 009 . 645 1 . 422 5. 019
2. 717 2. 153 1. 592 1 . 207 15. 131
. 882 . 392 5. 048 1 . 025 2. 415
1. 350 . 439 9. 461 1 . 002 3. 856
1. 684 . 708 5. 661 1 . 017 5. 385
- . 003 . 002 2. 109 1 . 146 . 997
. 872 2 . 646
. 000 . 003 . 014 1 . 904 1. 000
- . 003 . 004 . 832 1 . 362 . 997
- . 200 1. 302 . 024 1 . 878 . 819
RACE
RACE( 1)
RACE( 2)
SM O KE
CHO L
HT
WEI G HT1
RACE * WEI G HT1
RACE( 1) by WEI G HT1
RACE( 2) by WEI G HT1
Const ant
St ep1
a
B S. E. Wald df Sig. Exp( B)
Var iable( s) ent er ed on st ep 1: RACE, SM O KE, CHO L, HT, WEI G HT1, RACE * WEI G HT1 .a.
Vari abl es i n t he Equat i on
9. 333 2 . 009
1. 469 . 501 8. 617 1 . 003 4. 346
. 799 . 429 3. 464 1 . 063 2. 223
. 793 . 404 3. 857 1 . 050 2. 211
1. 366 . 440 9. 643 1 . 002 3. 921
1. 344 . 887 2. 292 1 . 130 3. 833
- . 004 . 001 7. 596 1 . 006 . 996
1. 068 1. 403 . 579 1 . 447 2. 908
. 511 . 981 . 271 1 . 603 1. 666
RACE
RACE( 1)
RACE( 2)
SM O KE
CHO L
HT
WEI G HT1
HT by SM O KE
Const ant
St ep1
a
B S. E. Wald df Sig. Exp( B)
Var iable( s) ent er ed on st ep 1: RACE, SM O KE, CHO L, HT, WEI G HT1, HT * SM O KE .a.
16
Var i abl es i n t he Equat i on
8. 830 2 . 012
1. 438 . 497 8. 383 1 . 004 4. 213
. 715 . 432 2. 733 1 . 098 2. 044
- . 959 1. 716 . 312 1 . 576 . 383
1. 371 . 441 9. 682 1 . 002 3. 941
1. 677 . 716 5. 480 1 . 019 5. 350
- . 005 . 002 6. 275 1 . 012 . 995
. 003 . 003 1. 190 1 . 275 1. 003
1. 412 1. 397 1. 021 1 . 312 4. 104
RACE
RACE( 1)
RACE( 2)
SM O KE
CHO L
HT
WEI G HT1
SM O KE by WEI G HT1
Const ant
St ep1
a
B S. E. Wald df Sig. Exp( B)
Var iable( s) ent er ed on st ep 1: RACE, SM O KE, CHO L, HT, WEI G HT1, SM O KE * WEI G HT1 .a.
Vari abl es i n t he Equat i on
9. 032 2 . 011
1. 429 . 494 8. 367 1 . 004 4. 174
. 772 . 429 3. 237 1 . 072 2. 163
. 886 . 390 5. 173 1 . 023 2. 426
1. 266 . 445 8. 087 1 . 004 3. 546
1. 611 . 747 4. 649 1 . 031 5. 009
- . 004 . 001 7. 080 1 . 008 . 996
4. 654 15. 507 . 090 1 . 764 104. 990
. 335 . 945 . 125 1 . 723 1. 398
RACE
RACE( 1)
RACE( 2)
SM O KE
CHO L
HT
WEI G HT1
CHO L by HT
Const ant
St ep1
a
B S. E. Wald df Sig. Exp( B)
Var iable( s) ent er ed on st ep 1: RACE, SMO KE, CHO L, HT, WEI G HT1, CHO L * HT .a.
Var i abl es i n t he Equat i on
9. 052 2 . 011
1. 425 . 494 8. 309 1 . 004 4. 159
. 793 . 429 3. 423 1 . 064 2. 211
. 861 . 391 4. 855 1 . 028 2. 366
2. 087 2. 358 . 783 1 . 376 8. 059
1. 750 . 710 6. 081 1 . 014 5. 757
- . 004 . 001 5. 925 1 . 015 . 996
- . 001 . 004 . 108 1 . 743 . 999
. 247 . 985 . 063 1 . 802 1. 280
RACE
RACE( 1)
RACE( 2)
SM O KE
CHO L
HT
WEI G HT1
CHO L by WEI G HT1
Const ant
St ep1
a
B S. E. Wald df Sig. Exp( B)
Var iable( s) ent er ed on st ep 1: RACE, SM O KE, CHO L, HT, WEI G HT1, CHO L * WEI G HT1 .a.
17
Vari abl es i n t he Equat i on
9. 079 2 . 011
1. 430 . 495 8. 331 1 . 004 4. 178
. 794 . 429 3. 427 1 . 064 2. 213
. 872 . 394 4. 912 1 . 027 2. 392
1. 326 . 437 9. 195 1 . 002 3. 765
1. 877 2. 670 . 494 1 . 482 6. 532
- . 004 . 002 5. 863 1 . 015 . 996
. 000 . 003 . 002 1 . 967 1. 000
. 328 1. 035 . 100 1 . 751 1. 388
RACE
RACE( 1)
RACE( 2)
SM O KE
CHO L
HT
WEI G HT1
HT by WEI G HT1
Const ant
St ep1
a
B S. E. Wald df Sig. Exp( B)
Var iable( s) ent er ed on st ep 1: RACE, SM O KE, CHO L, HT, WEI G HT1, HT * WEI G HT1 .a.
Vari abl es i n t he Equat i on
. 870 . 390 4. 974 1 . 026 2. 387 1. 111 5. 128
1. 326 . 437 9. 219 1 . 002 3. 768 1. 600 8. 870
- . 037 . 014 7. 248 1 . 007 . 964 . 938 . 990
9. 077 2 . 011
1. 429 . 495 8. 328 1 . 004 4. 176 1. 582 11. 025
. 794 . 429 3. 425 1 . 064 2. 212 . 954 5. 126
1. 769 . 712 6. 177 1 . 013 5. 867 1. 454 23. 682
. 346 . 946 . 134 1 . 715 1. 413
SM O KE
CHO L
WEI G HT
RACE
RACE( 1)
RACE( 2)
HT
Const ant
St ep1
a
B S. E. Wald df Sig. Exp( B) Lower Upper
95. 0% C. I . f orEXP( B)
Var iable( s) ent er ed on st ep 1: SM O KE, CHO L, WEI G HT, RACE, HT.a.
Hasil pengujian interaksi dapat dirangkumkan dalam tabel dibawah ini;
Tabel hasil uji variabel interaksi
Variabel interaksi P value
Race1 by smoke Race2 by smokeRace1 by cholesterolRace2 by cholesterolRace1 by hipertensionRace2 by hipertensionRace1 by weightRace2 by weightSmoke by hipertensionSmoke by weightCholesterol by HipertensionCholesterol by wightHipertension by weight
0.5030.3170.1760.5600.6750.9750.9040.3620.4470.2750.7640.7430.967
18
Dari hasil penelitian didapatkan tidak terdapat interaksi didalam model.
Terbentuk model regresi logistik yang diinginkan
a. omnibust test,model harus significant p<0.05 yang menunjukkan bahwa model
appropriate
Omnibus Tests of Model Coefficients
39.823 6 .000
39.823 6 .000
39.823 6 .000
Step
Block
Model
Step 1Chi-square df Sig.
b. Dilihat overall percentage pada classification tableDengan ketepatan dari model ini adalah 76.5%
Cl assi f i cat i on Tabl ea
123 12 91. 1
35 30 46. 2
76. 5
O bservedNo
Yes
Coronary hear tdisease
O verall Percent age
St ep 1No Yes
Coronary hear tdisease Percent age
Correct
Predict ed
The cut value is . 500a.
c. Model pada penelitian ini adalah :
Z = 0.346 + 1.429 race1 + 0.794 race2 + 0.870 smoke +1.326 cholesterol + 1.769 hipertension – 0.037 weight1
Vari abl es i n t he Equat i on
. 870 . 390 4. 974 1 . 026 2. 387 1. 111 5. 128
1. 326 . 437 9. 219 1 . 002 3. 768 1. 600 8. 870
- . 037 . 014 7. 248 1 . 007 . 964 . 938 . 990
9. 077 2 . 011
1. 429 . 495 8. 328 1 . 004 4. 176 1. 582 11. 025
. 794 . 429 3. 425 1 . 064 2. 212 . 954 5. 126
1. 769 . 712 6. 177 1 . 013 5. 867 1. 454 23. 682
. 346 . 946 . 134 1 . 715 1. 413
SM O KE
CHO L
WEI G HT
RACE
RACE( 1)
RACE( 2)
HT
Const ant
St ep1
a
B S. E. Wald df Sig. Exp( B) Lower Upper
95. 0% C. I . f orEXP( B)
Var iable( s) ent er ed on st ep 1: SM O KE, CHO L, WEI G HT, RACE, HT.a.
19
PEMILIHAN MODEL DENGAN METODE FORWARD
Omnibus Tests of Model Coefficients
14.637 1 .000
14.637 1 .000
14.637 1 .000
5.639 1 .018
20.276 2 .000
20.276 2 .000
7.157 1 .007
27.433 3 .000
27.433 3 .000
7.274 2 .026
34.708 5 .000
34.708 5 .000
5.116 1 .024
39.823 6 .000
39.823 6 .000
Step
Block
Model
Step
Block
Model
Step
Block
Model
Step
Block
Model
Step
Block
Model
Step 1
Step 2
Step 3
Step 4
Step 5
Chi-square df Sig.
20
Cl assi f i cat i on Tabl ea
123 12 91. 1
45 20 30. 8
71. 5
125 10 92. 6
45 20 30. 8
72. 5
124 11 91. 9
42 23 35. 4
73. 5
121 14 89. 6
41 24 36. 9
72. 5
123 12 91. 1
35 30 46. 2
76. 5
ObservedNo
Yes
Coronary hear tdisease
Overall Percent age
No
Yes
Coronary hear tdisease
Overall Percent age
No
Yes
Coronary hear tdisease
Overall Percent age
No
Yes
Coronary hear tdisease
Overall Percent age
No
Yes
Coronary hear tdisease
Overall Percent age
St ep 1
St ep 2
St ep 3
St ep 4
St ep 5
No Yes
Coronary hear tdisease Percent age
Correct
Predict ed
The cut value is . 500a.
Vari abl es i n t he Equat i on
1. 516 . 405 14. 047 1 . 000 4. 556
- 1. 006 . 174 33. 311 1 . 000 . 366
1. 431 . 410 12. 195 1 . 000 4. 184
- . 003 . 001 4. 925 1 . 026 . 997
. 781 . 805 . 939 1 . 332 2. 183
1. 450 . 418 12. 025 1 . 001 4. 263
1. 874 . 724 6. 693 1 . 010 6. 514
- . 004 . 001 7. 629 1 . 006 . 996
1. 221 . 836 2. 133 1 . 144 3. 390
7. 184 2 . 028
1. 287 . 481 7. 157 1 . 007 3. 623
. 367 . 371 . 981 1 . 322 1. 444
1. 510 . 428 12. 417 1 . 000 4. 526
1. 848 . 735 6. 318 1 . 012 6. 345
- . 004 . 001 9. 036 1 . 003 . 996
1. 174 . 888 1. 748 1 . 186 3. 236
9. 077 2 . 011
1. 429 . 495 8. 328 1 . 004 4. 176
. 794 . 429 3. 425 1 . 064 2. 212
. 870 . 390 4. 974 1 . 026 2. 387
1. 326 . 437 9. 219 1 . 002 3. 768
1. 769 . 712 6. 177 1 . 013 5. 867
- . 004 . 001 7. 248 1 . 007 . 996
. 346 . 946 . 134 1 . 715 1. 413
CHO L
Const ant
St ep1
a
CHO L
WEI G HT1
Const ant
St ep2
b
CHO L
HT
WEI G HT1
Const ant
St ep3
c
RACE
RACE( 1)
RACE( 2)
CHO L
HT
WEI G HT1
Const ant
St ep4
d
RACE
RACE( 1)
RACE( 2)
SMO KE
CHO L
HT
WEI G HT1
Const ant
St ep5
e
B S. E. Wald df Sig. Exp( B)
Var iable( s) ent er ed on st ep 1: CHO L.a.
Var iable( s) ent er ed on st ep 2: WEI G HT1.b.
Var iable( s) ent er ed on st ep 3: HT.c.
Var iable( s) ent er ed on st ep 4: RACE.d.
Var iable( s) ent er ed on st ep 5: SMO KE.e.
PEMILIHAN MODEL DENGAN METODE BACKWARD
21
Omnibus Tests of Model Coefficients
39.823 6 .000
39.823 6 .000
39.823 6 .000
Step
Block
Model
Step 1Chi-square df Sig.
Cl assi f i cat i on Tabl ea
123 12 91. 1
35 30 46. 2
76. 5
O bservedNo
Yes
Coronary hear tdisease
O verall Percent age
St ep 1No Yes
Coronary hear tdisease Percent age
Correct
Predict ed
The cut value is . 500a.
Vari abl es i n t he Equat i on
9. 077 2 . 011
1. 429 . 495 8. 328 1 . 004 4. 176
. 794 . 429 3. 425 1 . 064 2. 212
. 870 . 390 4. 974 1 . 026 2. 387
1. 326 . 437 9. 219 1 . 002 3. 768
1. 769 . 712 6. 177 1 . 013 5. 867
- . 004 . 001 7. 248 1 . 007 . 996
. 346 . 946 . 134 1 . 715 1. 413
RACE
RACE( 1)
RACE( 2)
SMO KE
CHO L
HT
WEI G HT1
Const ant
St ep1
a
B S. E. Wald df Sig. Exp( B)
Var iable( s) ent er ed on st ep 1: RACE, SMO KE, CHO L, HT, WEI G HT1.a.
Interpretasi model
Ternyata hasil yang diperoleh pada ke-3 metode pemilihan variabel, baik
pada metode enter, backward, forward pada penelitian ini menunjukkan
kesamaan hasil.
Interpretasi dari model yang terbentuk adalah bahwa faktor-faktor yang
mempengaruhi penyakit jantung koroner adalah Ras, Merokok, Cholesterol,
hipertensi dan berat badan. Yang paling besar pengaruhnya dalam kejadian
penyakit jantung koroner adalah Hipertensi. Dimana risiko penyakit jantung
koroner pada orang yang Hipertensi adalah 6 kali dibandingkan dengan yang
22
tidak hipertensi dengan 95% CI (1.454 – 23.682) setelah dikontrol oleh variabel
ras, merokok, kolesterol, dan berat badan.
Risiko Penyakit jantung koroner pada orang kulit hitam adalah 4 kali
dibandingkan dengan orangkulit putih dengan 95% CI (1.454 – 23.682) setelah
dikontrol oleh variabel hipertensi, merokok, kolesterol, dan berat badan.
Sedangkan untuk kulit lainnya Odds Penyakit jantung koroner adalah 2 kali
dibandingkan dengan yang tidak hipertensi dengan 95% CI (0.954 – 5.126)
setelah dikontrol oleh variabel hipertensi, merokok, kolesterol, dan berat badan.
Risiko Penyakit jantung koroner pada orang yang merokok adalah 2 kali
dibandingkan dengan yang tidak hipertensi dengan 95% CI (1.111 - 5.128)
setelah dikontrol oleh variabel ras, hipertensi, kolesterol, dan berat badan.
Risiko Penyakit jantung koroner pada orang dengan kolesterol tinggi
adalah 4 kali dibandingkan dengan yang tidak hipertensi dengan 95% CI (1.600
– 8.870) setelah dikontrol oleh variabel ras, merokok, hipertensi, dan berat
badan.
Kenaikan berat badan setiap 100 gram (0.1 kg) merupakan faktor
pencegah untuk terjadinya Penyakit jantung koroner yaitu 0.964 dengan 95% CI
(0.938 – 0.990) setelah dikontrol oleh variabel ras, merokok, kolesterol, dan
hipertensi.
2. MODEL ESTIMASI
Selanjutnya akan dibahas langkah dalam strategi pemodelan regresi logistik
dengan tujuan untuk mengestimasi hubungan paparan dan penyakit.
Langkah untuk melakukan strategi pemodelan dibutuhkan 3 tahap:
1. Variabel specification
peneliti melakukan penelusuran literature unttuk membatasi pada variabel
independen yang memang bermakna secara klinik maupun biologik.
Variabel ini dapat didefinsikan pada model sebagai langkah awal yang
paling mungkin masuk dalam model.
23
2. Interaction assesment
Bila terdapat interaksi maka OR dilaporkan terpisah
3. Confounding assesment followed by consideration of precision
Model terakhir adalah model dengan variabel interaksi dan konfounding
yang terpilih.
LANGKAH PEMBUATAN MODEL
Langkah untuk melakukan spesifikasi variabel secara jelas, dilakukan
pemodelan secara lengkap, mencakup semua variabel utama, kandidat
konfounding dan kandidat interaksi, yaitu:
1. Hierarchically Well-Formulated Models
Merupakan initial model. Model memiliki seluruh lower order component of
any term in the model.
2. The Hierarichal Backward Elimination Approach
Setelah didapatkan initial model strategi selanjutnya adalah prosedur
Hierarichal Backward Elimination Approach untuk mengeluarkan variabel.
Uji statistik digunakan untuk menguji interaksi. Tapi untuk mengeliminasi
confounders tidak menggunakan uji statistik. Strategi ini prisip kerjanya
adalah dari large starting model smaller final model.
Initial model
interaction
confounder
Eliminate EViEj
Eliminate Vi dan ViVj
Eliminate EVi
24
3. The Hierarchy Principles for retaining variables
Jika suatu variabel terdapat dalam model , maka semua lower-order
components juga harus ada dalam model.
CONTOH PEMODELAN ESTIMASI
Model untuk mengetahui hubungan merokok dengan terjadinya penyakit jantung
koroner, data yang digunakan adalah data CHD.
Tujuan penelitian:
Ingin mengetahui hubungan antara merokok dan kejadian penyakit jantung
koroner, dengan dikontrol oleh variabel independen lainnya.
Kerangka konsep:
Smoke Coronary Heart Diseases
AgeRace
High CholesterolHypertension
Diabetes MellitusNumber of exercise
Weight
25
Langkah pemodelan yang dilakukan adalah :
1. Variable spesification.
Melakukan pemodelan lengkap (Hierarchically Well Formulated Model)
dengan mencakup semua variabel utama, variabel confounding dan
kandidat interaksi
Variabel dependen adalah : Coronary Heart DiseasesVariabel Independen yaitu :
Variabel Resiko adalah
Smoke,
Variabel Confounder adalah
Age,
Race,
High cholelesterol,
Hypertension ,
Diabetes mellitus,
Number of exercise,
Weight (pada variabel weight dilakukan compute dengan mengalikan dengan 10, agar desimal pada variabel weight menjadi satuan. Hal ini dilakukan untuk memperhitungkan kenaikan dalam 1 unit untuk perhitungan OR agar tidak berlipat banyak)
Variabel Interaksi adalah :
Smoke*Age
Smoke*Race
Smoke*Hypertension
Smoke*weight
VARIABEL SPESIFICATION: MODEL HWF
26
Var i abl es i n t he Equat i on
- . 086 . 056 2. 353 1 . 125 . 918
1. 698 2 . 428
. 777 . 801 . 942 1 . 332 2. 176
. 760 . 608 1. 562 1 . 211 2. 137
- 2. 326 2. 555 . 829 1 . 363 . 098
1. 447 . 462 9. 792 1 . 002 4. 251
1. 571 . 928 2. 865 1 . 091 4. 813
. 664 . 469 2. 005 1 . 157 1. 942
- . 031 . 182 . 030 1 . 863 . 969
- . 004 . 002 3. 773 1 . 052 . 996
. 089 . 078 1. 280 1 . 258 1. 093
2. 406 2 . 300
1. 150 1. 094 1. 106 1 . 293 3. 159
- . 684 . 939 . 531 1 . 466 . 504
. 515 1. 517 . 115 1 . 734 1. 674
. 002 . 003 . 311 1 . 577 1. 002
2. 670 1. 844 2. 096 1 . 148 14. 445
AG E
RACE
RACE( 1)
RACE( 2)
SM O KE
CHO L
HT
DM
EXER
WEI G HT1
AG E by SM O KE
RACE * SM O KE
RACE( 1) by SM O KE
RACE( 2) by SM O KE
HT by SM O KE
SM O KE by WEI G HT1
Const ant
St ep1
a
B S. E. Wald df Sig. Exp( B)
Var iable( s) ent er ed on st ep 1: AG E, RACE, SM O KE, CHO L, HT, DM , EXER, WEI G HT1, AG E * SM O KE ,RACE * SM O KE , HT * SM O KE , SM O KE * WEI G HT1 .
a.
2. Melakukan Interaction assesment,
yang dilakukan dengan menghilangkan Interaksi yang memiliki p value
yang tertinggi dan di run kembali satu persatu sampai ditemukan Interaksi
yang signifikan. Didapatkan hasil nilai p dari masing-masing interaksi
sebagai berikut :
INTERACTION SPESIFICATION
Seluruh kemungkinan interaksi yang ada dimasukkan dalam model
27
Var i abl es i n t he Equat i on
- . 086 . 056 2. 365 1 . 124 . 917
1. 671 2 . 434
. 772 . 804 . 923 1 . 337 2. 164
. 756 . 609 1. 539 1 . 215 2. 130
- 2. 470 2. 505 . 973 1 . 324 . 085
1. 432 . 460 9. 676 1 . 002 4. 188
1. 770 . 735 5. 792 1 . 016 5. 868
. 673 . 468 2. 072 1 . 150 1. 961
- . 028 . 181 . 025 1 . 875 . 972
- . 004 . 002 3. 892 1 . 049 . 996
. 088 . 078 1. 263 1 . 261 1. 092
2. 377 2 . 305
1. 122 1. 088 1. 063 1 . 302 3. 070
- . 696 . 938 . 551 1 . 458 . 499
. 002 . 003 . 505 1 . 477 1. 002
2. 706 1. 844 2. 153 1 . 142 14. 967
AG E
RACE
RACE( 1)
RACE( 2)
SM O KE
CHO L
HT
DM
EXER
WEI G HT1
AG E by SM O KE
RACE * SM O KE
RACE( 1) by SM O KE
RACE( 2) by SM O KE
SM O KE by WEI G HT1
Const ant
St ep1
a
B S. E. Wald df Sig. Exp( B)
Var iable( s) ent er ed on st ep 1: AG E, RACE, SM O KE, CHO L, HT, DM , EXER, WEI G HT1, AG E * SM O KE ,RACE * SM O KE , SM O KE * WEI G HT1 .
a.
Var i abl es i n t he Equat i on
- . 091 . 055 2. 695 1 . 101 . 913
1. 896 2 . 387
. 687 . 791 . 754 1 . 385 1. 987
. 824 . 601 1. 880 1 . 170 2. 279
- 1. 312 1. 889 . 482 1 . 487 . 269
1. 420 . 461 9. 510 1 . 002 4. 138
1. 841 . 730 6. 360 1 . 012 6. 302
. 629 . 462 1. 850 1 . 174 1. 875
- . 016 . 180 . 008 1 . 930 . 984
- . 003 . 001 5. 042 1 . 025 . 997
. 093 . 078 1. 447 1 . 229 1. 098
3. 233 2 . 199
1. 270 1. 072 1. 404 1 . 236 3. 561
- . 781 . 930 . 705 1 . 401 . 458
2. 066 1. 572 1. 727 1 . 189 7. 892
AG E
RACE
RACE( 1)
RACE( 2)
SM O KE
CHO L
HT
DM
EXER
WEI G HT1
AG E by SM O KE
RACE * SM O KE
RACE( 1) by SM O KE
RACE( 2) by SM O KE
Const ant
St ep1
a
B S. E. Wald df Sig. Exp( B)
Var iable( s) ent er ed on st ep 1: AG E, RACE, SM O KE, CHO L, HT, DM , EXER, WEI G HT1, AG E * SM O KE, RACE * SM O KE .
a.
28
Vari abl es i n t he Equat i on
- . 077 . 053 2. 115 1 . 146 . 925
6. 884 2 . 032
1. 279 . 506 6. 403 1 . 011 3. 595
. 718 . 444 2. 617 1 . 106 2. 050
- 1. 070 1. 730 . 383 1 . 536 . 343
1. 328 . 451 8. 676 1 . 003 3. 774
1. 836 . 716 6. 574 1 . 010 6. 271
. 506 . 454 1. 244 1 . 265 1. 659
- . 019 . 175 . 011 1 . 915 . 981
- . 003 . 001 5. 854 1 . 016 . 997
. 085 . 075 1. 286 1 . 257 1. 089
1. 844 1. 449 1. 621 1 . 203 6. 325
AG E
RACE
RACE( 1)
RACE( 2)
SM O KE
CHO L
HT
DM
EXER
WEI G HT1
AG E by SM O KE
Const ant
St ep1
a
B S. E. Wald df Sig. Exp( B)
Var iable( s) ent er ed on st ep 1: AG E, RACE, SM O KE, CHO L, HT, DM , EXER, WEI G HT1, AG E *SM O KE .
a.
Vari abl es i n the Equat i on
- . 037 . 038 . 984 1 . 321 . 963
8. 078 2 . 018
1. 371 . 498 7. 576 1 . 006 3. 940
. 749 . 442 2. 875 1 . 090 2. 115
. 849 . 398 4. 558 1 . 033 2. 337
1. 377 . 453 9. 243 1 . 002 3. 964
1. 805 . 712 6. 433 1 . 011 6. 083
. 408 . 445 . 842 1 . 359 1. 504
- . 008 . 174 . 002 1 . 962 . 992
- . 003 . 001 5. 987 1 . 014 . 997
. 962 1. 202 . 641 1 . 423 2. 618
AG E
RACE
RACE(1)
RACE(2)
SMO KE
CHO L
HT
DM
EXER
WEI G HT1
Const ant
St ep1
a
B S. E. Wald df Sig. Exp( B)
Var iable(s) ent er ed on st ep 1: AG E, RACE, SMO KE, CHO L, HT, DM, EXER, WEI G HT1.a.
Tabel hasil uji variabel interaksi
Jenis Interaksi yang dihilangkan P value
Hipertensi by smokeSmoke by weightRace by smokeAge by smoke
0.7340.4770.4010.257
29
Vari abl es i n the Equat i on
- . 037 . 038 . 984 1 . 321 . 963
8. 078 2 . 018
1. 371 . 498 7. 576 1 . 006 3. 940
. 749 . 442 2. 875 1 . 090 2. 115
. 849 . 398 4. 558 1 . 033 2. 337
1. 377 . 453 9. 243 1 . 002 3. 964
1. 805 . 712 6. 433 1 . 011 6. 083
. 408 . 445 . 842 1 . 359 1. 504
- . 008 . 174 . 002 1 . 962 . 992
- . 003 . 001 5. 987 1 . 014 . 997
. 962 1. 202 . 641 1 . 423 2. 618
AG E
RACE
RACE(1)
RACE(2)
SMO KE
CHO L
HT
DM
EXER
WEI G HT1
Const ant
St ep1
a
B S. E. Wald df Sig. Exp( B)
Var iable(s) ent er ed on st ep 1: AG E, RACE, SMO KE, CHO L, HT, DM, EXER, WEI G HT1.a.
Dari hasil diatas ternyata tidak terdapat interaksi yang significan didalam
model.
Maka full model pada penelitian ini adalah :
Z = 0.962 - 0.037 age +1.371 race1 + 0.749 race2 + 0.849 smoke +1.377
chol + 1.805 ht +0.408 DM – 0.008 exer – 0.003 weight1
Dengan OR smoke full model adalah 2.337, yaitu OR smoke yang telah
terkontrol oleh variabel lainnya.
3. Confounder assesment
Dilakukan dengan cara Hierarchical Backward Elimination yaitu ;
membandingkan OR full model dengan OR Reduced Model. Bila besar
perubahan OR yang terjadi kurang dari 10 % maka model yang digunakan
adalah Reduced Model Tujuannya adalah untuk mendapatkan validitas.
Langkah yang dilakukan adalah dengan menghilangkan variabel yang
memiliki nilai p value yang tertinggi, kemudian di run kembali dan
dibandingkan ; Delta antara OR Reduced model dengan OR full model
dibagi dengan OR full model .
30
Bila besarnya perubahan < 10 % maka digunakan Reduced model.
Bila besar perubahan OR > 10 % maka variabel tersebut
dimasukkan kembali, Selanjutnya dilihat variabel lainnya untuk
dikeluarkan dan diperbandingkan kembali, satu persatu.
CONFOUNDING ASSESMENT
Vari abl es i n t he Equat i on
- . 038 . 037 1. 031 1 . 310 . 963
8. 148 2 . 017
1. 372 . 497 7. 610 1 . 006 3. 945
. 752 . 439 2. 936 1 . 087 2. 120
. 851 . 395 4. 640 1 . 031 2. 342
1. 377 . 453 9. 242 1 . 002 3. 963
1. 808 . 709 6. 504 1 . 011 6. 101
. 409 . 444 . 850 1 . 357 1. 506
- . 003 . 001 6. 034 1 . 014 . 997
. 963 1. 201 . 644 1 . 422 2. 621
AG E
RACE
RACE( 1)
RACE( 2)
SMO KE
CHO L
HT
DM
WEI G HT1
Const ant
St ep1
a
B S. E. Wald df Sig. Exp( B)
Var iable( s) ent er ed on st ep 1: AG E, RACE, SMO KE, CHO L, HT, DM, WEI G HT1.a.
Vari abl es i n t he Equat i on
- . 041 . 037 1. 276 1 . 259 . 959
7. 939 2 . 019
1. 346 . 498 7. 315 1 . 007 3. 842
. 756 . 436 3. 007 1 . 083 2. 129
. 860 . 394 4. 776 1 . 029 2. 364
1. 434 . 450 10. 165 1 . 001 4. 197
1. 745 . 707 6. 097 1 . 014 5. 725
- . 003 . 001 6. 137 1 . 013 . 997
1. 139 1. 178 . 935 1 . 334 3. 125
AG E
RACE
RACE( 1)
RACE( 2)
SMO KE
CHO L
HT
WEI G HT1
Const ant
St ep1
a
B S. E. Wald df Sig. Exp( B)
Var iable( s) ent er ed on st ep 1: AG E, RACE, SMO KE, CHO L, HT, WEI G HT1.a.
31
Vari abl es i n t he Equat i on
9. 077 2 . 011
1. 429 . 495 8. 328 1 . 004 4. 176
. 794 . 429 3. 425 1 . 064 2. 212
. 870 . 390 4. 974 1 . 026 2. 387
1. 326 . 437 9. 219 1 . 002 3. 768
1. 769 . 712 6. 177 1 . 013 5. 867
- . 004 . 001 7. 248 1 . 007 . 996
. 346 . 946 . 134 1 . 715 1. 413
RACE
RACE( 1)
RACE( 2)
SMO KE
CHO L
HT
WEI G HT1
Const ant
St ep1
a
B S. E. Wald df Sig. Exp( B)
Var iable( s) ent er ed on st ep 1: RACE, SMO KE, CHO L, HT, WEI G HT1.a.
Vari abl es i n the Equat i on
. 560 . 332 2. 845 1 . 092 1. 751
1. 324 . 426 9. 665 1 . 002 3. 758
1. 812 . 703 6. 637 1 . 010 6. 120
- . 004 . 001 6. 991 1 . 008 . 997
. 877 . 851 1. 064 1 . 302 2. 405
SMO KE
CHO L
HT
WEI G HT1
Const ant
St ep1
a
B S. E. Wald df Sig. Exp( B)
Var iable(s) ent er ed on st ep 1: SMO KE, CHO L, HT, WEI G HT1.a.
Vari abl es i n the Equat i on
. 870 . 390 4. 974 1 . 026 2. 387
1. 326 . 437 9. 219 1 . 002 3. 768
1. 769 . 712 6. 177 1 . 013 5. 867
- . 004 . 001 7. 248 1 . 007 . 996
9. 077 2 . 011
1. 429 . 495 8. 328 1 . 004 4. 176
. 794 . 429 3. 425 1 . 064 2. 212
. 346 . 946 . 134 1 . 715 1. 413
SMO KE
CHO L
HT
WEI G HT1
RACE
RACE(1)
RACE(2)
Const ant
St ep1
a
B S. E. Wald df Sig. Exp( B)
Var iable( s) ent er ed on st ep 1: SMO KE, CHO L, HT, WEI G HT1, RACE.a.
Vari abl es i n the Equat i on
. 872 . 383 5. 193 1 . 023 2. 391
1. 319 . 429 9. 472 1 . 002 3. 740
- . 003 . 001 4. 693 1 . 030 . 997
9. 551 2 . 008
1. 428 . 488 8. 554 1 . 003 4. 172
. 831 . 418 3. 949 1 . 047 2. 296
- . 123 . 907 . 018 1 . 893 . 885
SMO KE
CHO L
WEI G HT1
RACE
RACE(1)
RACE(2)
Const ant
St ep1
a
B S. E. Wald df Sig. Exp( B)
Var iable( s) ent er ed on st ep 1: SMO KE, CHO L, WEI G HT1, RACE.a.
32
Vari abl es i n the Equat i on
. 976 . 371 6. 915 1 . 009 2. 654
1. 377 . 422 10. 675 1 . 001 3. 964
9. 109 2 . 011
1. 230 . 467 6. 939 1 . 008 3. 420
. 980 . 407 5. 804 1 . 016 2. 665
-1. 965 . 360 29. 863 1 . 000 . 140
SMO KE
CHO L
RACE
RACE(1)
RACE(2)
Const ant
St ep1
a
B S. E. Wald df Sig. Exp( B)
Var iable(s) ent er ed on st ep 1: SMO KE, CHO L, RACE.a.
Vari abl es i n the Equat i on
1. 063 . 368 8. 345 1 . 004 2. 896
9. 854 2 . 007
1. 382 . 480 8. 273 1 . 004 3. 983
. 895 . 405 4. 886 1 . 027 2. 447
- . 003 . 001 5. 752 1 . 016 . 997
. 155 . 871 . 031 1 . 859 1. 167
SMO KE
RACE
RACE(1)
RACE(2)
WEI G HT1
Const ant
St ep1
a
B S. E. Wald df Sig. Exp( B)
Var iable( s) ent er ed on st ep 1: SMO KE, RACE, WEI G HT1.a.
Dari hasil out put penelitian dapat diringkaskan dalam tabel dibawah ini :
Tabel hasil uji confounder
Confounder yang dikeluarkan
P value OR Smoke Reduced
Model
Delta OR Red dg OR full model
Besar perubahan OR
(%)
ExerciseDiabetes mellitusAgeRaceHypertensionWeight1Cholesterol
0.9620.3570.2590.0640.0130.0300.02
2.3422.3642.3871.7512.3912.6542.896
0.0050.0270.05
0.5860.0540.3170.559
0.2141.1552.13925.072.31
13.5623.92
Dari hasil diatas didapatkan bahwa variabel confounder yang masuk
kedalam model adalah variabel Race(Cat), Weight1, Cholesterol dengan
OR Smoke pada Reduced Model adalah 2.391
4. Final Model , yaitu model yang paling parsimonious dalam penelitian ini
adalah :
33
Smoke
High cholesterolWeight Race
Coronary Heart Disease
Omnibus Tests of Model Coefficients
33.309 5 .000
33.309 5 .000
33.309 5 .000
Step
Block
Model
Step 1Chi-square df Sig.
Cl assi f i cat i on Tabl ea
123 12 91. 1
39 26 40. 0
74. 5
ObservedNo
Yes
Coronary hear tdisease
Overall Percent age
St ep 1No Yes
Coronary hear tdisease Percent age
Correct
Predict ed
The cut value is . 500a.
34
Vari abl es i n t he Equat i on
. 872 . 383 5. 193 1 . 023 2. 391 1. 130 5. 062
1. 319 . 429 9. 472 1 . 002 3. 740 1. 615 8. 665
- . 003 . 001 4. 693 1 . 030 . 997 . 995 1. 000
9. 551 2 . 008
1. 428 . 488 8. 554 1 . 003 4. 172 1. 602 10. 867
. 831 . 418 3. 949 1 . 047 2. 296 1. 012 5. 210
- . 123 . 907 . 018 1 . 893 . 885
SM O KE
CHO L
WEI G HT1
RACE
RACE( 1)
RACE( 2)
Const ant
St ep1
a
B S. E. Wald df Sig. Exp( B) Lower Upper
95. 0% C. I . f or EXP( B)
Var iable( s) ent er ed on st ep 1: SM O KE, CHO L, WEI G HT1, RACE.a.
Interpretasi model
Merokok memiliki hubungan dengan Penyakit Jantung Koroner setelah
dikontrol oleh Ras, Berat Badan dan Kadar Kholesterol. Dimana risiko untuk
menderita Penyakit jantung koroner pada orang yang merokok adalah 2 kali
dibanding orang yang tidak merokok setelah dikontrol variabel ras, berat badan
dan kadar kolesterol. 95% CI OR adalah (1.13-5.062)
35
DAFTAR PUSTAKA
Bland M, 1996An Introduction to Medical Statistics. Second edition. Oxford University Press. USA
Hosmer D, Lemeshow, 2000Applied Logistic Regression . second edition. Jhon Willey & son, inc. USA
Kleinbaum D, 1996Statistic in the health science. Logistic Regression A Self-learning text. Springer-Verlag , New York
Kleinbaum D, Kupper L, Morgenstern H, 1996Epidemiologic Research. Principles and Quantitative Methods. Van Nostrand Reinhold Company. New York
Pagano M, Gauvreu K, 1997Principles of Biostatistic Duxburry Press, California.
Riono P, 1992
Aplikasi regresi Logistik. Fakultas Kesehatan Masyarakat Universitas Indonesia
36