regresi logistik modul

MODUL MATA KULIAH

ANALISIS MULTIVARIAT APLIKASI REGRESI LOGISTIK

Oleh

Prof. Dr. dr. RIZANDA MACHMUD, M.Kes

PROGRAM STUDI S3 KEDOKTERAN PROGRAM PASCASARJANA UNIVERSITAS ANDALAS

KERJASAMA UNIVERSITAS RIAU

DAFTAR ISI

DAFTAR ISI...........................................................................................................2

I. PENGANTAR REGRESI LOGISTIK..............................................................3

II. MODEL REGRESI LOGISTIK........................................................................4

III. STUDY DESIGN ISSUE.............................................................................5

IV. STRATEGI PEMODELAN REGRESI LOGISTIK........................................6

1. MODEL PREDIKSI..................................................................................7

2. MODEL ESTIMASI................................................................................23

DAFTAR PUSTAKA............................................................................................35

2

I. PENGANTAR REGRESI LOGISTIK

Analisis regresi logistik adalah suatu pendekatan model matematis yang

dapat digunakan untuk menggambarkan hubungan antara banyak variabel

independen dengan variabel dependen yang bersifat dikotomus. Variabel

independen dapat bertipe apa saja, dan asumsi distribusi variabel adalah bebas

(Kleinbaum, 1996).

Fungsi logistik merupakan fungsi matematik dengan rumus:

ƒ(z) =

1

1+e−z

Saat ini modelling prosedur dengan menggunakan regressi logistik paling

populer dibandingkan modelling prosedur lainnya yang digunakan untuk anlisa

epidemioligik bila ukuran penyakit yang digunakan adalah dikotomus.

Penjelasannya adalah sebagai berikut:

Terlihat pada gambar fungsi logistik terletak pada nilai z antara -∞ dan +∞.

Pada saat nilai z= -∞ maka ƒ(z) =0 dan pada saat z= +∞ maka ƒ(z) =1

Jadi nilai ƒ(z) akan berkisar antara 0 dan1. Sehingga model logistik dapat

digunakan untuk menggambarkan probabilitas yang selalu memiliki nilai antara 0

dan 1. Pada epidemiologi, probabilitas ini dikenal sebagai risiko untuk terjadinya

penyakit.

Alasan lainnya mengapa fungsi logistik ini populer untuk analisis data

epidemiologik adalah bentuk dari kurva logistik. Seperti terlihat pada gambar,

nilai ƒ(z) meningkat secara perlahan pada saat z berubah dari -∞ ke arah 0,

kemudian ƒ(z) meningkat secara cepat dan kemudian peningkatannya kembali

perlahan pada saat ƒ(z) mendekati 1 ketika z meningkat menjadi +∞. Hasilnya

adalah kurva yang berbentuk S.

Kurva yang berbentuk S ini dianggap cocok untuk menggambarkan

peningkatan risiko terjadinya outcome pada penelitia epidemiologi, jikaz

dianggap sebagai indeks yang menggabungkan efek dari berbagai faktor risiko

dan ƒ(z) merupakan risiko pada nilai z tertentu. Bentuk kurva S menunjukkan

3

efek z pada risiko individu minimal pada nilai z kecil sampai pada satu batas

ambang tertentu dan tetap tinggi saat risiko mendekati 1 dan nilai z cukup besar.

Menurut ahli epidemiologi, konsep ambang batas (threshold) ini dapat

digunakan pada berbagai keadaan penyakit. Jadi bentuk kurva logistik dapat

digunakan secara luas pada analisis multivariabel pada penelitian epidemiologi.

1

ƒ(z) =

1

1+e−z =0 ½ ƒ(z) =

1

1+e−z =1

- ∞ 0 +∞

Z

threshold

Range : 0 ≤ ƒ(z) ≤ 1

Individual risk : 0 ≤ probability ≤ 1

II. MODEL REGRESI LOGISTIK

Model regresi logistik dituliskan dalam bentuk penjumlahan linier yaitu:

Z = α +β1X1 + β2X2 + …+βkXk

dimana X1,X2 dan Xk merupakan variabel independen. Jadi z merupakan

indeks yang menggabungkan x. Kemudian nilai z pada fungsi logistik diganti

penjumlahan linier sehingga fungsi logistik dapat dituliskan:

4

ƒ(z) =

1

1+e−(α+β1 χ1+β2 χ2+. . . .+βk χ k )

Dimana f(z) merupakan probabilitas untuk terjadinya suatu keluaran. Pada

penelitian kesehatan, probabilitas ini untuk terjadinya penyakit (1) atau tidak

terjadinya penyakit (0) pada kombinasi variabel independen. Jadi fungsi logistik

dapat dituliskan sebagai berikut:

P(D) =

1

1+e−(α+β1 χ1+β2 χ2+. . . ..+βk χk )

Pada model logistik, α dan βi merupakan parameter yang tidak diketahui

yang perlu di estimasi dengan menggunakan data yang ada. Estimasi parameter

dilakukan dengan menggunakan metode maximum likelihood dengan fungsi

likelihood:

L =

∏l=1

n

exp(α+∑i=1

k

βi χ il)∏l=1

n [1+exp(α+∑i=1

k

β i χ il)]Estimasi parameter terlalu kompleks untuk dilakukan dengan perhitungan

manual, sehingga perhitungan dilakukan dengan perangkat lunak statistik.

Hasil turunan matematik pada fungsi logistik menunjukkan bahwa ekponen βi

adalah OR.

III. STUDY DESIGN ISSUE

Analisis regresi logistik digunakan pada disain cohort, dan dapat juga pada

disain case control maupun pada cross sectional. Meskipun logistik modelling

dapat digunakan untuk disain case control dan cross sectional, tapi terdapat

keterbatasan analisa untuk disain ini. Pada disain kohort, model logistik dapat

digunakan untuk memprediksi risiko individual, tapi pada disain case control dan

cross sectional kita tidak memprediksi individual risk, hanya bisa memakai hasil

estimasi OR saja.

5

Tabel penggunaan interpretasi

Interpretasi cohort Case control Cross sectional

P (D) ya tidak tidak

OR ya ya ya

IV. STRATEGI PEMODELAN REGRESI LOGISTIK

Ada secara tipikal 2 tujuan (goals) dalam mathematical modeling pada regresi

logistik:

1. untuk mendapatkan valid estimasi dari hubungan suatu exposure-

penyakit, disebut model Estimasi

2. untuk mendapatkan model prediksi yang dianggap terbaik untuk

memprediksi kejadian variabel dependen (outcome), disebut model

Prediksi

Tergantung dari tujuan peneliti, maka strategi yang digunakan juga berbeda

untuk masing-masing tujuan (different strategies for different goals).

Pada tabel akan dijelaskan lebih lanjut perbedaan kedua model tersebut.

Tabel Perbedaan model prediksi dan model estimasi

Perbedaan Model Prediksi Model Estimasi

Kedudukan variabel pada model

semua variabel dianggap sama penting, sehingga dapat dilakukan estimasi beberapa koefisien sekaligus

diutamakan adalah nilai koefisien regresi suatu determinan yang ingin dipelajari, sedangkan variabel lain dipertimbangkan sebagai kontrol.

Bentuk model Model yang paling tepat dan paling sederhana (parsimoni)

Modelnya relatif lebih kaya dibandingkan model prediksi

6

Hal penting yang harus diperhatikan pada waktu kita melakukan strategi

pemodelan adalah sebagai berikut:

Kita harus melakukan check untuk kemungkinan terjadinya

multicollinearity.

Juga harus diperhatikan Influential observation. Individual data dapat

mempengaruhi koefisien regresi, seperti contoh outlier. Koefisien dapat

berubah bila outlier dikeluarkan dari analisis.

Bila variabel independen memiliki kategori lebih dari 2 kategori, maka

variabel tersebut disebut variabel dummy, pada analisa harus dilakukan

kategorisasi. Akibat bila tidak dilakukan pengkategorian, hubungan antara

variabel dependen dan independen (OR) dianalisakan sebagai numerik

bukan kelompok, ini dapat menimbulkan salah interpretasi. Cara

pengkategorian akan dijelaskan pada contoh latihan.

Identifikasi untuk variabel independen yang kontinu, adalah mengganti

variabel kontinyu dengan variabel yang bersifat kategorikal. Pembagian ini

berdasarkan pembagian kuartil dan kemudian dilakukan plotting koefisien

estimasi dengan titik tengah kuartil. Kalau dianggap tidak linier, maka

dianjurkan untuk dirubah menjadi dikotom atau tetap sebagai variabel

kontinyu kalau hanya bertindak sebagai variabel kontrol.

Untuk variabel yang bersifat kontinyu, diusahakan agar data/nilai variabel

tidak dalam bentuk desimal. Karena OR yang terbentuk, akan

diperhitungkan sesuai kenaikan per desimal tersebut. Dampaknya nilai

OR akan menjadi besar dalam bentuk ratusan atau ribuan.

1. MODEL PREDIKSI

Ketika tujuannya adalah untuk prediksi, maka bisa menggunakan computer

algorithms, seperti backward elimination atau semua kemungkinan regression,

sesuai dengan paket yang ada dalam komputer.

Langkah-langkah yang dilakukan dalam memprediksi model adalah :

7

Mencari covariat potensial yang akan dimasukkan kedalam model dengan

cara melakukan screening untuk menseleksi variabel

a. Variabel kategori menggunakan uji crosstab

b. Variabel kontinyu menggunakan uji t

analisis bivariat masing-masing variabel independen dengan variabel

dependen, bila nilai p yang didapat < 0.25 dimasukkan sebagai covariat

potensial. Kriteria ini ditetapkan berdasarkan pengalaman empirik,

penggunaan nilai α yang lazim 0.05 seringkali tidak berhasil

mengidentifikasikan variabel yang dianggap penting.

Maka terbentuk variabel yang akan masuk kedalam candidat model.

Model ini disebut juga sebagai main effects model.

Melakukan pemilihan variabel dengan memasukkan semua variabel yang

telah terpilih sebagai candidat model.

Pemilihan variabel yang dilakukan dalam memilih variabel dapat dilakukan

dengan 2 cara (tersedia dalam paket komputer), seperti:

a. Pemilihan dengan manual; Enter

b. Pemilihan variabel oleh komputer; Forward, Backward dan

Stepwise

Kesemua cara ini memiliki tujuan yang sama yaitu mendapatkan model

yang parsimoni. Kecenderungan peneliti adalah memilih dengan metode

enter, karena peneliti dapat memilih variabel yang masuk atau

mengeluarkan variabel yang bisa diterangkan secara substantif keilmuan.

Untuk pemilihan variabel dengan komputer, setelah kita masukkan

seluruh candidat model maka akan keluar langsung hasil model yang

parsimonimenurut komputer. Untuk selanjutnya akan dibicarakan dengan

cara enter.

Dari model yang lengkap kemudian secara bertahap dihilangkan satu

persatu variabel yang memiliki nilai p > 0.05, dimulai dari variabel dengan

nilai p tertinggi. Model di run kembali sehingga didapatkan masing-masing

variabel memiliki nilai p yang < 0.05

8

Dilakukan test interaksi berdasarkan substansi. Dari model yang telah

ada, dilakukan satu persatu kemungkinan adanya interaksi. Lakukan

pemilihan variabel interaksi seperti langkah diatas.

Terbentuk model regresi logistik yang diinginkan

CONTOH PEMODELAN PREDIKSI

Model untuk mengetahui faktor risiko terjadinya penyakit jantung koroner, data

yang digunakan adalah data CHD.

Tujuan penelitian

ingin mengetahui faktor risiko terjadinya penyakit jantung koroner .

Kerangka konsep :

AgeRaceSmokeHigh Cholesterol Coronary Heart DiseaseHypertensionDiabetes MellitusNumber of exerciseWeight

Diperiksa dahulu apakah terdapat multikolinieritas antar variabel

dependen, dengan melihat nilai r

9

Correlations

1 .236** .181*

. .001 .010

200 200 200

.236** 1 .142*

.001 . .044

200 200 200

.181* .142* 1

.010 .044 .

200 200 200

Pearson Correlat ion

Sig. (2-tailed)

N


Sig. (2-tailed)

N


Sig. (2-tailed)

N

Age

Number ofexercises/week

WEIGHT1

Age

Number ofexercises/

week WEIGHT1

Correlat ion is signif icant at the 0.01 level (2-tailed).**.

Correlat ion is signif icant at the 0.05 level (2-tailed).*.

Nilai r seluruhnya < 0.8 Tidak ada korelasi yang lebih dari 0.8, sehingga koliniearitas bukan masalah serius

Mencari covariat potensial yang akan dimasukkan kedalam model dengan

cara melakukan screening untuk menseleksi variabel

a. Variabel kategori menggunakan uji crosstab yaitu : race, smoke

high cholesterol

SCREENING CANDIDAT MODEL

Variabel kategorirace

Chi-Square Tests

5.593a 2 .061

5.529 2 .063

2.790 1 .095

200

Pears on Chi-Square

Lik el ihood Ratio

Linear-by -LinearAs s oc iation

N of Val id Cas es

Value dfAs y mp. Sig.

(2-s ided)

0 c el ls (.0%) hav e ex pec ted c ount les s than 5. Theminimum ex pec ted c ount is 9.75.

a.

smoking

10

Chi -Square Tests

6. 569b 1 . 010

5. 806 1 . 016

6. 520 1 . 011

. 014 . 008

6. 536 1 . 011

200

Pearson Chi-Square

Cont inuit y Cor rect ion a

Likelihood Rat io

Fisher 's Exact Test

Linear-by-LinearAssociat ion

N of Valid Cases

Value dfAsymp. Sig.

(2-sided)Exact Sig.(2-sided)

Exact Sig.(1-sided)

Comput ed only f or a 2x2 t ablea.

0 cells ( . 0%) have expect ed count less t han 5. The minimum expect ed count is26. 65.

b.

high cholesterol

Chi -Square Tests

15. 629b 1 . 000

14. 043 1 . 000

14. 637 1 . 000

. 000 . 000

15. 551 1 . 000

200

Pearson Chi-Square


Likelihood Rat io



N of Valid Cases

Value dfAsymp. Sig.


Exact Sig.(1-sided)



b.

hypertension

Chi -Square Tests

3. 884b 1 . 049

2. 732 1 . 098

3. 600 1 . 058

. 060 . 053

3. 864 1 . 049

200

Pearson Chi-Square


Likelihood Rat io



N of Valid Cases

Value dfAsymp. Sig.


Exact Sig.(1-sided)


1 cells (25. 0%) have expect ed count less t han 5. The minimum expect ed count is3. 90.

b.

diabetes melitus

11

Chi -Square Tests

2. 681b 1 . 102

2. 041 1 . 153

2. 570 1 . 109

. 143 . 078

2. 667 1 . 102

200

Pearson Chi-Square


Likelihood Rat io



N of Valid Cases

Value dfAsymp. Sig.


Exact Sig.(1-sided)



b.

Tabel hasil uji bivariat variabel independen kategori dengan CHD

Variabel Independen Kategorik Hasil screening nilai P

1. Race2. Smoke3. Cholesterol4. Hipertension5. Diabetes melitus

0.0610.080.00

0.0530.078

Semua terpilih sebagai variabel kandidat dalam model karena nilai p<0.25

b. Variabel kontinyu menggunakan uji t yaitu; age, number dan weight

variabel kontinyu

In d e p e n d e n t Sa mp le s T e s t

3 .8 2 4 .0 5 2 1 .5 7 5 1 9 8 .11 7 1 .2 5 .7 9 6 -.3 1 6 2 .8 2 3

1 .6 9 2 1 5 2 .5 4 4 .0 9 3 1 .2 5 .7 4 1 -.2 1 0 2 .7 1 7

2 .4 0 9 .1 2 2 2 .6 5 5 1 9 8 .0 0 9 5 9 .9 2 2 2 .5 6 4 1 5 .4 2 0 1 0 4 .4 1 5

2 .8 5 8 1 5 3 .2 2 3 .0 0 5 5 9 .9 2 2 0 .9 6 3 1 8 .5 0 4 1 0 1 .3 3 1

.0 3 7 .8 4 8 1 .1 9 7 1 9 8 .2 3 3 .1 9 .1 5 9 -.1 2 3 .5 0 4

1 .2 2 6 1 3 4 .6 0 5 .2 2 2 .1 9 .1 5 5 -.11 7 .4 9 7

Eq u a l v a ria n c e sa s s u me d

Eq u a l v a ria n c e sn o t a s s u me d





Ag e

WEIGHT 1

Nu mb e r o fe x e rc is e s /we e k

F Sig .

L e v e n e 's T e s t fo rEq u a lity o f Va ria n c e s

t d f Sig . (2 -ta ile d )Me a n

Diffe re n c eStd . Erro r

Diffe re n c e L o we r Up p e r

9 5 % Co n fid e n c eIn te rv a l o f th eDiffe re n c e

t-te s t fo r Eq u a lity o f Me a n s

12

Tabel hasil uji bivariat variabel independen kontinyu dengan CHD

Variabel Independen Kontinyu Hasil screening nilai P

1. Age2. number of exercise3. weight

0.1170.2330.09

Semua variabel kontinyu terpilih dalam model karena memiliki nilai p>0.25

Maka terbentuk variabel yang akan masuk kedalam candidat model.

Model ini disebut juga sebagai main effects model.

Melakukan pemilihan variabel dengan memasukkan semua variabel yang

telah terpilih sebagai candidat model.

Jangan lupa bahwa variabel race memiliki kategori lebih dari 2 (variabel

dummy), sehingga harus dilakukan kategori, reference group adalah first.

Dari model yang lengkap kemudian secara bertahap dihilangkan satu

persatu variabel yang memiliki nilai p > 0.05, dimulai dari variabel dengan

nilai p tertinggi. Model di run kembali sehingga didapatkan masing-masing

variabel memiliki nilai p yang < 0.05

PEMILIHAN MODEL DENGAN METODE ENTER

Number of exercise dikeluarkan

13

Vari abl es i n the Equat i on

- . 037 . 038 . 984 1 . 321 . 963

8. 078 2 . 018

1. 371 . 498 7. 576 1 . 006 3. 940

. 749 . 442 2. 875 1 . 090 2. 115

. 849 . 398 4. 558 1 . 033 2. 337

1. 377 . 453 9. 243 1 . 002 3. 964

1. 805 . 712 6. 433 1 . 011 6. 083

. 408 . 445 . 842 1 . 359 1. 504

- . 008 . 174 . 002 1 . 962 . 992

- . 003 . 001 5. 987 1 . 014 . 997

. 962 1. 202 . 641 1 . 423 2. 618

AG E

RACE

RACE(1)

RACE(2)

SMO KE

CHO L

HT

DM

EXER

WEI G HT1

Const ant

St ep1

a

B S. E. Wald df Sig. Exp( B)

Var iable(s) ent er ed on st ep 1: AG E, RACE, SMO KE, CHO L, HT, DM, EXER, WEI G HT1.a.

Diabetes melitus dikeluarkanVari abl es i n the Equat i on

- . 038 . 037 1. 031 1 . 310 . 963

8. 148 2 . 017

1. 372 . 497 7. 610 1 . 006 3. 945

. 752 . 439 2. 936 1 . 087 2. 120

. 851 . 395 4. 640 1 . 031 2. 342

1. 377 . 453 9. 242 1 . 002 3. 963

1. 808 . 709 6. 504 1 . 011 6. 101

. 409 . 444 . 850 1 . 357 1. 506

- . 003 . 001 6. 034 1 . 014 . 997

. 963 1. 201 . 644 1 . 422 2. 621

AG E

RACE

RACE(1)

RACE(2)

SMO KE

CHO L

HT

DM

WEI G HT1

Const ant

St ep1

a


Var iable( s) ent er ed on st ep 1: AG E, RACE, SMO KE, CHO L, HT, DM, WEI G HT1.a.

Age dikeluarkan

Vari abl es i n t he Equat i on

- . 041 . 037 1. 276 1 . 259 . 959

7. 939 2 . 019

1. 346 . 498 7. 315 1 . 007 3. 842

. 756 . 436 3. 007 1 . 083 2. 129

. 860 . 394 4. 776 1 . 029 2. 364

1. 434 . 450 10. 165 1 . 001 4. 197

1. 745 . 707 6. 097 1 . 014 5. 725

- . 003 . 001 6. 137 1 . 013 . 997

1. 139 1. 178 . 935 1 . 334 3. 125

AG E

RACE

RACE( 1)

RACE( 2)

SMO KE

CHO L

HT

WEI G HT1

Const ant

St ep1

a


Var iable( s) ent er ed on st ep 1: AG E, RACE, SMO KE, CHO L, HT, WEI G HT1.a.

Tabel hasil pemilihan variabel yang dikeluarkan

Variabel yang dikeluarkan P value

1. Exercise 0.960

14

2. Diabetes Mellitus3. Age

0.3570.259

Dilakukan test interaksi berdasarkan substansi. Dari model yang telah

ada, dilakukan satu persatu kemungkinan adanya interaksi. Lakukan

pemilihan variabel interaksi seperti langkah diatas.

PEMILIHAN VARIABEL INTERAKSI

Var i abl es i n t he Equat i on

3. 663 2 . 160

1. 157 . 752 2. 367 1 . 124 3. 180

1. 032 . 579 3. 178 1 . 075 2. 807

. 990 . 579 2. 922 1 . 087 2. 690

1. 384 . 443 9. 755 1 . 002 3. 993

1. 752 . 728 5. 794 1 . 016 5. 764

- . 004 . 001 6. 681 1 . 010 . 996

2. 185 2 . 335

. 696 1. 039 . 449 1 . 503 2. 007

- . 904 . 903 1. 002 1 . 317 . 405

. 223 1. 036 . 046 1 . 829 1. 250

RACE

RACE( 1)

RACE( 2)

SM O KE

CHO L

HT

WEI G HT1

RACE * SM O KE

RACE( 1) by SM O KE

RACE( 2) by SM O KE

Const ant

St ep1

a


Var iable( s) ent er ed on st ep 1: RACE, SM O KE, CHO L, HT, WEI G HT1, RACE * SM O KE .a.


10. 666 2 . 005

1. 694 . 533 10. 099 1 . 001 5. 440

. 889 . 470 3. 575 1 . 059 2. 433

. 829 . 392 4. 469 1 . 035 2. 292

1. 765 . 622 8. 040 1 . 005 5. 842

1. 788 . 720 6. 158 1 . 013 5. 975

- . 004 . 001 7. 425 1 . 006 . 996

1. 860 2 . 395

- 1. 760 1. 302 1. 829 1 . 176 . 172

- . 550 . 944 . 340 1 . 560 . 577

. 315 . 955 . 108 1 . 742 1. 370

RACE

RACE( 1)

RACE( 2)

SM O KE

CHO L

HT

WEI G HT1

CHO L * RACE

CHO L by RACE( 1)

CHO L by RACE( 2)

Const ant

St ep1

a


Var iable( s) ent er ed on st ep 1: RACE, SM O KE, CHO L, HT, WEI G HT1, CHO L * RACE .a.

15


7. 915 2 . 019

1. 372 . 515 7. 096 1 . 008 3. 942

. 787 . 435 3. 278 1 . 070 2. 197

. 873 . 393 4. 935 1 . 026 2. 395

1. 327 . 440 9. 080 1 . 003 3. 769

1. 596 1. 033 2. 387 1 . 122 4. 932

- . 004 . 001 7. 133 1 . 008 . 996

. 190 2 . 910

. 727 1. 735 . 175 1 . 675 2. 068

. 050 1. 612 . 001 1 . 975 1. 052

. 403 . 968 . 174 1 . 677 1. 497

RACE

RACE( 1)

RACE( 2)

SM O KE

CHO L

HT

WEI G HT1

HT * RACE

HT by RACE( 1)

HT by RACE( 2)

Const ant

St ep1

a


Var iable( s) ent er ed on st ep 1: RACE, SM O KE, CHO L, HT, WEI G HT1, HT * RACE .a.


1. 751 2 . 417

1. 613 2. 009 . 645 1 . 422 5. 019

2. 717 2. 153 1. 592 1 . 207 15. 131

. 882 . 392 5. 048 1 . 025 2. 415

1. 350 . 439 9. 461 1 . 002 3. 856

1. 684 . 708 5. 661 1 . 017 5. 385

- . 003 . 002 2. 109 1 . 146 . 997

. 872 2 . 646

. 000 . 003 . 014 1 . 904 1. 000

- . 003 . 004 . 832 1 . 362 . 997

- . 200 1. 302 . 024 1 . 878 . 819

RACE

RACE( 1)

RACE( 2)

SM O KE

CHO L

HT

WEI G HT1

RACE * WEI G HT1

RACE( 1) by WEI G HT1

RACE( 2) by WEI G HT1

Const ant

St ep1

a


Var iable( s) ent er ed on st ep 1: RACE, SM O KE, CHO L, HT, WEI G HT1, RACE * WEI G HT1 .a.


9. 333 2 . 009

1. 469 . 501 8. 617 1 . 003 4. 346

. 799 . 429 3. 464 1 . 063 2. 223

. 793 . 404 3. 857 1 . 050 2. 211

1. 366 . 440 9. 643 1 . 002 3. 921

1. 344 . 887 2. 292 1 . 130 3. 833

- . 004 . 001 7. 596 1 . 006 . 996

1. 068 1. 403 . 579 1 . 447 2. 908

. 511 . 981 . 271 1 . 603 1. 666

RACE

RACE( 1)

RACE( 2)

SM O KE

CHO L

HT

WEI G HT1

HT by SM O KE

Const ant

St ep1

a


Var iable( s) ent er ed on st ep 1: RACE, SM O KE, CHO L, HT, WEI G HT1, HT * SM O KE .a.

16


8. 830 2 . 012

1. 438 . 497 8. 383 1 . 004 4. 213

. 715 . 432 2. 733 1 . 098 2. 044

- . 959 1. 716 . 312 1 . 576 . 383

1. 371 . 441 9. 682 1 . 002 3. 941

1. 677 . 716 5. 480 1 . 019 5. 350

- . 005 . 002 6. 275 1 . 012 . 995

. 003 . 003 1. 190 1 . 275 1. 003

1. 412 1. 397 1. 021 1 . 312 4. 104

RACE

RACE( 1)

RACE( 2)

SM O KE

CHO L

HT

WEI G HT1

SM O KE by WEI G HT1

Const ant

St ep1

a


Var iable( s) ent er ed on st ep 1: RACE, SM O KE, CHO L, HT, WEI G HT1, SM O KE * WEI G HT1 .a.


9. 032 2 . 011

1. 429 . 494 8. 367 1 . 004 4. 174

. 772 . 429 3. 237 1 . 072 2. 163

. 886 . 390 5. 173 1 . 023 2. 426

1. 266 . 445 8. 087 1 . 004 3. 546

1. 611 . 747 4. 649 1 . 031 5. 009

- . 004 . 001 7. 080 1 . 008 . 996

4. 654 15. 507 . 090 1 . 764 104. 990

. 335 . 945 . 125 1 . 723 1. 398

RACE

RACE( 1)

RACE( 2)

SM O KE

CHO L

HT

WEI G HT1

CHO L by HT

Const ant

St ep1

a


Var iable( s) ent er ed on st ep 1: RACE, SMO KE, CHO L, HT, WEI G HT1, CHO L * HT .a.


9. 052 2 . 011

1. 425 . 494 8. 309 1 . 004 4. 159

. 793 . 429 3. 423 1 . 064 2. 211

. 861 . 391 4. 855 1 . 028 2. 366

2. 087 2. 358 . 783 1 . 376 8. 059

1. 750 . 710 6. 081 1 . 014 5. 757

- . 004 . 001 5. 925 1 . 015 . 996

- . 001 . 004 . 108 1 . 743 . 999

. 247 . 985 . 063 1 . 802 1. 280

RACE

RACE( 1)

RACE( 2)

SM O KE

CHO L

HT

WEI G HT1

CHO L by WEI G HT1

Const ant

St ep1

a


Var iable( s) ent er ed on st ep 1: RACE, SM O KE, CHO L, HT, WEI G HT1, CHO L * WEI G HT1 .a.

17


9. 079 2 . 011

1. 430 . 495 8. 331 1 . 004 4. 178

. 794 . 429 3. 427 1 . 064 2. 213

. 872 . 394 4. 912 1 . 027 2. 392

1. 326 . 437 9. 195 1 . 002 3. 765

1. 877 2. 670 . 494 1 . 482 6. 532

- . 004 . 002 5. 863 1 . 015 . 996

. 000 . 003 . 002 1 . 967 1. 000

. 328 1. 035 . 100 1 . 751 1. 388

RACE

RACE( 1)

RACE( 2)

SM O KE

CHO L

HT

WEI G HT1

HT by WEI G HT1

Const ant

St ep1

a


Var iable( s) ent er ed on st ep 1: RACE, SM O KE, CHO L, HT, WEI G HT1, HT * WEI G HT1 .a.


. 870 . 390 4. 974 1 . 026 2. 387 1. 111 5. 128

1. 326 . 437 9. 219 1 . 002 3. 768 1. 600 8. 870

- . 037 . 014 7. 248 1 . 007 . 964 . 938 . 990

9. 077 2 . 011

1. 429 . 495 8. 328 1 . 004 4. 176 1. 582 11. 025

. 794 . 429 3. 425 1 . 064 2. 212 . 954 5. 126

1. 769 . 712 6. 177 1 . 013 5. 867 1. 454 23. 682

. 346 . 946 . 134 1 . 715 1. 413

SM O KE

CHO L

WEI G HT

RACE

RACE( 1)

RACE( 2)

HT

Const ant

St ep1

a

B S. E. Wald df Sig. Exp( B) Lower Upper

95. 0% C. I . f orEXP( B)

Var iable( s) ent er ed on st ep 1: SM O KE, CHO L, WEI G HT, RACE, HT.a.

Hasil pengujian interaksi dapat dirangkumkan dalam tabel dibawah ini;

Tabel hasil uji variabel interaksi

Variabel interaksi P value

Race1 by smoke Race2 by smokeRace1 by cholesterolRace2 by cholesterolRace1 by hipertensionRace2 by hipertensionRace1 by weightRace2 by weightSmoke by hipertensionSmoke by weightCholesterol by HipertensionCholesterol by wightHipertension by weight

0.5030.3170.1760.5600.6750.9750.9040.3620.4470.2750.7640.7430.967

18

Dari hasil penelitian didapatkan tidak terdapat interaksi didalam model.

Terbentuk model regresi logistik yang diinginkan

a. omnibust test,model harus significant p<0.05 yang menunjukkan bahwa model

appropriate

Omnibus Tests of Model Coefficients

39.823 6 .000

39.823 6 .000

39.823 6 .000

Step

Block

Model

Step 1Chi-square df Sig.

b. Dilihat overall percentage pada classification tableDengan ketepatan dari model ini adalah 76.5%

Cl assi f i cat i on Tabl ea

123 12 91. 1

35 30 46. 2

76. 5

O bservedNo

Yes

Coronary hear tdisease

O verall Percent age

St ep 1No Yes

Coronary hear tdisease Percent age

Correct

Predict ed

The cut value is . 500a.

c. Model pada penelitian ini adalah :

Z = 0.346 + 1.429 race1 + 0.794 race2 + 0.870 smoke +1.326 cholesterol + 1.769 hipertension – 0.037 weight1


. 870 . 390 4. 974 1 . 026 2. 387 1. 111 5. 128

1. 326 . 437 9. 219 1 . 002 3. 768 1. 600 8. 870

- . 037 . 014 7. 248 1 . 007 . 964 . 938 . 990

9. 077 2 . 011

1. 429 . 495 8. 328 1 . 004 4. 176 1. 582 11. 025

. 794 . 429 3. 425 1 . 064 2. 212 . 954 5. 126

1. 769 . 712 6. 177 1 . 013 5. 867 1. 454 23. 682

. 346 . 946 . 134 1 . 715 1. 413

SM O KE

CHO L

WEI G HT

RACE

RACE( 1)

RACE( 2)

HT

Const ant

St ep1

a


95. 0% C. I . f orEXP( B)

Var iable( s) ent er ed on st ep 1: SM O KE, CHO L, WEI G HT, RACE, HT.a.

19

PEMILIHAN MODEL DENGAN METODE FORWARD


14.637 1 .000

14.637 1 .000

14.637 1 .000

5.639 1 .018

20.276 2 .000

20.276 2 .000

7.157 1 .007

27.433 3 .000

27.433 3 .000

7.274 2 .026

34.708 5 .000

34.708 5 .000

5.116 1 .024

39.823 6 .000

39.823 6 .000

Step

Block

Model

Step

Block

Model

Step

Block

Model

Step

Block

Model

Step

Block

Model

Step 1

Step 2

Step 3

Step 4

Step 5

Chi-square df Sig.

20


123 12 91. 1

45 20 30. 8

71. 5

125 10 92. 6

45 20 30. 8

72. 5

124 11 91. 9

42 23 35. 4

73. 5

121 14 89. 6

41 24 36. 9

72. 5

123 12 91. 1

35 30 46. 2

76. 5

ObservedNo

Yes


Overall Percent age

No

Yes


Overall Percent age

No

Yes


Overall Percent age

No

Yes


Overall Percent age

No

Yes


Overall Percent age

St ep 1

St ep 2

St ep 3

St ep 4

St ep 5

No Yes


Correct

Predict ed



1. 516 . 405 14. 047 1 . 000 4. 556

- 1. 006 . 174 33. 311 1 . 000 . 366

1. 431 . 410 12. 195 1 . 000 4. 184

- . 003 . 001 4. 925 1 . 026 . 997

. 781 . 805 . 939 1 . 332 2. 183

1. 450 . 418 12. 025 1 . 001 4. 263

1. 874 . 724 6. 693 1 . 010 6. 514

- . 004 . 001 7. 629 1 . 006 . 996

1. 221 . 836 2. 133 1 . 144 3. 390

7. 184 2 . 028

1. 287 . 481 7. 157 1 . 007 3. 623

. 367 . 371 . 981 1 . 322 1. 444

1. 510 . 428 12. 417 1 . 000 4. 526

1. 848 . 735 6. 318 1 . 012 6. 345

- . 004 . 001 9. 036 1 . 003 . 996

1. 174 . 888 1. 748 1 . 186 3. 236

9. 077 2 . 011

1. 429 . 495 8. 328 1 . 004 4. 176

. 794 . 429 3. 425 1 . 064 2. 212

. 870 . 390 4. 974 1 . 026 2. 387

1. 326 . 437 9. 219 1 . 002 3. 768

1. 769 . 712 6. 177 1 . 013 5. 867

- . 004 . 001 7. 248 1 . 007 . 996

. 346 . 946 . 134 1 . 715 1. 413

CHO L

Const ant

St ep1

a

CHO L

WEI G HT1

Const ant

St ep2

b

CHO L

HT

WEI G HT1

Const ant

St ep3

c

RACE

RACE( 1)

RACE( 2)

CHO L

HT

WEI G HT1

Const ant

St ep4

d

RACE

RACE( 1)

RACE( 2)

SMO KE

CHO L

HT

WEI G HT1

Const ant

St ep5

e


Var iable( s) ent er ed on st ep 1: CHO L.a.

Var iable( s) ent er ed on st ep 2: WEI G HT1.b.

Var iable( s) ent er ed on st ep 3: HT.c.

Var iable( s) ent er ed on st ep 4: RACE.d.

Var iable( s) ent er ed on st ep 5: SMO KE.e.

PEMILIHAN MODEL DENGAN METODE BACKWARD

21


39.823 6 .000

39.823 6 .000

39.823 6 .000

Step

Block

Model



123 12 91. 1

35 30 46. 2

76. 5

O bservedNo

Yes


O verall Percent age

St ep 1No Yes


Correct

Predict ed



9. 077 2 . 011

1. 429 . 495 8. 328 1 . 004 4. 176

. 794 . 429 3. 425 1 . 064 2. 212

. 870 . 390 4. 974 1 . 026 2. 387

1. 326 . 437 9. 219 1 . 002 3. 768

1. 769 . 712 6. 177 1 . 013 5. 867

- . 004 . 001 7. 248 1 . 007 . 996

. 346 . 946 . 134 1 . 715 1. 413

RACE

RACE( 1)

RACE( 2)

SMO KE

CHO L

HT

WEI G HT1

Const ant

St ep1

a


Var iable( s) ent er ed on st ep 1: RACE, SMO KE, CHO L, HT, WEI G HT1.a.

Interpretasi model

Ternyata hasil yang diperoleh pada ke-3 metode pemilihan variabel, baik

pada metode enter, backward, forward pada penelitian ini menunjukkan

kesamaan hasil.

Interpretasi dari model yang terbentuk adalah bahwa faktor-faktor yang

mempengaruhi penyakit jantung koroner adalah Ras, Merokok, Cholesterol,

hipertensi dan berat badan. Yang paling besar pengaruhnya dalam kejadian

penyakit jantung koroner adalah Hipertensi. Dimana risiko penyakit jantung

koroner pada orang yang Hipertensi adalah 6 kali dibandingkan dengan yang

22

tidak hipertensi dengan 95% CI (1.454 – 23.682) setelah dikontrol oleh variabel

ras, merokok, kolesterol, dan berat badan.

Risiko Penyakit jantung koroner pada orang kulit hitam adalah 4 kali

dibandingkan dengan orangkulit putih dengan 95% CI (1.454 – 23.682) setelah

dikontrol oleh variabel hipertensi, merokok, kolesterol, dan berat badan.

Sedangkan untuk kulit lainnya Odds Penyakit jantung koroner adalah 2 kali

dibandingkan dengan yang tidak hipertensi dengan 95% CI (0.954 – 5.126)

setelah dikontrol oleh variabel hipertensi, merokok, kolesterol, dan berat badan.

Risiko Penyakit jantung koroner pada orang yang merokok adalah 2 kali

dibandingkan dengan yang tidak hipertensi dengan 95% CI (1.111 - 5.128)

setelah dikontrol oleh variabel ras, hipertensi, kolesterol, dan berat badan.

Risiko Penyakit jantung koroner pada orang dengan kolesterol tinggi

adalah 4 kali dibandingkan dengan yang tidak hipertensi dengan 95% CI (1.600

– 8.870) setelah dikontrol oleh variabel ras, merokok, hipertensi, dan berat

badan.

Kenaikan berat badan setiap 100 gram (0.1 kg) merupakan faktor

pencegah untuk terjadinya Penyakit jantung koroner yaitu 0.964 dengan 95% CI

(0.938 – 0.990) setelah dikontrol oleh variabel ras, merokok, kolesterol, dan

hipertensi.

2. MODEL ESTIMASI

Selanjutnya akan dibahas langkah dalam strategi pemodelan regresi logistik

dengan tujuan untuk mengestimasi hubungan paparan dan penyakit.

Langkah untuk melakukan strategi pemodelan dibutuhkan 3 tahap:

1. Variabel specification

peneliti melakukan penelusuran literature unttuk membatasi pada variabel

independen yang memang bermakna secara klinik maupun biologik.

Variabel ini dapat didefinsikan pada model sebagai langkah awal yang

paling mungkin masuk dalam model.

23

2. Interaction assesment

Bila terdapat interaksi maka OR dilaporkan terpisah

3. Confounding assesment followed by consideration of precision

Model terakhir adalah model dengan variabel interaksi dan konfounding

yang terpilih.

LANGKAH PEMBUATAN MODEL

Langkah untuk melakukan spesifikasi variabel secara jelas, dilakukan

pemodelan secara lengkap, mencakup semua variabel utama, kandidat

konfounding dan kandidat interaksi, yaitu:

1. Hierarchically Well-Formulated Models

Merupakan initial model. Model memiliki seluruh lower order component of

any term in the model.

2. The Hierarichal Backward Elimination Approach

Setelah didapatkan initial model strategi selanjutnya adalah prosedur

Hierarichal Backward Elimination Approach untuk mengeluarkan variabel.

Uji statistik digunakan untuk menguji interaksi. Tapi untuk mengeliminasi

confounders tidak menggunakan uji statistik. Strategi ini prisip kerjanya

adalah dari large starting model smaller final model.

Initial model

interaction

confounder

Eliminate EViEj

Eliminate Vi dan ViVj

Eliminate EVi

24

3. The Hierarchy Principles for retaining variables

Jika suatu variabel terdapat dalam model , maka semua lower-order

components juga harus ada dalam model.

CONTOH PEMODELAN ESTIMASI

Model untuk mengetahui hubungan merokok dengan terjadinya penyakit jantung

koroner, data yang digunakan adalah data CHD.

Tujuan penelitian:

Ingin mengetahui hubungan antara merokok dan kejadian penyakit jantung

koroner, dengan dikontrol oleh variabel independen lainnya.

Kerangka konsep:

Smoke Coronary Heart Diseases

AgeRace

High CholesterolHypertension

Diabetes MellitusNumber of exercise

Weight

25

Langkah pemodelan yang dilakukan adalah :

1. Variable spesification.

Melakukan pemodelan lengkap (Hierarchically Well Formulated Model)

dengan mencakup semua variabel utama, variabel confounding dan

kandidat interaksi

Variabel dependen adalah : Coronary Heart DiseasesVariabel Independen yaitu :

Variabel Resiko adalah

Smoke,

Variabel Confounder adalah

Age,

Race,

High cholelesterol,

Hypertension ,

Diabetes mellitus,

Number of exercise,

Weight (pada variabel weight dilakukan compute dengan mengalikan dengan 10, agar desimal pada variabel weight menjadi satuan. Hal ini dilakukan untuk memperhitungkan kenaikan dalam 1 unit untuk perhitungan OR agar tidak berlipat banyak)

Variabel Interaksi adalah :

Smoke*Age

Smoke*Race

Smoke*Hypertension

Smoke*weight

VARIABEL SPESIFICATION: MODEL HWF

26


- . 086 . 056 2. 353 1 . 125 . 918

1. 698 2 . 428

. 777 . 801 . 942 1 . 332 2. 176

. 760 . 608 1. 562 1 . 211 2. 137

- 2. 326 2. 555 . 829 1 . 363 . 098

1. 447 . 462 9. 792 1 . 002 4. 251

1. 571 . 928 2. 865 1 . 091 4. 813

. 664 . 469 2. 005 1 . 157 1. 942

- . 031 . 182 . 030 1 . 863 . 969

- . 004 . 002 3. 773 1 . 052 . 996

. 089 . 078 1. 280 1 . 258 1. 093

2. 406 2 . 300

1. 150 1. 094 1. 106 1 . 293 3. 159

- . 684 . 939 . 531 1 . 466 . 504

. 515 1. 517 . 115 1 . 734 1. 674

. 002 . 003 . 311 1 . 577 1. 002

2. 670 1. 844 2. 096 1 . 148 14. 445

AG E

RACE

RACE( 1)

RACE( 2)

SM O KE

CHO L

HT

DM

EXER

WEI G HT1

AG E by SM O KE

RACE * SM O KE

RACE( 1) by SM O KE

RACE( 2) by SM O KE

HT by SM O KE


Const ant

St ep1

a


Var iable( s) ent er ed on st ep 1: AG E, RACE, SM O KE, CHO L, HT, DM , EXER, WEI G HT1, AG E * SM O KE ,RACE * SM O KE , HT * SM O KE , SM O KE * WEI G HT1 .

a.

2. Melakukan Interaction assesment,

yang dilakukan dengan menghilangkan Interaksi yang memiliki p value

yang tertinggi dan di run kembali satu persatu sampai ditemukan Interaksi

yang signifikan. Didapatkan hasil nilai p dari masing-masing interaksi

sebagai berikut :

INTERACTION SPESIFICATION

Seluruh kemungkinan interaksi yang ada dimasukkan dalam model

27


- . 086 . 056 2. 365 1 . 124 . 917

1. 671 2 . 434

. 772 . 804 . 923 1 . 337 2. 164

. 756 . 609 1. 539 1 . 215 2. 130

- 2. 470 2. 505 . 973 1 . 324 . 085

1. 432 . 460 9. 676 1 . 002 4. 188

1. 770 . 735 5. 792 1 . 016 5. 868

. 673 . 468 2. 072 1 . 150 1. 961

- . 028 . 181 . 025 1 . 875 . 972

- . 004 . 002 3. 892 1 . 049 . 996

. 088 . 078 1. 263 1 . 261 1. 092

2. 377 2 . 305

1. 122 1. 088 1. 063 1 . 302 3. 070

- . 696 . 938 . 551 1 . 458 . 499

. 002 . 003 . 505 1 . 477 1. 002

2. 706 1. 844 2. 153 1 . 142 14. 967

AG E

RACE

RACE( 1)

RACE( 2)

SM O KE

CHO L

HT

DM

EXER

WEI G HT1

AG E by SM O KE

RACE * SM O KE

RACE( 1) by SM O KE

RACE( 2) by SM O KE


Const ant

St ep1

a


Var iable( s) ent er ed on st ep 1: AG E, RACE, SM O KE, CHO L, HT, DM , EXER, WEI G HT1, AG E * SM O KE ,RACE * SM O KE , SM O KE * WEI G HT1 .

a.


- . 091 . 055 2. 695 1 . 101 . 913

1. 896 2 . 387

. 687 . 791 . 754 1 . 385 1. 987

. 824 . 601 1. 880 1 . 170 2. 279

- 1. 312 1. 889 . 482 1 . 487 . 269

1. 420 . 461 9. 510 1 . 002 4. 138

1. 841 . 730 6. 360 1 . 012 6. 302

. 629 . 462 1. 850 1 . 174 1. 875

- . 016 . 180 . 008 1 . 930 . 984

- . 003 . 001 5. 042 1 . 025 . 997

. 093 . 078 1. 447 1 . 229 1. 098

3. 233 2 . 199

1. 270 1. 072 1. 404 1 . 236 3. 561

- . 781 . 930 . 705 1 . 401 . 458

2. 066 1. 572 1. 727 1 . 189 7. 892

AG E

RACE

RACE( 1)

RACE( 2)

SM O KE

CHO L

HT

DM

EXER

WEI G HT1

AG E by SM O KE

RACE * SM O KE

RACE( 1) by SM O KE

RACE( 2) by SM O KE

Const ant

St ep1

a


Var iable( s) ent er ed on st ep 1: AG E, RACE, SM O KE, CHO L, HT, DM , EXER, WEI G HT1, AG E * SM O KE, RACE * SM O KE .

a.

28


- . 077 . 053 2. 115 1 . 146 . 925

6. 884 2 . 032

1. 279 . 506 6. 403 1 . 011 3. 595

. 718 . 444 2. 617 1 . 106 2. 050

- 1. 070 1. 730 . 383 1 . 536 . 343

1. 328 . 451 8. 676 1 . 003 3. 774

1. 836 . 716 6. 574 1 . 010 6. 271

. 506 . 454 1. 244 1 . 265 1. 659

- . 019 . 175 . 011 1 . 915 . 981

- . 003 . 001 5. 854 1 . 016 . 997

. 085 . 075 1. 286 1 . 257 1. 089

1. 844 1. 449 1. 621 1 . 203 6. 325

AG E

RACE

RACE( 1)

RACE( 2)

SM O KE

CHO L

HT

DM

EXER

WEI G HT1

AG E by SM O KE

Const ant

St ep1

a


Var iable( s) ent er ed on st ep 1: AG E, RACE, SM O KE, CHO L, HT, DM , EXER, WEI G HT1, AG E *SM O KE .

a.


- . 037 . 038 . 984 1 . 321 . 963

8. 078 2 . 018

1. 371 . 498 7. 576 1 . 006 3. 940

. 749 . 442 2. 875 1 . 090 2. 115

. 849 . 398 4. 558 1 . 033 2. 337

1. 377 . 453 9. 243 1 . 002 3. 964

1. 805 . 712 6. 433 1 . 011 6. 083

. 408 . 445 . 842 1 . 359 1. 504

- . 008 . 174 . 002 1 . 962 . 992

- . 003 . 001 5. 987 1 . 014 . 997

. 962 1. 202 . 641 1 . 423 2. 618

AG E

RACE

RACE(1)

RACE(2)

SMO KE

CHO L

HT

DM

EXER

WEI G HT1

Const ant

St ep1

a



Tabel hasil uji variabel interaksi

Jenis Interaksi yang dihilangkan P value

Hipertensi by smokeSmoke by weightRace by smokeAge by smoke

0.7340.4770.4010.257

29


- . 037 . 038 . 984 1 . 321 . 963

8. 078 2 . 018

1. 371 . 498 7. 576 1 . 006 3. 940

. 749 . 442 2. 875 1 . 090 2. 115

. 849 . 398 4. 558 1 . 033 2. 337

1. 377 . 453 9. 243 1 . 002 3. 964

1. 805 . 712 6. 433 1 . 011 6. 083

. 408 . 445 . 842 1 . 359 1. 504

- . 008 . 174 . 002 1 . 962 . 992

- . 003 . 001 5. 987 1 . 014 . 997

. 962 1. 202 . 641 1 . 423 2. 618

AG E

RACE

RACE(1)

RACE(2)

SMO KE

CHO L

HT

DM

EXER

WEI G HT1

Const ant

St ep1

a



Dari hasil diatas ternyata tidak terdapat interaksi yang significan didalam

model.

Maka full model pada penelitian ini adalah :

Z = 0.962 - 0.037 age +1.371 race1 + 0.749 race2 + 0.849 smoke +1.377

chol + 1.805 ht +0.408 DM – 0.008 exer – 0.003 weight1

Dengan OR smoke full model adalah 2.337, yaitu OR smoke yang telah

terkontrol oleh variabel lainnya.

3. Confounder assesment

Dilakukan dengan cara Hierarchical Backward Elimination yaitu ;

membandingkan OR full model dengan OR Reduced Model. Bila besar

perubahan OR yang terjadi kurang dari 10 % maka model yang digunakan

adalah Reduced Model Tujuannya adalah untuk mendapatkan validitas.

Langkah yang dilakukan adalah dengan menghilangkan variabel yang

memiliki nilai p value yang tertinggi, kemudian di run kembali dan

dibandingkan ; Delta antara OR Reduced model dengan OR full model

dibagi dengan OR full model .

30

Bila besarnya perubahan < 10 % maka digunakan Reduced model.

Bila besar perubahan OR > 10 % maka variabel tersebut

dimasukkan kembali, Selanjutnya dilihat variabel lainnya untuk

dikeluarkan dan diperbandingkan kembali, satu persatu.

CONFOUNDING ASSESMENT


- . 038 . 037 1. 031 1 . 310 . 963

8. 148 2 . 017

1. 372 . 497 7. 610 1 . 006 3. 945

. 752 . 439 2. 936 1 . 087 2. 120

. 851 . 395 4. 640 1 . 031 2. 342

1. 377 . 453 9. 242 1 . 002 3. 963

1. 808 . 709 6. 504 1 . 011 6. 101

. 409 . 444 . 850 1 . 357 1. 506

- . 003 . 001 6. 034 1 . 014 . 997

. 963 1. 201 . 644 1 . 422 2. 621

AG E

RACE

RACE( 1)

RACE( 2)

SMO KE

CHO L

HT

DM

WEI G HT1

Const ant

St ep1

a


Var iable( s) ent er ed on st ep 1: AG E, RACE, SMO KE, CHO L, HT, DM, WEI G HT1.a.


- . 041 . 037 1. 276 1 . 259 . 959

7. 939 2 . 019

1. 346 . 498 7. 315 1 . 007 3. 842

. 756 . 436 3. 007 1 . 083 2. 129

. 860 . 394 4. 776 1 . 029 2. 364

1. 434 . 450 10. 165 1 . 001 4. 197

1. 745 . 707 6. 097 1 . 014 5. 725

- . 003 . 001 6. 137 1 . 013 . 997

1. 139 1. 178 . 935 1 . 334 3. 125

AG E

RACE

RACE( 1)

RACE( 2)

SMO KE

CHO L

HT

WEI G HT1

Const ant

St ep1

a


Var iable( s) ent er ed on st ep 1: AG E, RACE, SMO KE, CHO L, HT, WEI G HT1.a.

31


9. 077 2 . 011

1. 429 . 495 8. 328 1 . 004 4. 176

. 794 . 429 3. 425 1 . 064 2. 212

. 870 . 390 4. 974 1 . 026 2. 387

1. 326 . 437 9. 219 1 . 002 3. 768

1. 769 . 712 6. 177 1 . 013 5. 867

- . 004 . 001 7. 248 1 . 007 . 996

. 346 . 946 . 134 1 . 715 1. 413

RACE

RACE( 1)

RACE( 2)

SMO KE

CHO L

HT

WEI G HT1

Const ant

St ep1

a


Var iable( s) ent er ed on st ep 1: RACE, SMO KE, CHO L, HT, WEI G HT1.a.


. 560 . 332 2. 845 1 . 092 1. 751

1. 324 . 426 9. 665 1 . 002 3. 758

1. 812 . 703 6. 637 1 . 010 6. 120

- . 004 . 001 6. 991 1 . 008 . 997

. 877 . 851 1. 064 1 . 302 2. 405

SMO KE

CHO L

HT

WEI G HT1

Const ant

St ep1

a


Var iable(s) ent er ed on st ep 1: SMO KE, CHO L, HT, WEI G HT1.a.


. 870 . 390 4. 974 1 . 026 2. 387

1. 326 . 437 9. 219 1 . 002 3. 768

1. 769 . 712 6. 177 1 . 013 5. 867

- . 004 . 001 7. 248 1 . 007 . 996

9. 077 2 . 011

1. 429 . 495 8. 328 1 . 004 4. 176

. 794 . 429 3. 425 1 . 064 2. 212

. 346 . 946 . 134 1 . 715 1. 413

SMO KE

CHO L

HT

WEI G HT1

RACE

RACE(1)

RACE(2)

Const ant

St ep1

a


Var iable( s) ent er ed on st ep 1: SMO KE, CHO L, HT, WEI G HT1, RACE.a.


. 872 . 383 5. 193 1 . 023 2. 391

1. 319 . 429 9. 472 1 . 002 3. 740

- . 003 . 001 4. 693 1 . 030 . 997

9. 551 2 . 008

1. 428 . 488 8. 554 1 . 003 4. 172

. 831 . 418 3. 949 1 . 047 2. 296

- . 123 . 907 . 018 1 . 893 . 885

SMO KE

CHO L

WEI G HT1

RACE

RACE(1)

RACE(2)

Const ant

St ep1

a


Var iable( s) ent er ed on st ep 1: SMO KE, CHO L, WEI G HT1, RACE.a.

32


. 976 . 371 6. 915 1 . 009 2. 654

1. 377 . 422 10. 675 1 . 001 3. 964

9. 109 2 . 011

1. 230 . 467 6. 939 1 . 008 3. 420

. 980 . 407 5. 804 1 . 016 2. 665

-1. 965 . 360 29. 863 1 . 000 . 140

SMO KE

CHO L

RACE

RACE(1)

RACE(2)

Const ant

St ep1

a


Var iable(s) ent er ed on st ep 1: SMO KE, CHO L, RACE.a.


1. 063 . 368 8. 345 1 . 004 2. 896

9. 854 2 . 007

1. 382 . 480 8. 273 1 . 004 3. 983

. 895 . 405 4. 886 1 . 027 2. 447

- . 003 . 001 5. 752 1 . 016 . 997

. 155 . 871 . 031 1 . 859 1. 167

SMO KE

RACE

RACE(1)

RACE(2)

WEI G HT1

Const ant

St ep1

a


Var iable( s) ent er ed on st ep 1: SMO KE, RACE, WEI G HT1.a.

Dari hasil out put penelitian dapat diringkaskan dalam tabel dibawah ini :

Tabel hasil uji confounder

Confounder yang dikeluarkan

P value OR Smoke Reduced

Model

Delta OR Red dg OR full model

Besar perubahan OR

(%)

ExerciseDiabetes mellitusAgeRaceHypertensionWeight1Cholesterol

0.9620.3570.2590.0640.0130.0300.02

2.3422.3642.3871.7512.3912.6542.896

0.0050.0270.05

0.5860.0540.3170.559

0.2141.1552.13925.072.31

13.5623.92

Dari hasil diatas didapatkan bahwa variabel confounder yang masuk

kedalam model adalah variabel Race(Cat), Weight1, Cholesterol dengan

OR Smoke pada Reduced Model adalah 2.391

4. Final Model , yaitu model yang paling parsimonious dalam penelitian ini

adalah :

33

Smoke

High cholesterolWeight Race

Coronary Heart Disease


33.309 5 .000

33.309 5 .000

33.309 5 .000

Step

Block

Model



123 12 91. 1

39 26 40. 0

74. 5

ObservedNo

Yes


Overall Percent age

St ep 1No Yes


Correct

Predict ed


34


. 872 . 383 5. 193 1 . 023 2. 391 1. 130 5. 062

1. 319 . 429 9. 472 1 . 002 3. 740 1. 615 8. 665

- . 003 . 001 4. 693 1 . 030 . 997 . 995 1. 000

9. 551 2 . 008

1. 428 . 488 8. 554 1 . 003 4. 172 1. 602 10. 867

. 831 . 418 3. 949 1 . 047 2. 296 1. 012 5. 210

- . 123 . 907 . 018 1 . 893 . 885

SM O KE

CHO L

WEI G HT1

RACE

RACE( 1)

RACE( 2)

Const ant

St ep1

a


95. 0% C. I . f or EXP( B)

Var iable( s) ent er ed on st ep 1: SM O KE, CHO L, WEI G HT1, RACE.a.

Interpretasi model

Merokok memiliki hubungan dengan Penyakit Jantung Koroner setelah

dikontrol oleh Ras, Berat Badan dan Kadar Kholesterol. Dimana risiko untuk

menderita Penyakit jantung koroner pada orang yang merokok adalah 2 kali

dibanding orang yang tidak merokok setelah dikontrol variabel ras, berat badan

dan kadar kolesterol. 95% CI OR adalah (1.13-5.062)

35

DAFTAR PUSTAKA

Bland M, 1996An Introduction to Medical Statistics. Second edition. Oxford University Press. USA

Hosmer D, Lemeshow, 2000Applied Logistic Regression . second edition. Jhon Willey & son, inc. USA

Kleinbaum D, 1996Statistic in the health science. Logistic Regression A Self-learning text. Springer-Verlag , New York

Kleinbaum D, Kupper L, Morgenstern H, 1996Epidemiologic Research. Principles and Quantitative Methods. Van Nostrand Reinhold Company. New York

Pagano M, Gauvreu K, 1997Principles of Biostatistic Duxburry Press, California.

Riono P, 1992

Aplikasi regresi Logistik. Fakultas Kesehatan Masyarakat Universitas Indonesia

36

regresi logistik modul

Documents

1x1 2x2 kxk dimana x1

konsep ambang batas

z meningkat secara cepat

nilai z cukup besar

jadi bentuk kurva logistik

bentuk penjumlahan linier

satu batas ambang

digunakan secara luas