pemodelan biological oxygen demand (bod ...repository.unair.ac.id/55936/2/kkc kk st.s 55 -16 per...

101
PEMODELAN BIOLOGICAL OXYGEN DEMAND (BOD) DAN CHEMICAL OXYGEN DEMAND (COD) DENGAN PENDEKATAN REGRESI NONPARAMETRIK BIRESPON PADA DATA LONGITUDINAL BERDASARKAN ESTIMATOR SPLINE TRUNCATED (STUDI KASUS: SUNGAI BRANTAS DI SEKITAR LOKASI INDUSTRI) SKRIPSI WINDHU MANJA PERMATA PROGRAM STUDI S1 STATISTIKA DEPARTEMEN MATEMATIKA FAKULTAS SAINS DAN TEKNOLOGI UNIVERSITAS AIRLANGGA 2016 ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P

Upload: others

Post on 14-Nov-2020

3 views

Category:

Documents


0 download

TRANSCRIPT

PEMODELAN BIOLOGICAL OXYGEN DEMAND (BOD) DAN CHEMICAL

OXYGEN DEMAND (COD) DENGAN PENDEKATAN REGRESI

NONPARAMETRIK BIRESPON PADA DATA LONGITUDINAL

BERDASARKAN ESTIMATOR SPLINE TRUNCATED

(STUDI KASUS: SUNGAI BRANTAS DI SEKITAR LOKASI INDUSTRI)

SKRIPSI

WINDHU MANJA PERMATA

PROGRAM STUDI S1 STATISTIKA

DEPARTEMEN MATEMATIKA

FAKULTAS SAINS DAN TEKNOLOGI

UNIVERSITAS AIRLANGGA

2016

ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA

SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P

Scanned by CamScanner

ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA

SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P

Scanned by CamScanner

ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA

SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P

iv

PEDOMAN PENGGUNAAN SKRIPSI

Skripsi ini tidak dipublikasikan, namun tersedia diperpustakaan dalam

lingkup Universitas Airlangga, diperkenankan untuk dipakai sebagai referensi

kepustakaan, tetapi pengutipan harus seijin penulis dan harus menyebutkan

sumbernya sesuai kebiasaan ilmiah. Dokumen skripsi ini merupakan hak milik

Universitas Airlangga.

ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA

SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P

Scanned by CamScanner

ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA

SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P

vi

KATA PENGANTAR

Alhamdulillah puji syukur kehadirat Allah SWT atas berkat, rahmat, dan

hidayah yang telah diberikan sehingga penulis dapat menyelesaikan skripsi yang

berjudul “Pemodelan Biomedical Oxygen Demand (BOD) dan Chemical Oxygen

Demand (COD) dengan Pendekatan Regresi Nonparametrik Birespon pada Data

Longitudinal Berdasarkan Estimator Spline Truncated (Studi Kasus: Sungai

Brantas di Sekitar Lokasi Industri)”.

Dalam kesempatan ini penulis menyampaikan penghargaan dan ucapan

terima kasih kepada sebesar-besarnya kepada :

1. Kedua Orang Tua tercinta, Bapak Suhadi dan Ibu Dewi Aliah, adik tersayang,

Bhaldha Arija Ghoza serta keluarga besar penulis yang tak henti-hentinya

mendoakan dan telah memberikan semangat, kasih sayang, kepercayaan, dan

pengorbanan yang tiada terkira besarnya.

2. Ibu Dr. Nur Chamidah, M.Si selaku dosen pembimbing I dan Bapak Dr. Ardi

Kurniawan, M. Si selaku dosen pembimbing II yang telah memberikan

bimbingan dan arahan kepada penulis dari awal kuliah hingga menyelesaikan

proposal skripsi ini.

3. Bapak Drs. Sediono, M.Si selaku Dosen Wali selama menjadi mahasiswa

Statistika Universitas Airlangga yang telah memberikan bimbingan dan arahan,

serta segenap Dosen Statistika yang telah memberikan ilmu pengetahuan

selama perkuliahan.

4. Keluarga besar “Statistika Unair”, “Statistika Unair 2012”, “HIMATIKA

2014”, “HIMASTA UNAIR” dan keluarga “BPH HIMATIKA 2014” untuk

pengalaman dan pembelajaran selama masa kuliah.

5. Teman-teman seperjuangan semester 8, atas bantuan, dukungan, serta

kekompakan selama berjuang mengerjakan skripsi dan menyelesaikan kuliah.

6. Putri, Ria, Inesia, Intan, dan Mifta yang telah membantu penulis dalam

menyelesaikan skripsi.

7. Keluarga “Kost Ceria”, Novita, Nuke, Umro, dan Aiffa, yang selalu

mengingatkan, mendengarkan keluh kesah, dan memberi dukungan.

ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA

SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P

vii

8. “Dewan Komodo”, Dian, Lussi, Muiz, Muhindro, Adit, Ali, Mahenda, Arief,

Iswah, Alfin, Edo, dan Firman” yang telah menjadi keluarga dan mengajarkan

banyak hal.

Penulis menyadari bahwa skripsi ini masih memiliki banyak kekurangan,

oleh karena itu diharapkan kritik dan saran yang membangun dari semua pihak.

Surabaya, Agustus 2016

Windhu Manja Permata

ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA

SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P

Windhu Manja Permata, 2016. Pemodelan Biological Oxygen Demand (BOD) dan Chemical Oxygen Demand (COD) dengan Pendekatan Regresi Nonparametrik Birespon pada Data Longitudinal Berdasarkan Estimator Spline Truncated (Studi Kasus: Sungai Brantas di Sekitar Lokasi Industri). Skripsi ini dibawah bimbingan Dr. Nur Chamidah, M.Si. dan Dr. Ardi Kurniawan M. Si, Departemen Matematika, Fakultas Sains dan Teknologi, Universitas Airlangga, Surabaya.

ABSTRAK

Wilayah Sungai (WS) Brantas yang berada di provinsi Jawa Timur ditetapkan sebagai salah satu sungai strategis nasional dan merupakan sungai yang mempunyai manfaat salah satunya untuk pembuangan limbah industri. Sebagian besar limbah industri masih belum melalui proses pengolahan ketika dibuang ke sungai. Tujuan penelitian ini adalah untuk memodelkan kandungan Biological Oxygen Demand (BOD) dan Chemical Oxygen Demand (COD) sebagai parameter pencemaran air oleh limbah industri di 18 titik pengamatan WS Brantas di sekitar lokasi industri yaitu Dinas Pemotongan Hewan Malang, PT. Pindad, PT. Eka Mas Fortuna, Peternakan Babi Sempulur, Peternakan Babi Delta, CV. Sartimbul, Peternakan Babi Hanjoyo, PT. Setia Kawan, PT. Surya Zig Zag, PT. Surya Pamenang, UD. Sumberejo, PT. Jaya Kertas, PT. Cheil Jedang, PT. Ajinomoto Indonesia, PT. Darmala, PT. Pakerin, PT. Sateliti Sriti, PT. Tjiwi Kimia. Penelitian ini menggunakan pendekatan regresi nonparametrik birespon pada data longitudinal berdasarkan estimator spline truncated dengan menggunakan satu prediktor, yaitu Total Suspended Solid (TSS). Hasil penelitian dengan menggunakan kriteria Generalized Cross Validation (GCV) yaitu dengan memilih nilai GCV yang minimum diperoleh nilai nilai GCV minimum adalah 0,1929118 sehingga parameter smoothing optimum yaitu orde respon 1 adalah 1, dan orde respon 2 adalah 2, dengan 5 titik knot optimum, yaitu 0,01135; 0,022433; 0,04995; 0,1096; 0,26. Kesimpulan dari hasil estimasi adalah nilai BOD dan COD terendah adalah titik pengamatan di sekitar lokasi PT Pindad dengan nilai TSS pada titik pengamatan di WS Brantas di sekitar lokasi PT Pindad terletak pada interval 0,01135x < , sedangkan nilai BOD dan COD BOD tertinggi adalah pada titik pengamatan di sekitar lokasi Peternakan Babi Hanjoyo dan UD. Sumberejo dengan nilai TSS pada titik pengamatan di WS Brantas di sekitar lokasi Peternakan Babi Hanjoyo dan UD. Sumberejo terletak pada interval

0, 26x ≥ .

Kata Kunci : BOD, COD, TSS, Sungai Brantas, Limbah Industri, Regresi Nonparametrik, Birespon, Data Longitudinal, Spline Truncated

ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA

SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P

Windhu Manja Permata, 2016. Modeling of Biological Oxygen Demand (BOD) and Chemical Oxygen Demand (COD) with Biresponse Nonparametric Regression Approach in Longitudinal Data based of Spline Truncated Estimator (Case Study: Brantas River Around the Industry Location). This Skripsi is under advised by Dr. Nur Chamidah, M.Si. and Dr. Ardi Kurniawan, M.Si., Mathematics Departemen, Faculty of Science and Technology, Airlangga University, Surabaya.

ABSTRACT

Wilayah Sungai (WS) Brantas in the province of East Java established as one of the national strategic which has the advantage of one of them for the disposal of industrial waste. Most industrial waste have not through the treatment process when thrown into the river. The purpose of this study is to estimation model of Biological Oxygen Demand (BOD) and Chemical Oxygen Demand (COD) as a parameter of water pollution by industrial waste in the 18 observation points around the location of industry of WS Brantas, there are, Dinas Pemotongan Hewan Malang, PT. Pindad, PT. Eka Mas Fortuna, Peternakan Babi Sempulur, Peternakan Babi Delta, CV. Sartimbul, Peternakan Babi Hanjoyo, PT. Setia Kawan, PT. Surya Zig Zag, PT. Surya Pamenang, UD. Sumberejo, PT. Jaya Kertas, PT. Cheil Jedang, PT. Ajinomoto Indonesia, PT. Darmala, PT. Pakerin, PT. Sateliti Sriti, and PT. Tjiwi Kimia. This study uses biresponse nonparametric regression model estimation on longitudinal data based on spline truncated by using one predictor, namely Total Suspended Solid (TSS). The results is using criteria of Generalized Cross Validation (GCV) by selecting the minimum value of GCV. The minimum value of GCV is 0.1929118 so that, the optimum smoothing parameter for response 1 is in orde 1 , and for response 2 is in orde 2, with 5 knots optimum point , there are, 0.01135; 0.022433; 0.04995; 0.1096; 0.26. The conclusion of the estimation is the lowest value of BOD and COD is at observation points that around the location of PT Pindad with TSS value is at the interval 0,01135x < , while the highest value of BOD and COD is at observation points that around the site of Peternakan Babi Hanjoyo and UD. Sumberejo with TSS values is at intervals 0,26x ≥ .

Keyword : BOD, COD, TSS, Brantas River, Industrial Waste, Nonparametric Regression, Biresponse, Longitudinal Data, Spline Truncated

ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA

SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P

DAFTAR ISI

LEMBAR JUDUL ........................................................................................... i

LEMBAR PERNYATAAN ............................................................................. ii

LEMBAR PENGESAHAN ............................................................................. iii

PEDOMAN PENGGUNAAN SKRIPSI ......................................................... iv

LEMBAR ORISINALITAS ............................................................................ v

KATA PENGANTAR ..................................................................................... vi

ABSTRAK ....................................................................................................... viii

ABSTRACT ..................................................................................................... ix

DAFTAR ISI .................................................................................................... x

DAFTAR TABEL ............................................................................................ xiii

DAFTAR GAMBAR ....................................................................................... xiv

DAFTAR LAMPIRAN .................................................................................... xv

BAB I PENDAHULUAN

1.1 Latar Belakang ..................................................................................... 1

1.2 Rumusan Masalah ................................................................................ 6

1.3 Tujuan ................................................................................................... 7

ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA

SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P

1.4 Manfaat ................................................................................................. 7

1.5 Batasan Masalah ................................................................................... 8

BAB II TINJAUAN PUSTAKA

2.1 Sungai Brantas ..................................................................................... 9

2.2 Baku Mutu Air Limbah dan Daya Tampung Beban Pencemaran........ 10

2.3 Air Limbah Industri.............................................................................. 10

2.4 BOD dan COD ..................................................................................... 11

2.5 Total Suspended Solid (TSS) ............................................................... 12

2.6 Matriks ................................................................................................. 13

2.7 Regresi Nonparametrik ........................................................................ 17

2.8 Kuantil .................................................................................................. 18

2.9 Estimator Spline Truncated .................................................................. 19

2.10 Data Longitudinal................................................................................. 23

2.11 Homoskedastisitas dan Heterokedastisitas ........................................... 24

2.12 Uji Box’s M ......................................................................................... 25

2.13 Uji Korelasi Pearson ............................................................................ 27

2.14 Regresi Nonparametrik Birespon Spline Truncated ............................ 28

2.15 Weighted Least Square ......................................................................... 29

2.16 Regresi Nonparametrik Birespon pada Data Longitudinal Berdasarkan

Estimator Spline Truncated .................................................................. 30

2.17 Open Source Software (OSS)-R ........................................................... 32

ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA

SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P

BAB III METODE PENELITIAN

3.1 Data dan Sumber Data ......................................................................... 35

3.2 Variabel Penelitian ............................................................................... 36

3.3 Langkah Analisis .................................................................................. 37

BAB IV HASIL DAN PEMBAHASAN

4.1 Estimasi Model BOD dan COD dengan Pendekatan Regresi

Nonparametrik Birespon pada Data Longitudinal Berdasarkan

Estimator Spline Truncated .................................................................. 43

4.2 Menganalisis dan Menginterpretasi Hasil Estimasi Model BOD dan

COD dengan Pendekatan Regresi Nonparametrik Birespon pada

Data Longitudinal Berdasarkan Estimator Spline Truncated............... 47

BAB V PENUTUP

5.1 Kesimpulan .......................................................................................... 55

5.2 Saran ..................................................................................................... 56

DAFTAR PUSTAKA ...................................................................................... 57

LAMPIRAN ..................................................................................................... 58

ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA

SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P

DAFTAR TABEL

Nomor Judul Tabel Halaman

3.1 Daftar Industri Titik Pengambilan Sampel Limbah ......................................28

3.2 Variabel-Variabel Penelitian .........................................................................29

4.1 Pemilihan Orde Optimum Berdasarkan Jumlah Knot Optimum pada Data

BOD dan COD (Tanpa Pembobot) ................................................................37

4.2 Pemilihan Orde Optimum Berdasarkan Jumlah Knot Optimum pada Data

BOD dan COD (Dengan Pembobot) ..............................................................38

4.3 Model BOD dan COD Untuk Setiap Titik Pengamatan di WS Brantas di

Sekitar Lokasi Industri ...................................................................................41

ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA

SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P

DAFTAR GAMBAR

Nomor Judul Gambar Halaman

4.1 Plot Data Pengamatan BOD terhadap TSS ..................................................... 35

4.2 Plot Data Pengamatan COD terhadap TSS ..................................................... 36

4.3 Plot Observasi dan Estimasi Data BOD terhadap TSS ................................... 43

4.4 Plot Observasi dan Estimasi Data COD terhadap TSS ................................... 44

4.5 Plot Hasil Estimasi BOD dan COD terhadap TSS .......................................... 44

ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA

SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P

DAFTAR LAMPIRAN

Nomor Judul

1 Data BOD, COD, dan TSS 18 Titik WS Brantas di Sekitar Lokasi

Industri

2 Program Estimasi Model BOD dan COD dengan Pendekatan Regresi

Nonparametrik Birespon pada Data Longitudinal Berdasarkan

Estimator Spline Truncated Menggunakan Aplikasi OSS-R

3 Output Program Estimasi Model BOD dan COD dengan Pendekatan

Regresi Nonparametrik Birespon pada Data Longitudinal Berdasarkan

Estimator Spline Truncated Menggunakan Aplikasi OSS-R

ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA

SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P

BAB I

PENDAHULUAN

1.1 Latar Belakang

Sungai merupakan sumber air permukaan yang memberikan manfaat kepada

kehidupan manusia (Sukadi, 1999). Perum Jasa Tirta 1 (PJT 1) dalam “Laporan

Pemantauan Kualitas Air di Wilayah Sungai Brantas dan Wilayah Sungai

Bengawan Solo Tahun 2014” menyatakan Wilayah Sungai (WS) Brantas yang

berada di provinsi Jawa Timur ditetapkan sebagai salah satu sungai strategis

nasional dan merupakan sungai yang mempunyai manfaat untuk kebutuhan

sebagai air baku air bersih, untuk proses produksi, PLTA, pertanian, perikanan

sekaligus sebagai sungai untuk pembuangan limbah industri, pertanian, perikanan

dan domestik.

Hasil penelitian dari Krisnawati dkk (2015) yang berjudul “Perancangan

Moolief Biorefactor Untuk Remediasi Air Sungai Brantas Kediri Tercemar

Limbah Domestik dan Industri” disebutkan di WS Brantas terdapat 483 industri

yang berpotensi membuang limbahnya yang berpengaruh langsung pada kualitas

air sungai. Diketahui bahwa hulu hingga hilir kali Brantas telah terdeteksi

konsentrasi senyawa estradiol 42-220 ng/L. Kondisi tersebut membahayakan

karena dapat memacu terjadinya feminisasi ikan yang berujung kepunahan.

Setiap aliran air permukaan seperti sungai memiliki kemampuan self

purification yaitu kemampuan penjernihan kembali secara alamiah dalam kurun

waktu yang berbeda tergantung pada beban pencemarnya. Pada badan-badan air

yang mengalami pencemaran dapat dilihat melalui beberapa indikator secara fisik,

ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA

SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P

kimia, maupun biologis (Ramadhani, 2016). Berdasarkan kemampuan sungai

tersebut, maka seharusnya beban limbah yang dibuang oleh industri mengikuti

kondisi sungai tempat limbah tersebut dibuang, dengan kata lain setiap industri

memiliki ambang batas beban limbah yang berbeda, tergantung letak pembuangan

limbahnya di sungai.

Sebagian besar limbah industri masih belum melalui proses pengolahan

ketika dibuang ke sungai. Kondisi ini sangat memprihatinkan, mengingat banyak

sekali kegunaan sungai yang menjadi tempat pembuangan tersebut . Laporan PJT

1 (2014) menyebutkan bahwa status mutu air di WS Brantas cenderung tercemar

berat, hanya 25,5% yang tercemar sedang dan sekitar 52,38% air buangan limbah

industri belum memenuhi baku mutu. Untuk itu perlu adanya penelitian baku

mutu air sungai sebagai tempat pembuangan limbah industri untuk mengetahui

beban limbah yang terdapat di dalam wilayah sungai Brantas supaya mencegah

limbah industri yang overload dan menjaga kemampuan self purification sungai

tersebut.

Biological Oxygen Demand (BOD) dan Chemical Oxygen Demand (COD)

adalah parameter yang umumnya dipakai untuk mengenal adanya pencemaran

dalam air. BOD adalah banyaknya oksigen yang dibutuhkan oleh bakteri untuk

menguraikan bahan pencemar dalam kondisi baku, sedangkan COD

mencerminkan kebutuhan bahan kimia yang dibutuhkan unuk mengoksidasi

bahan pencemar yang ada dalam air. Oleh karena itu nilai BOD dan COD yang

tinggi menunjukkan air tercemar yang berat (Herlambang, 2006). BOD dan COD

sama-sama menunjukkan kebutuhan jumlah oksigen yang digunakan untuk

ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA

SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P

mengoksidasi zat-zat polutan di dalam air. BOD dan COD juga dapat

menggambarkan bahan organik yang terdapat dalam air (PJT1, 2014). BOD

menggambarkan banyaknya oksigen yang dibutuhkan oleh mikroorganisme untuk

mengoksidasi bahan organik karbon yang terkandung di dalam air secara

sempurna dengan menggunakan ukuran proses biokimia yang terjadi di dalam air

limbah pada periode 5 hari dan pada suhu 20oC, sedangkan COD ditentukan

dengan menggunakan oksidator kuat kalium bikromat, asam sulfat pekat, dan

perak sebagai katalis. Lamanya waktu yang dibutuhkan untuk menentukan BOD

dan penggunaan bahan-bahan berbahaya dan beracun dalam analisis COD,

sehingga diperlukan metode alternatif lain yang lebih mudah dan ramah

lingkungan untuk menetukan BOD dan COD dalam air (Simata, 2011).

Nilai BOD dipengaruhi oleh jumlah Total Suspended Solid (TSS) dan juga

zat organik yang ada dalam air. Nilai COD adalah total keseluruhan dari pengotor

TSS, zat organik, mineral bervalensi rendah, ditambah dengan zat kimia yang

memakan oksigen (Nurbana, 2015). Ramadhani (2016) menggunakan parameter

BOD, COD, dan TSS untuk menganalisis pencemaran air sungai Bengawan Solo

akibat limbah industri di kecamatan Kebakkramat kabupaten Karanganyar.

Krisnawati, dkk (2015) menggunakan parameter BOD dan COD untuk

mengetahui kualitas air sungai Brantas di wilayah Kediri tercemar limbah

domestik dan industri.

Berdasarkan peraturan gubernur Jawa Timur Nomor 72 Tahun 2013 tentang

Baku Mutu Air Limbah Bagi Industri dan / Kegiatan Usaha Lainnya, parameter

yang dianalisa diantaranya adalah, Biological Oxygen Demand (BOD), Chemical

ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA

SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P

Oxygen Demand (COD), Total Suspended Solid (TSS) dan disesuaikan dengan

kegiatan usahanya. Parameter TSS digunakan sebagai parameter air limbah dan

sebagai parameter pencemaran karena perannya sebagai penduga bahan organik

dan kaitannya dengan penurunan kandungan oksigen terlarut perairan. TSS

ditentukan dengan menghitung jumlah berat lumpur kering dalam mg/l yang telah

mengalami penyaringan dengan membran berukuran 0,45 mikron dan dipanaskan

dalam oven dengan suhu 105oC selama 1 jam. Oleh karena itu, disimpulkan

adanya korelasi yang erat antara BOD dan COD, dan dalam baku mutu air limbah

penentuan parameter BOD dan COD dapat didekati dengan parameter TSS

(Nurbana, 2015).

Pendekatan parametrik mengasumsikan bahwa pola kecenderungan data

pada kurva regresi mengacu pada suatu bentuk fungsi tertentu, seperti linier,

kuadrat, kubik, dan sebagainya (Budiantara, 2012), apabila data tidak memenuhi

asumsi tersebut maka pemodelan data harus diselesaikan dengan pendekatan

nonparametrik..

Sari (2016) menyatakan bahwa kurva regresi pada pendekatan

nonparametrik hanya diasumsikan mulus atau smooth, sehingga pendekatan

nonparametrik memiliki fleksibilitas yang tinggi karena data diharapkan mencari

sendiri bentuk estimasi kurva regresinya tanpa dipengaruhi oleh faktor

subyektifitas peneliti. Pemaparan sebelumnya telah menjelaskan bahwa TSS

merupakan parameter yang mempengaruhi BOD dan COD, terdapat korelasi

yang kuat diantara BOD dan COD, sehingga untuk mengatasi masalah tersebut

ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA

SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P

digunakan regresi nonparametrik birespon dengan BOD dan COD sebagai respon

dan TSS sebagai prediktor.

Berdasarkan waktu pengumpulannya data dibedakan menjadi tiga, yaitu

data cross sectional, longitudinal, dan time series. Pemantauan kualitas air

dilakukan terus menerus sehingga data yang terkumpul dapat menggambarkan

keadaan sesungguhnya dari keadaan lingkungan yang dipantau (PJT1, 2014).

Dalam kasus ini, BOD, COD, dan TSS merupakan data yang diperoleh dari

pengamatan dalam periode waktu yang berbeda beserta variabel yang

mempengaruhinya, sehingga untuk menjelaskan dinamika perubahan kondisi agar

informasi yang diperoleh lebih lengkap, data yang digunakan pada skripsi ini

adalah data longitudinal.

Salah satu pendekatan untuk mengestimasi fungsi dalam regresi

nonparametrik adalah spline truncated. Spline truncated merupakan model

polinomial tersegmen yang memberikan fleksibilitas yang lebih baik daripada

polinomial biasa. Sifat tersegmen inilah yang memungkinkan model regresi spline

truncated menyesuaikan diri secara efektif terhadap karakteristik lokal data.

Penelitian tentang regresi nonparamretrik birespon pada data longitudinal sudah

pernah dilakukan oleh Sari (2016) dengan menggunakan Weighted Spline

Truncated. Dalam skripsi ini, peneliti menggunakan Weighted Spline Truncated

sebagai estimator untuk diterapkan pada data longitudinal BOD, COD, dan TSS.

Estimasi kurva regresi nonparametrik spline truncated dapat dilakukan dengan

memilih parameter smoothing, yaitu orde, banyaknya titik knot, dan titik knot

(Sari, 2016). Pemilihan parameter smoothing yang optimal dilakukan peneliti

ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA

SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P

dengan menggunakan kriteria Generalized Cross Validation (GCV) yaitu dengan

memilih nilai GCV yang minimum.

Berdasarkan pemaparan di atas, peneliti ingin membahas pencemaran

sungai Brantas yang berada di sekitar lokasi industri dengan pendekatan regresi

nonparametrik birespon dengan menggunakan data longitudinal berdasarkan

estimator spline truncated dengan BOD dan COD sebagai respon dan TSS

sebagai prediktor. Penelitian dalam skripsi ini tidak dapat dilakukan secara

manual, untuk itu dibutuhkan bantuan aplikasi dalam penyelesaiannya. Salah satu

aplikasi yang dapat digunakan untuk membantu penyelesaian penilitian ini adalah

aplikasi Open Source Software (OSS) R.

1.2 Rumusan Masalah

Berdasarkan latar belakang yang telah diuraikan, dapat dirumuskan masalah

sebagai berikut:

1. Bagaimana mengestimasi model BOD dan COD sebagai parameter

kualitas air sungai Brantas di sekitar lokasi industri dengan pendekatan

regresi nonparametrik birespon pada data longitudinal berdasarkan

estimator spline truncated menggunakan program pada aplikasi OSS-R?

2. Bagaimana menganalisis dan menginterpretasi hasil estimasi model BOD

dan COD sebagai parameter kualitas air sungai Brantas di sekitar lokasi

industri dengan pendekatan regresi nonparametrik birespon pada data

longitudinal berdasarkan estimator spline truncated?

ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA

SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P

1.3 Tujuan

Tujuan yang ingin dicapai dalam skripsi ini diantaranya:

1. Mengestimasi model BOD dan COD sebagai parameter kualitas air

sungai Brantas di sekitar lokasi industri dengan pendekatan regresi

nonparametrik birespon pada data longitudinal berdasarkan estimator

spline truncated menggunakan program pada aplikasi OSS-R

2. Menganalisis dan menginterpretasi hasil estimasi model BOD dan COD

sebagai parameter kualitas air sungai Brantas di sekitar lokasi industri

dengan pendekatan regresi nonparametrik birespon pada data

longitudinal berdasarkan estimator spline truncated.

1.4 Manfaat

Skripsi ini diharapkan dapat memberikan manfaat sebagai berikut:

1. Menambah wawasan tentang estimasi model regresi nonparametrik

birespon pada data longitudinal berdasarkan estimator spline truncated.

2. Mengetahui estimasi BOD dan COD sebagai parameter kualitas air

sungai Brantas di sekitar lokasi industri untuk dapat digunakan sebagai

acuan dalam pembuangan limbah industri di sungai Brantas

3. Memberikan masukan kepada pemerintah, khususnya PJT 1 dalam

mengukur BOD dan COD dengan cara yang lebih mudah agar nantinya

dapat menindaklanjuti peraturan pembuangan limbah industri di WS

Brantas.

ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA

SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P

1.5 Batasan Masalah

Agar pembahasan tidak melebar, maka masalah perlu dibatasi sebagai

berikut:

1. Ruang lingkup pembahasan model regresi nonparametrik birespon pada

data longitudinal BOD dan COD dalam skripsi ini hanya dibatasi satu

variabel prediktor, yaitu TSS.

2. Data pengamatan diambil dari 18 titik WS Brantas yang berada di sekitar

lokasi industri.

Penelitian dalam skripsi ini menggunakan estimator spline truncated dan dalam

penentuan parameter smoothing optimal digunakan kriteria GCV.

ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA

SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P

BAB II

TINJAUAN PUSTAKA

Pada bab ini akan dibahas mengenai beberapa tinjauan pustaka yang akan

digunakan untuk pembahasan pada bab-bab berikutnya.

2.1 Sungai Brantas

Wilayah Sungai (WS) Brantas merupakan WS terbesar kedua di pulau Jawa,

terletak di propinsi Jawa Timur. Sungai Brantas mempunyai panjang ± 320 km

dan memiliki luas wilayah sungai ± 14.103 km2 yang mencakup ± 25% luas

propinsi Jawa Timur atau ± 9% luas pulau Jawa. WS Brantas terdiri dari empat

Daerah Aliran Sungai (DAS) yaitu DAS Brantas, DAS Tengah, DAS Ringin

Bandulan, dan DAS Kondang Merak. WS Brantas berhulu di sumber Brantas kota

Batu, mengalir melewati wilayah Malang, Blitar, Tulungagung, Kediri, Nganjuk,

Jombang, Mojokerto dan berhilir di Sidoarjo dan Surabaya dengan luas wilayah ±

1.188.575 Ha.

Sungai Brantas merupakan sungai strategis sebagai penyedia air baku untuk

berbagai kebutuhan seperti, sumber tenaga pada PLTA, PDAM, irigasi, proses

produksi industri, dan lain-lain. Peran sungai Brantas sangat vital dalam

menyangga kehidupan masyarakat Jawa Timur. Aktivitas yang ada saat ini di

sungai Brantas berupa kegiatan-kegiatan industri, penambangan bahan galian

golongan C, transportasi air, perikanan dan pertanian. Jenis kegiatan industri yang

berada di sekitar WS Brantas terdiri dari industri kertas, gula, minuman, tekstil,

makanan, peternakan, daging, susu, minyak goreng, sabun, baja, pelapisan logam,

dan industri kimia (PJT 1, 2015)

ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA

SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P

2.2 Baku Mutu Air Limbah dan Daya Tampung Beban Pencemaran

Air limbah adalah sisa dari suatu hasil usaha dan atau kegiatan yang

berwujud cair. Baku mutu air limbah adalah ukuran batas atau kadar unsur

pencemar dan atau jumlah unsur pencemar yang ditenggang keberadaannya dalam

air limbah yang akan dibuang atau dilepas ke dalam sumber air dari suatu usaha

dan atau kegiatan. Dalam menentukan baku mutu air limbah yang diizinkan,

didasarkan pada daya tampung beban pencemaran pada sumber air. Beban

pencemaran adalah jumlah suatu unsur pencemar yang terkandung dalam air atau

air limbah. Sedangkan daya tampung beban pencemaran adalah kemampuan air

pada suatu sumber air untuk menerima masukan beban pencemaran tanpa

mengakibatkan air tersebut menjadi cemar (Peraturan Pemerintah Republik

indonesia No.82, 2001).

2.3 Air Limbah Industri

Air limbah industri adalah air yang berasal dari rangkaian proses produksi

suatu industri dengan demikian maka air limbah tersebut dapat mengandung

komponen yang berasal dari proses produksi tersebut dan apabila dibuang ke

lingkungan tanpa pengelolaan yang benar tentunya akan dapat mengganggu badan

air penerima. Dampak pencemaran air limbah industri terhadap mutu badan air

penerima bervariasi tergantung kepada sifat dan jenis limbah, volume dan

frekuensi air limbah yang dibuang oleh masing-masing industri.

ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA

SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P

Salah satu jenis air limbah industri yang dapat menyebabkan terjadinya

pencemaran lingkungan adalah air limbah dengan kandungan organik tinggi.

Karakteristik air limbah organik tinggi ditunjukan dengan tingginya parameter

BOD dan COD dalam air limbah. Contoh industri dengan air limbah organik

tinggi adalah industri tapioka, tahu, gula, kecap, sitrat, asam glutamat, tekstil, bir,

alkohol dan lain-lain. Kandungan BOD yang tinggi dalam air limbah industri

dapat menyebabkan turunnya oksigen perairan, keadaan anaerob (tanpa oksigen),

sehingga dapat mematikan ikan dan menimbulkan bau busuk. Untuk kandungan

COD yang tinggi dalam air limbah pengaruhnya terhadap lingkungan tergantung

dari zat organiknya, kalau dapat diurai oleh mikroorganisme pengaruhnya seperti

BOD, tetapi untuk yang tidak dapat diurai oleh mikroorganisme pengaruhnya

tergantung dari jenis zat organik yang ada di dalam air (Moertinah, 2010).

2.4 Biological Oxygen Demand dan Chemical Oxygen Demand

Biological Oxygen Demand (BOD) dan Chemical Oxygen Demand (COD)

keduanya dapat dikatakan menggambarkan bahan organik (PJT 1, 2015). BOD

dan COD juga dapat dikatakan menggambarkan banyaknya oksigen yang

digunakan untuk mengoksidasi bahan organik di dalam air. BOD menggambarkan

banyaknya oksigen yang dibutuhkan oleh mikroorganisme untuk mengoksidasi

bahan organik karbon yang terkandung di dalam air secara sempurna dengan

menggunakan ukuran proses biokimia yang terjadi di dalam air limbah pada

periode tertentu biasanya 5 hari dan pada suhu tertentu biasanya 20oC. BOD tidak

menunjukkan jumlah bahan organik yang sebenarnya, tetapi hanya mengukur

ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA

SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P

secara relatif jumlah O2 yang digunakan untuk mengoksidasi bahan-bahan

buangan tersebut. Jika konsumsi mikroorganisme terhadap O2 tinggi yang

ditunjukkan dengan semakin kecilnya O2 terlarut, maka kandungan bahan-bahan

buangan di dalam air tersebut tinggi.

COD atau kebutuhan oksigen kimia adalah jumlah oksigen yang dibutuhkan

untuk mengoksidasi zat-zat organik yang ada dalam air oleh senyawa-senyawa

oksidator kuat kalium bikromat, asam sulfat pekat, (K2Cr2O7) dan perak sebagai

katalis. Nilai COD menunjukkan kebutuhan oksigen yang diperlukan untuk

menguraikan kandungan bahan organik dalam air secara kimiawi, khususnya bagi

senyawa organik yang tidak dapat diuraikan oleh proses biologis (Jatmiko, 2007).

2.5 Total Suspended Solid (TSS)

Nilai kekeruhan dan kecerahan dipengaruhi oleh padatan atau residu yang

tersuspensi (PJT1, 2015). TSS ditentukan dengan menghitung jumlah berat

lumpur kering dalam mg/l yang telah mengalami penyaringan dengan membran

berukuran 0,45 mikron dan dipanaskan dalam oven dengan suhu 105oC selama 1

jam. Penentuan zat padat tersuspensi (TSS) berguna untuk mengetahui kekuatan

pencemaran air limbah dan juga berguna untuk penentuan efisiensi unit

pengolahan air (Rachmawati dkk, 2005).

ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA

SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P

2.6 Matriks

Menurut Ruppert, et.al (2003) matriks adalah himpunan bilangan real yang

disusun secara persegi panjang, mempunyai m baris dan n kolom dengan bentuk

umum:

11 12 1

21 22 2

1 2

n

n

m m mn

c c cc c c

C

c c c

=

Tiap ijc yang berada didalam matriks C disebut elemen. Indeks i dan j masing –

masing menyatakan baris dan kolom tempat beradanya sebuah elemen dari

matriks C. Beberapa operasi pada matriks adalah sebagai berikut:

a. Penjumlahan

Jika dua matriks mempunyai ukuran yang sama, maka dapat dikatakan

konformal untuk penjumlahan. Hasil penjumlahan diperoleh dengan

menambahkan elemen yang sesuai. Oleh karena itu, jika A adalah matriks

berukuran n p× dan B adalah matriks berukuran n p× , kemudian C=A+B juga

adalah matriks berukuran n p× dan diperoleh ( ) ( )ij ij ijc a b= = +C . Hal ini juga

berlaku untuk perhitungan pengurangan antara dua konformal antara matriks A

dan B. jika A dan B adalah matriks berukuran n p× , maka dua sifat dari

penjumlahan matriks diberikan dalam teorema berikut:

(i) A+B=B+A

(ii) ( )T T T+ = +A B B A

ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA

SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P

b. Perkalian

Misalkan A adalah matrik berukuran m n× dan B adalah matriks berukuran

n p× . Hasil perkalian AB adalah matriks C berukuran m p× dengan

1

n

ij ir rjr

c=

=∑A B . Perkalian dua buah matriks A dan B dapat terjadi jika dan hanya

jika banyaknya kolom dari mayriks A sama dengan banyaknya baris dari matriks

B.

c. Transpose

Jika A adalah matriks berukuran m n× maka transpose dari notasi A

dinotasikan dengan TA didefinisikan sebagai matriks berukuran n m× yang

merupakan hasil pertukaran baris dan kolom matriks A salah satu sifat transpose

yang digunakan adalah ( )T T T=AB B A dengan syarat matriks A dan B masing –

masing merupakan matriks yang memenuhi sifat perkalian.

d. Invers

Misalkan A adalah matriks berukuran n n× (A adalah matriks persegi).

Sebuah matriks B berukuran n n× sedemikian hingga BA= I disebut invers kiri

dari A dan sebuah matriks B berukuran n n× sedemikian hingga AB= I disebut

invers kanan dari A dengan I merupakan matriks identitas. Jika AB=BA=I maka

matriks B disebut invers kanan dan invers kiri dari matriks A dan matriks A

dikatakan invertibel. Jika matriks A dan B masing – masing merupakan matriks

yang invertibel dan AB terdefinisi maka ( ) 1 1 1− − −=AB B A . Jika A adalah matriks

simetri dan nonsingular dan dipartisi menjadi 11 12

21 22

=

A AA

A Adan jika

ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA

SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P

122 21 11 12

−= −B A A A A , sedemikian hingga maka 111−A dan 1−B ada, sehingga

invers dari A adalah:

1 1 1 1 1 11 11 11 12 21 11 11 12

1 1 121 11

− − − − − −−

− − −

+ −=

A A A B A A A A BA

B A A B

e. Trace

Trace ( )ija=A berukuran n n× adalah fungsi matriks yang didefinisikan

sebagai jumlah dari elemen – elemen diagonal dari A, yaitu tr(A)=1

n

iii

a=∑ .

f. Matriks Partisi

Partisi dari matriks A menjadi empat submatriks (persegi atau persegi

panjang) dapat diindikasikan secara simbolis sebagai berikut:

11 12

21 22

=

A AA

A A

Jika dua matrik A dan B adalah konformal untuk perkalian, dan jika A dan B

dipartisi sehingga submatrik konformal, maka perkalian AB dapat dinyatakan

sebagai berikut.

11 12 11 12 11 11 12 21 11 12 12 22

21 22 21 22 21 11 22 21 21 12 22 22

+ + = = + +

A A B B A B A B A B A BAB

A A B B A B A B A B A B

Jika B diganti oleh vektor b yang dipartisi menjadi dua himpunan dari elemen –

elemen, jika A dipartisi menjadi dua himpunan dari kolom – kolom, maka

menjadi,

[ ] 11 2 1 1 2 2

2

,

= = +

bAb A A A b A b

b

ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA

SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P

g. Turunan Fungsi Vektor dan Matriks

Misalkan ( )v f x= merupakan fungsi dari variabel – variabel 1 2, , , px x x

dengan ( )1 2, , ,T

px x x x= , dan misalkan

1

2

p

vxv

v xx

vx

∂ ∂ ∂

∂ ∂= ∂ ∂ ∂

Misalkan T Tv = =c x x c , dengan 1 2( , , , )Tpc c c=c adalah vektor konstanta,

maka ( )( ) TTv

x x x∂∂ ∂

= = =∂ ∂ ∂

x cc x c , jika Tv = x Cx , dengan C adalah matriks simetri

dari suatu konstanta, 1

2

3

xxx

=

x dan 11 12 13

21 22 23

31 32 33

c c cc c cc c c

=

C maka

( )

( )

( )

( )

1

1

22

3

3

2 2

T

TT T

T

T

T

x

vx

x

∂ ∂ ∂∂ = = = = ∂ ∂ ∂ ∂

x Cx

c xx Cx x Cxc x Cx

x xc x

x Cx

h. Matriks Kovariansi

Varians 2 2 21 2, , , pσ σ σ dari 1 2, , , px x x dan kovariansi ijσ untuk semua

i j≠ merupakan elemen – elemen dari matriks kovariansi yang dinotasikan

dengan Σ yaitu:

ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA

SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P

11 12 1

21 22 2

1 2

cov( )

p

p

p p pp

x

σ σ σσ σ σ

σ σ σ

Σ = =

Baris ke- i dari Σ mengandung varians ix dan kovariansi ix dengan tiap variabel

x yang lain. Agar konsisten dengan notasi ijσ digunakan 2 , 1, 2, ,ii i i pσ σ= =

untuk varians. Varians terdapat pada diagonal Σ dan kovariansi berada pada

selain diagonal tersebut (Rencher & Schaaljee, 2008).

2.7 Regresi Nonparametrik

Regresi nonparametrik merupakan salah satu pendekatan dalam analisis

regresi yang digunakan apabila kurva regresinya tidak diasumsikan memiliki

bentuk tertentu. Dalam regresi nonparametrik, kurva regresi hanya diasumsikan

halus (smooth), sehingga pendekatan regresi nonparametrik memiliki fleksibilitas

yang tinggi karena data diharapkan mencari sendiri bentuk estimasi kurva regresi

tanpa dipengaruhi oleh faktor subyektivitas peneliti (Alfiani dkk, 2014).

Jika diberikan pasangan data ( , )i ix y dengan 1,2,...,i n= dan pola hubungan

antara variabel respon dengan variabel prediktor tidak diketahui bentuknya, maka

dapat digunakan pendekatan regresi nonparametrik. Secara umum, model regresi

nonparametrik adalah

( )i i iy f x ε= + , 1, 2,...,i n= (2.1)

dengan iy merupakan variabel respon, ( )if x adalah persamaan kurva regresi

yang tidak diasumsikan mengikuti bentuk tertentu dengan ix sebagai variabel

ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA

SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P

prediktor, sedangkan iε adalah error berdistribusi normal independen dengan

mean 0 dan variansi 2σ (Eubank, 1999). Terdapat beberapa teknik untuk

mengestimasi kurva regresi dalam regresi nonparametrik, diantaranya yaitu

regresi spline, kernel, deret fourier dan lain-lain.

2.8 Kuantil

Kuantil adalah nilai-nilai yang membagi suatu jajaran data menjadi bagian-

bagian yang sama. Menurut Walpole (1997), kuantil adalah nilai-nilai yang

dibawahnya terdapat sejumlah pecahan atau persentase tertentu dari seluruh

pengamatan. Beberapa kuantil yang sering dibahas diantaranya adalah persentil,

desil, dan kuartil.

a. Persentil

Nilai-nilai yang membagi segugus pengamatan menjadi 100 bagian yang

sama disebut persentil dan umumnya dinotasikan dengan 1 2 99, ,...,P P P . Notasi 1P

berarti bahwa 1% dari seluruh data terletak di bawah 1P , 2% terletak di bawah 2P

dan seterusnya sampai 99P yang menyatakan bahwa 99% terletak di bawah 99P .

b. Desil

Nilai-nilai yang membagi jajaran data menjadi 10 bagian yang sama

dinamakan desil. Nilai-nilai tersebut dinotasikan dengan 1 2 9, ,...,D D D yang

berarti bahwa 10% data terletak di bawah 1D , 20% terletak di bawah 2D , dan

seterusnya sampai 9D yang berarti bahwa 90% data terletak di bawah 9D .

ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA

SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P

c. Kuartil

Nilai-nilai yang membagi data menjadi 4 bagian yang sama disebut kuartil

dan dinotasikan dengan 1 2 3, ,Q Q Q . Notasi 1Q berarti bahwa 25% data terletak di

bawah 1Q , 50% data terletak di bawah 2Q , dan 75% data terletak di bawah 3Q .

Persentil ke-50, desil kelima, dan kuartil kedua dari suatu data disebut median.

Untuk menentukan kuantil data tak terkelompok, dapat digunakan prosedur

seperti dalam menentukan median. Sedangkan untuk data terkelompok, dapat

dengan rumus kuantil ke- i

( ),

Li

i Likuantil i

i n frK L c

f

− =

∑, dengan,

LiL = batas bawah nyata kelas dari kelas kuantil ke- i

n = banyaknya data (jumlah seluruh frekuensi)

r = konstanta (untuk kuartil 4r = , desil 10r = , persentil 100r = )

( )Lif∑ = jumlah frekuensi seluruh kelas yang lebih rendah daripada kelas

kuantil ke- i

,kuantil if = frekuensi kelas kuantil ke- i

c = lebar interval kelas kuantil (Harinaldi, 2005)

2.9 Estimator Spline Truncated

Salah satu pendekatan untuk mengestimasi fungsi ( )f x dalam regresi

nonparametrik adalah spline truncated. Spline truncated merupakan model

ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA

SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P

polinomial tersegmen yang memberikan fleksibilitas yang lebih baik daripada

polinomial biasa. Sifat tersegmen inilah yang memungkinkan model regresi spline

truncated menyesuaikan diri secara efektif terhadap karakteristik lokal dari data.

Secara umum, fungsi spline truncated berorde ( p ) dengan titik-titik knot

1 2, ,..., Mθ θ θ adalah sembarang fungsi yang dapat disajikan dalam bentuk sebagai

berikut:

0 1 1( ) ... ( )Mp p

p p m mmf x x x xβ β β β θ+ +=

= + + + + −∑ (2.2)

dengan ( ) pmx θ +− =

( ) ,0,

pm m

m

x xx

θ θθ

− ≥

< ; β adalah konstanta real (Eubank, 1999).

2.8.1 Estimasi Parameter Regresi Spline Truncated

Misalkan terdapat n pengamatan 1 , ni i ix y = yang memenuhi

persamaan (2.1) dengan ( )if x merupakan fungsi spline truncated yang

telah diuraikan pada persamaan (2.2). Dugaan fungsi kurva ( )f x dapat

diperoleh melalui estimasi koefisien

0 1 1 2( , ,..., , ,..., )Tp p p mβ β β β β β+ + +=

dengan 1 2( , ,..., )ny y y y=

dan

1 1 1 1 1

2 2 2 1 2

1

1 ( ) ( )1 ( ) ( )

1 ( ) ( )

p p pM

p p pM

p p pn n n n M

x x x xx x x x

X

x x x x

θ θθ θ

θ θ

+ +

+ +

+ +

− − − − =

− −

(2.3)

Nilai estimasi y

dapat diperoleh dengan menggunakan rumus sebagai

berikut: 1

ˆ ( )T Ty X X X X y A yλ− = =

(2.4)

dengan 1

( ) T TA X X X Xλ−

= ; λ merupakan parameter smoothing yaitu

ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA

SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P

orde ( )p , jumlah knot ( )M , dan titik knot ( 1 2, ,..., Mθ θ θ ), dapat dituliskan

dalam notasi 1 2( , , ( , ,..., ))Mp Mλ θ θ θ=

Apabila ingin mengestimasi kurva regresi nonparametrik dengan

pendekatan regresi spline truncated, maka secara teoritis dapat dilakukan

dengan mencari model spline terbaik berdasarkan orde dan titik knot

optimum yaitu banyaknya titik knot dan letak titik-titik knot (Sari, 2016).

2.8.2 Generalized Cross Validation (GCV)

Dalam analisis regresi nonparametrik dengan pendekatan spline

truncated perlu dilakukan pemilihan parameter smoothing optimum untuk

memperoleh pemodelan yang baik. Salah satu metode yang digunakan

sebagai kriteria untuk menentukan parameter smoothing optimum adalah

dengan menentukan nilai Generalized Cross Validation (GCV) yang

minimum. Menurut Wulandari dan Budiantara (2014) dalam Sari (2016),

secara teoritis kriteria GCV mempunyai sifat optimal asimtotik dan dapat

didefinisikan sebagai berikut:

( )2( )

1 ( )

MSEGCVtr I A

n

λλ

= −

(2.5)

dengan 1

( ) T TA X X X Xλ−

= , 21

1 ( )ni ii

MSE y yn =

= −∑ , I adalah matriks

identitas, dan n adalah jumlah pengamatan (Sari, 2016).

2.8.3 Pemilihan Titik Knot Optimal

Pemilihan jumlah dan titik knot optimal perlu dilakukan untuk

mengestimasi fungsi spline truncated. Jumlah knot ( )M merupakan

ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA

SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P

banyaknya titik knot atau banyaknya titik perubahan perilaku fungsi pada

interval yang berlainan. Ruppert (2002) dalam Sari (2016) menyatakan

bahwa titik knot terletak pada sampel kuantil dari nilai-nilai unique

(tunggal) variabel prediktor 1

ni i

x=

. Salah satu metode yang dapat

digunakan untuk menentukan jumlah dan lokasi titik knot optimal adalah

metode full-search. Algoritma dari metode full-search yang didasarkan pada

kriteria Generalized Cross Validation (GCV) adalah:

a. Membandingkan nilai ( )GCV λ pada 1M = dan 2M = .

i. Apabila nilai ( )GCV λ pada 1M = lebih kecil dari nilai ( )GCV λ

pada 2M = , maka algoritma berhenti dengan memilih jumlah knot

optimal yaitu 1M = .

ii. Apabila nilai ( )GCV λ pada 1M = lebih besar dari nilai

( )GCV λ pada 2M = , maka algoritma ini akan dilanjutkan

dengan membandingkan nilai ( )GCV λ untuk 2M = dan 3M = .

b. Membandingkan nilai ( )GCV λ pada 2M = dan 3M = .

i. Apabila nilai ( )GCV λ pada 2M = lebih kecil dari nilai

( )GCV λ pada 3M = , maka algoritma berhenti dengan memilih

jumlah knot optimal yaitu 2M = .

ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA

SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P

ii. Apabila nilai ( )GCV λ pada 2M = lebih besar dari nilai

( )GCV λ pada 3M = , maka algoritma ini akan dilanjutkan

dengan membandingkan nilai ( )GCV λ untuk 3M = dan 4M = .

c. Membandingkan nilai ( )GCV λ pada 3M = dan 4M = yang

dilakukan dengan cara yang sama seperti di atas, demikian seterusnya

hingga diperoleh nilai ( )GCV λ yang minimum.

2.10 Data Longitudinal

Data longitudinal merupakan data yang diperoleh dari pengamatan yang

dilakukan secara berulang dari waktu ke waktu pada satu unit eksperimen. Pada

data cross sectional setiap obyek hanya diamati satu kali (Wu & Zhang, 2006).

Berbeda dengan data time series, data longitudinal mengobservasi beberapa obyek

yang saling independen. Dengan demikian, data longitudinal juga dikenal sebagai

gabungan antara data cross sectional dan time series (Frees, 2003). Cakupan

pengertian serta karakteristik dari penelitian yang melibatkan data longitudinal

adalah sebagai berikut:

a. Data dikumpulkan untuk setiap obyek dan setiap variabel pada dua atau

lebih periode waktu tertentu.

b. Kasus atau subyek yang dianalisis sama atau setidaknya dapat

diperbandingkan antara satu periode dengan periode berikutnya.

c. Analisis melibatkan perbandingan data dari kasus yang sama dalam satu

periode.

ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA

SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P

Struktur data longitudinal dapat diuraikan dalam Tabel 2.1 sebagai berikut:

Tabel 2.1 Struktur Data Longitudinal

Subyek Pengamatan Respon Prediktor

11

122

2

ss

s

1

2

12

12

12

s

t

t

t

1

2

11

12

1

21

22

2

1

2

s

t

t

s

s

st

yy

y

yy

y

yy

y

1

2

11

12

1

21

22

2

1

2

s

t

t

s

s

st

xx

x

xx

x

xx

x

dengan 1,2,...,i s= merupakan banyaknya unit eksperimen dan 1,2,..., ij t=

merupakan banyaknya pengamatan yang dilakukan pada setiap unit eksperimen

sehingga total pengamatan adalah 1

s

ii

t=∑ (Sari, 2016).

2.11 Homoskedastisitas dan Heteroskedastisitas

Salah satu asumsi dalam analisis regresi adalah homoskedastisitas yang

berarti bahwa variansi dari setiap iε tidak tergantung pada variabel pediktor.

Variansi dari setiap iε bernilai sama untuk semua variabel pediktor, sehingga

nilai dari variansi residual bersifat konstan atau ( ) ( )2 2i iVar Eε ε σ= = ,

ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA

SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P

1,2,...,i s= . Pelanggaran terhadap asumsi ini disebut heteroskedastisitas yang

berarti bahwa variansi dari setiap error bersifat tidak konstan. Dalam analisis

regresi, heteroskedastisitas dinyatakan sebagai berikut:

( ) 2i i iVar xε σ= , 1, 2,...,i s= (2.6)

Persamaan (2.6) juga dapat dinotasikan dalam model di bawah ini.

21 1

222 2 2

2

0 0 0 00 0 0 0

0 0 0 0 0 0

T

n n

E

ω σω σ

εε σ σ

ω σ

= Ω = =

X

sehingga 2 2i iσ σ ω= . Dalam kasus homokedastisitas, nilai 1iω = untuk

1,2,...,i s= (Sari, 2016).

2.12 Uji Box’s M

Salah satu metode yang digunakan untuk mendeteksi adanya kasus

heteroskedastisitas adalah uji Box M. Uji Box M adalah uji statistika yang

digunakan untuk menguji heteroskedastisitas suatu kovarians matriks, dengan

subjek ke-i pengamatan ke-j dan dinyatakan dalam model regresi Tij ij ijy x β ε= +

dengan 1,2, ,i s= ; 1, 2, , ij t= . Hipotesis yang digunakan dalam pengujian ini

adalah:

H0 : 21 2( ) ( ) ( ) ; 1, 2, ,iVar Var Var i sε ε ε σ= = = = =

H1 : minimal ada satu ( ) 2iVar ε σ≠

ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA

SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P

Statistik Uji Box M adalah sebagai berikut :

( )1

log ( 1) log ; 0s

i ii

N T s S t S S=

= − − − ≥∑ (2.7)

1

s

ii

T t=

=∑ , untuk ( )( )1

1si i

i

t SS

T s=

−=

−∑ ; dan ( )( )

( )1 1

isij ij i ij i

ij i

w y y y yS

t=

− −=

−∑

dengan :

s : jumlah subjek yang diamati

ti : jumlah pengamatan dalam setiap subjek ke-i

T : jumlah dari ti

ijW : matriks pembobot (Box, 1949)

Untuk menguji signifikansi nilai N yang telah diperoleh, maka digunakan

uji Chi-Square dan uji F. untuk Uji F dengan daerah ( )1 21 , ,CDF N f fγ− adalah

F Nγ= (2.8)

dengan 11

2

f ff

ργ −

=

, ( )( ) ( ) ( )

2

2 21

2 3 1 1 116 1 1 1

k

i i

r rr g n n k

ρ=

+ −= − −

+ − − −∑ ;

( ) ( )1

1 12

g r rf

− += ;

( )1

2 2

21

ffτ ρ

+=

− −; ( )( )

( ) ( ) ( )2 21

1 2 1 16 1 1

k

i i

r rk n N k

τ=

− += −

− − − ∑

(Sari, 2016)

ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA

SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P

2.13 Uji Korelasi Pearson

Koefisien korelasi merupakan suatu nilai yang mengukur keeratan

hubungan antara dua variabel. Koefisien korelasi yang dihitung untuk data

populasi dinotasikan dengan ρ sedangkan koefisien korelasi yang dihitung untuk

data sampel dinotasikan dengan r . Nilai koefisien korelasi dapat dihitung dengan

menggunakan Pearson Product Moment pada persamaan (2.9) sebagai berikut:

( ) ( )( )

( )( ) ( )( )2 22 2

ij ij ijij

ij ij ij ij

n X Y X Yr

n X X n Y Y

−=

− −

∑ ∑ ∑

∑ ∑ ∑ ∑

(2.9) nilai r selalu berada diantara -1 sampai 1 ( )1 1r− ≤ ≤ . Apabila nilai

1r = maka disebut dengan korelasi linier positif sempurna. Apabila nilai 1r = −

maka dinamakan korelasi linier negatif sempurna, sedangkan apabila nilai 0r =

menunjukkan bahwa tidak terdapat korelasi diantara kedua variabel tersebut.

Pengujian koefisien korelasi dilakukan dengan menggunakan hipotesis,

yaitu

0H : 0ρ = (kedua variabel tidak memiliki hubungan linier)

1H : 0ρ > , 0ρ < atau 0ρ ≠

Konversi nilai koefisien korelasi menjadi distribusi t adalah

2

21

r ntr−

=−

(2.10)

dengan derajat bebas 2,n n− merupakan banyaknya pasangan data dari variabel-

variabel yang diduga berkorelasi dan r merupakan nilai koefisien korelasi yang

ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA

SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P

diperoleh berdasarkan persamaan (2.10). Nilai statistik uji t yang telah diperoleh

berdasarkan persamaan (2.10) selanjutnya dibandingkan dengan nilai t tabel.

Apabila nilai t hitung kurang dari t tabel maka 0H diterima sehingga dapat

disimpulkan bahwa tidak terdapat korelasi linier diantara kedua variabel,

demikian sebaliknya. (Brase dan Corrinne, 2013)

2.14 Regresi Nonparametrik Birespon Spline Truncated

Analisis regresi yang melibatkan dua variabel respon dan diantara variabel

respon tersebut terdapat korelasi atau hubungan yang kuat, baik secara logika

maupun matematis disebut regresi birespon. Apabila bentuk kurva regresi

birespon tidak diketahui, maka pendekatan yang digunakan adalah pendekatan

nonparametrik sehingga disebut regresi nonparametrik bi-response. Secara umum,

model untuk regresi nonparametrik birespon dapat dituliskan sebagai berikut:

( )i i iy f x ε= +

(2.11)

dengan ( ) ( )( )1 2 T

i i iy y y=

; ( ) ( )( )1 2( ) ( ) ( )T

i i if x f x f x=

dan ( ) ( )( )1 2 T

i i iε ε ε=

merupakan error random dengan mean 0 dan variansi i∑ , 1, 2,...,i s=

menyatakan indeks untuk subyek yang diamati. Fungsi f adalah kurva regresi

yang tidak diketahui bentuknya dan dapat dihampiri dengan fungsi spline

truncated sebagai berikut:

ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA

SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P

( ) ( ) ( ) ( ) ( ) ( ) ( )( )01 1 1

r r r

r

p p M pr r r r r rs si s i s i p m i m

s s mf x x x xβ β β β θ+

+= = =

= + + + −∑ ∑ ∑ (2.12)

dengan ( ) ( ) ( ) ( ) ( ) ( ) ( )( )0 1 1 2r r r r

Tr r r r r r rp p p p mβ β β β β β β+ + +=

merupakan

parameter variabel respon ke r (Wulandari dkk, 2014).

2.15 Weighted Least Square

Untuk mengilustrasikan metode Weighted Least Square (WLS), digunakan

model dua variabel regresi linier. Metode kuadrat terkecil tanpa pembobot yaitu

Ordinary Least Square (OLS) meminimumkan sedangkan metode WLS

meminimumkan jumlah kuadrat eror terboboti yang dirumuskan sebagai berikut

( ) ( )=TT y yε ε β β− −W X W X

(2.13) dengan

β

merupakan estimator WLS dan pembobot W merupakan invers dari matriks

variansi-kovariansi dari ε

atau y

dengan syarat X , yang dinotasikan dengan

( ) ( )Var Var yε = = ΣX X

.

Persamaan (2.13) selanjutnya diturunkan terhadap β

sedemikian sehingga

diperoleh estimator WLS sebagai berikut:

( ) 1ˆ yT Tβ−

= X WX X W

(2.14)

Pada metode OLS, pembobot W merupakan matriks identitas (Farebrother,

1988).

ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA

SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P

2.16 Regresi Nonparametrik Birespon pada Data Longitudinal Berdasarkan

Estimator Weighted Spline Truncated

Sari (2016) menyatakan persamaan regresi nonparametrik birespon pada

data longitudinal diasumsikan data berpasangan ( ) ( )( )1 2, ,ij ij ijx y y dan memenuhi

persamaan sebagai berikut:

( )ij ij ijy f x ε= +

(2.15)

dengan, ( ) ( ) ( ) ( ) ( )( )1 2 T

ij ij ijf x f x f x=

dan ( ) ( )( )1 2ij ij ijε ε ε= merupakan error

random dengan mean 0 dan variansi i∑ , 1, 2,...,i s= menyatakan indeks untuk

subyek yang diamati dan 1,2,..., ij t= menyatakan indeks untuk pengamatan di

setiap subyek.

Regresi nonparametrik birespon pada data longitudinal berdasarkan

estimator weighted spline truncated sebagai berikut:

ˆy β= X

( ) 1yT T−

= X X WX X W

= yA

(2.16)

dengan ( ) 1= T T−

A X X WX X W merupakan matriks yang berukuran 2 2T T× .

Berdasarkan rumus Mean Square Error (MSE) yaitu

ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA

SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P

( ) ( ) ( )1 ˆ ˆ2T

MSE T y y y y− = − −

(2.17)

selanjutnya dapat diturunkan rumus MSE dalam regresi nonparametrik birespon

pada data longitudinal dan diperoleh rumus MSE sebagai berikut:

( ) ( )12

TTMSE y yT

= − −I A I A

(2.18)

nilai MSE tersebut kemudian digunakan untuk menghitung nilai Generalized

Cross Validation (GCV). Kriteria nilai GCV yang minimum digunakan untuk

menentukan jumlah knot yang optimum. Berdasarkan rumus umum GCV yang

terdapat pada persamaan (2.5), maka nilai GCV dalam regresi nonparametrik

birespon pada data longitudinal dirumuskan pada persamaan sebagai berikut:

( )( ) ( )

( )

1

21

2

2

TTT y yGCV

T trλ

− −=

I A I A

I A

(2.19)

dengan ( ) 1= T T−

A X WX X W ; λ merupakan parameter smoothing yaitu orde ( )rp

, jumlah knot ( )M , dan titik knot ( )1 2, ,..., Mθ θ θ atau dapat dituliskan dalam notasi

( )( )1 2, , , ,...,r Mp Mλ θ θ θ= .

Selanjutnya dilakukan uji kesesuaian model dengan menghitung kriteria

Goodness of Fit yaitu MSE dan 2R dengan

ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA

SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P

2 1 JKGRJKT

= − (2.20)

Jumlah Kuadrat Galat (JKG) ( ) ( )ˆ ˆT

y y y y= − −

dan Jumlah Kuadrat Total (JKT)

( ) ( )Ty y y y= − −

.

2.17 Open Source Software (OSS)-R

R merupakan salah satu software yang sering digunakan dalam statistika

dan termasuk dalam kategori Open Source Software (OSS) sehingga dapat

diperoleh secara gratis di situs http://www.r-project.org/ atau http://cran.r-

project.org/. Versi pertama R diluncurkan pada tahun 1992 oleh Ross Ihaka dan

Robert Gentleman (singkatan R berasal dari kedua nama tersebut) yang keduanya

dari The University of Auckland. Bahasa R berbasis bahasa S yang dibangun di

Bell Laboratories di tahun 80-an sehingga syntax R memiliki perbedaan yang

tidak terlalu banyak atau hampir identik jika dibandingkan dengan syntax pada

software S-plus (Sari, 2016).

Beberapa perintah internal yang digunakan dalam OSS-R adalah sebagai

berikut:

1. function( ), merupakan perintah untuk menunjukkan kumpulan dari

beberapa fungsi yang digunakan dalam program. Fungsi dipanggil

dengan format nama fungsi( daftar argumen ).

ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA

SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P

2. length( ), merupakan perintah yang digunakan untuk menghitung

banyaknya data. Misalkan terdapat perintah length(vector), maka akan

diperoleh hasil yaitu panjang dari vector tersebut.

3. plot( ), digunakan untuk membuat plot data. Beberapa penggunaan

perintah ini diantaranya:

a. plot(X,Y) berarti bahwa akan dibuat plot data berupa titik dengan

sumbu datar X dan sumbu tegak Y.

b. plot(X,Y,type=”l”) memberikan hasil plot bertipe garis.

c. plot(X,Y,type=”b”) memberikan hasil plot bertipe garis dan titik.

4. rep(a,b), merupakan perintah yang digunakan untuk membentuk suatu

vektor dengan anggota a sebanyak b.

5. matrix(a,b,c), merupakan perintah yang digunakan untuk membentuk

suatu matriks berukuran b×c dengan elemen a.

6. print( ), digunakan untuk menampilkan hasil atau output dari program.

7. cat(“…”), merupakan perintah untuk menuliskan kemudian

menampilkan argumen dalam bentuk karakter.

8. for( ), merupakan perintah yang digunakan untuk mengulang satu blok

pernyataan berulang kali hingga memenuhi kondisi yang telah

ditentukan. Format penulisan perintah ini adalah for( kondisi )

pernyataan .

9. repeat( ), hampir mirip dengan for( ), apabila kondisi sudah terpenuhi

maka proses pengulangan akan dihentikan. Struktur penulisan

statement repeat dalam R yaitu repeat command if( kondisi ) break

ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA

SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P

10. if-else, merupakan perintah yang digunakan untuk seleksi kondisi.

Apabila suatu kondisi bernilai benar, maka pernyataan pertama akan

dijalankan, sedangkan apabila kondisi bernilai salah maka pernyataan

kedua yang akan dijalankan. Struktur penulisan perintah ini adalah

sebagai berikut: if( kondisi ) pernyataan pertama else pernyataan

kedua

11. solve( A ), digunakan untuk menghitung invers dari suatu matriks A.

12. sum( ), digunakan untuk menghitung jumlah dari keseluruhan data.

13. rbind( ), digunakan untuk menggabungkan suatu matriks atau vektor

berdasarkan baris.

14. cbind( ), digunakan untuk menggabungkan suatu matriks atau vektor

berdasarkan kolom.

15. diag( a ), merupakan perintah yang digunakan untuk membentuk suatu

vektor a menjadi suatu matriks diagonal dengan elemen diagonal

utamanya adalah elemen dari a dan elemen yang lain bernilai nol.

16. sort( ), merupakan perintah yang digunakna untuk mengurutkan

sekumpulan data.

17. unique( ), digunakan untuk menentukan nilai tunggal dari suatu data.

18. quantile(…, …), merupakan perintah untuk menentukan sampel

kuantil.

19. order( ), merupakan perintah untuk menunjukkan vektor posisi data

apabila data tersebut diurutkan.

ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA

SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P

20. var( ), merupakan perintah untuk menghitung nilai variansi dari suatu

vektor atau matriks variansi-kovariansi dari suatu matriks.

21. boxM(data, kelompok), merupakan syntax uji Box’s M yang

digunakan untuk menguji homogenitas matriks variansi-kovariansi

yang diperoleh dari data yang berdistribusi normal multivariate

berdasarkan satu klasifikasi.

ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA

SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P

BAB III

METODOLOGI PENELITIAN

3.1 Data dan Sumber Data

Data yang digunakan dalam skripsi ini adalah data sekunder yang berasal

dari pemantauan kualitas 18 titik WS Brantas (tanpa hilir) di sekitar lokasi industri

yang ditentukan berdasarkan lokasi pembuangannya dan jenis limbah yang

memberikan kontribusi adanya pencemaran dalam 3 triwulan yaitu bulan April-

Juni, Juli-September, dan Oktober-Desember 2015 yang dilakukan oleh Perum

Jasa Tirta 1 (PJT 1).

Titik pengambilan sampel limbah pada WS Brantas di dekitar lokasi industri

disajikan pada Tabel 3.1

Tabel 3.1. Daftar Industri Titik Pengambilan Sampel Limbah

No. Nama Industri Daerah

1 Dinas Pemotongan Hewan Malang Kota Malang

2 PT. Pindad Kabupaten Malang

3 PT. Eka Mas Fortuna Kabupaten Malang

4 Peternakan Babi Sempulur Kabupaten Malang

5 Peternakan Babi Delta Kabupaten Malang

6 CV. Sartimbul Kabupaten Tulungagung

7 Peternakan Babi Hanjoyo Kabupaten Tulungagung

8 PT. Setia Kawan Kabupaten Tulungagung

9 PT. Surya Zig Zag Kabupaten Kediri

10 PT. Surya Pamenang Kabupaten Kediri

11 UD. Sumberejo Kabupaten Kediri

12 PT. Jaya Kertas Kabupaten Nganjuk

13 PT. Cheil Jedang Kabupaten Jombang

ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA

SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P

No. Nama Industri Daerah

14 PT. Ajinomoto Indonesia Kabupaten Mojokerto

15 PT. Darmala Kabupaten Mojokerto

16 PT. Pakerin Kabupaten Mojokerto

17 PT. Sateliti Sriti Kabupaten Pasuruan

18 PT. Tjiwi Kimia Kabupaten Sidoarjo

3.2 Variabel Penelitian

Variabel-vaiabel penelitian yang digunakan dalam skripsi ini disajikan

dalam Tabel 3.2.

Tabel 3.2 Variabel-varibel Penelitian

Variabel Keterangan Variabel Satuan Tipe Variabel

ijx Kadar TSS pada subjek ke-

i, pengamatan ke-j gr/l Kontinu

(1)ijy

Kadar BOD pada subjek ke-

i, pengamatan ke-j gr/l Kontinu

(2)ijy

Kadar COD pada subjek ke-

i, pengamatan ke-j gr/l Kontinu

ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA

SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P

3.3 Langkah Analisis

Langkah analisis yang dilakukan untuk menjawab rumusan masalah dalam

skripsi ini adalah sebagai berikut:

1. Mengestimasi model BOD dan COD sebagai parameter kualitas air sungai

Brantas di sekitar lokasi industri dengan pendekatan regresi nonparametrik

birespon pada data longitudinal berdasarkan estimator spline truncated

menggunakan aplikasi OSS-R dengan langkah-langkah sebagai berikut:

a. Membuat plot antara BOD dengan TSS dan COD dengan TSS.

b. Menginputkan data berpasangan (TSS, BOD, dan COD) yang

memenuhi persamaan (2.15).

c. Menguji korelasi antara variabel BOD dan COD dengan

menggunakan persamaan (2.10)

d. Menentukan parameter smoothing optimum dengan melakukan

estimasi tanpa pembobot W menggunakan metode full-search

berdasarkan kriteria GCV minimum seperti yang telah dijelaskan pada

subbab (2.8.3)

e. Menguji heteroskedastisitas pada error dengan menggunakan uji

Box’s M pada subbab (2.12)

f. Menentukan matriks pembobot W berdasarkan hasil uji

heteroskedastisitas.

g. Menentukan parameter smoothing optimum dengan melibatkan

pembobot W menggunakan metode full-search berdasarkan kriteria

GCV minimum seperti yang telah dijelaskan pada subbab (2.8.3)

ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA

SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P

h. Mengestimasi data dengan menggunakan estimator weighted spline

truncated sehingga diperoleh data berpasangan untuk setiap subyek

pengamatan ke- i , ( )1,2,...,i s= sebanyak it pengamatan yang

memenuhi persamaan (2.15)

i. Menghitung nilai kriteria Goodness of Fit yaitu MSE dan R-square

berdasarkan persamaan (2.17) dan (2.20)

2. Menganalisis dan menginterpretasi hasil estimasi model BOD dan COD

sebagai parameter kualitas air sungai Brantas di sekitar lokasi industri

dengan pendekatan regresi nonparametrik birespon pada data longitudinal

berdasarkan estimator spline truncated.

a. Menganalisis hasil estimasi model BOD dan COD sebagai parameter

kualitas air sungai Brantas di sekitar lokasi industri dengan pendekatan

regresi nonparametrik birespon pada data longitudinal berdasarkan

estimator spline truncated.

b. Menginterpretasi hasil estimasi model BOD dan COD sebagai parameter

kualitas air sungai Brantas di sekitar lokasi industri dengan pendekatan

regresi nonparametrik birespon pada data longitudinal berdasarkan

estimator spline truncated dan membuat plot antara nilai estimasi dan

observasi BOD dengan TSS dan COD dengan TSS.

Berikut disajikan flowchart dari analisis model regresi nonparametrik

birespon pada data longitudinal berdasarkan estimator spline truncated:

ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA

SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P

Tidak dapat digunakan

analisis regresi birespon

Selesai

Mulai

Input data

Input alfa

Uji korelasi antara dan

p-value ≤ alfa

Input n

• Matriks p, vektor jp.

xbaru

C=1

B A

Ya

Tidak

ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA

SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P

B A

Vektor MSE; vektor GCV;

dan

dan

Jumlah titik knot optimum untuk orde adalah

Membandingkan untuk kombinasi orde

C

Ya

Tidak

Ya

Tidak

ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA

SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P

C

Melakukan estimasi dengan menggunakan parameter smoothing optimal yang telah diperoleh

Uji heteroskedastisitas pada nilai

p-value ≤ alfa

Menghitung variansi-

kovariansi dari dan

Menghitung variansi-

kovariansi dari dan

Mereplikasi setiap elemen dari matriks variansi-

kovariansi sebanyak

Mereplikasi setiap elemen dari matriks variansi-

kovariansi sebanyak

Mendefinisikan hasil dari suatu vektor

Menggabungkan hasil replikasi dalam suatu vektor

Mendefinisikan vektor replikasi sebagai matriks

D

Ya Tidak

ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA

SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P

D

Menggabungkan keempat matriks diagonal, dan menghitung inversnya

Menentukan parameter smoothing optimum dengan menyertakan pembobot W

Melakukan estimasi dengan dengan menggunakan parameter smoothing optimal yang telah diperoleh beserta

Melakukan nilai dan estimasi

Menghitung MSE dan

Membuat plot estimasi

Selesai

ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA

SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P

BAB IV

HASIL DAN PEMBAHASAN

Bab ini berisi pembahasan hasil analisis untuk menjawab tujuan skripsi

yang meliputi estimasi model BOD dan COD dengan pendekatan regresi

nonparametrik birespon pada data longitudinal berdasarkan estimator spline

truncated serta analisis dan interpretasi model.

4.1 Estimasi Model BOD dan COD dengan Pendekatan Regresi

Nonparametrik Birespon pada Data Longitudinal Berdasarkan

Estimator Spline Truncated

Data yang digunakan dalam estimasi model regresi nonparametrik birespon

pada data longitudinal berdasarkan estimator spline truncated adalah data hasil

pengamatan BOD, COD, dan TSS di titik-titik WS Brantas di sekitar lokasi

industri pada bulan April-Juni, Juli-September, dan Oktober-Desember tahun

2015. Variabel yang digunakan diantaranya BOD sebagai variabel respon 1, COD

sebagai variabel respon 2 dan TSS sebagai variabel prediktor. Data tersebut dapat

dilihat secara lengkap pada Lampiran 1

Gambaran awal tentang hubungan data BOD dengan TSS dan COD dengan

TSS dapat dilakukan dengan membuat plot yang dapat dilihat pada Gambar 4.1

dan Gambar 4.2 sebagai berikut:

ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA

SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P

Gambar 4.1 Plot Data Pengamatan BOD terhadap TSS

Gambar 4.2 Plot Data Pengamatan COD terhadap TSS

Pada Gambar 4.1 dan Gambar 4.2 dapat dilihat pola data BOD dan COD

terhadap TSS tidak beraturan dan pola data tidak dapat diasumsikan mendekati

suatu fungsi tertentu (linier, kuadratik, kubik, dsb).

BOD dan COD memiliki korelasi atau keeratan hubungan baik secara logika

maupun secara matematis yang ditunjukkan dengan uji korelasi pearson.

Hipotesis uji korelasi pearson adalah sebagai berikut:

0

0,5

1

1,5

0 0,5 1 1,5 2

BO

D (g

r/l)

TSS (gr/l)

plot observasi

0

2

4

6

8

10

0 0,5 1 1,5 2

CO

D (g

r/l)

TSS (gr/l)

plot observasi

ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA

SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P

H0 : Tidak terdapat korelasi diantara BOD dan COD ( )0ρ =

H1 : Terdapat korelasi diantara BOD dan COD ( )0ρ ≠

Dari hasil uji korelasi pearson yang terdapat pada Lampiran 3 diperoleh nilai

koefisien korelasi antara variabel BOD dan COD sebesar 0,601 dengan nilai p-

value 1,532×10-6. Nilai p-value tersebut kurang dari α bernilai 0,05 sehingga

diperoleh keputusan untuk menolak H0. Dengan demikian diperoleh kesimpulan

bahwa terdapat korelasi antara variabel BOD dan COD sehingga dapat diestimasi

dengan pendekatan regresi birespon.

Analisis data BOD dan COD dengan menggunakan program estimasi tanpa

pembobot W yang telah dibuat menggunakan OSS-R yang telah terlampir pada

Lampiran 2 diperoleh hasil yang ditampilkan dalam Tabel 4.1 berikut,

Tabel 4.1 Pemilihan Orde Optimum Berdasarkan Jumlah Knot Optimum

pada Data BOD dan COD (Tanpa Pembobot)

Orde Respon 1

Orde Respon 2

Jumlah Titik Knot Optimum

Titik Knot GCV

1 1 1 0,04995 0,2779269

1 2 3 0,019225; 0,04995; 0,16375

0,1860923

2 1 1 0,04995 0,2743006

2 2 3 0,019225; 0,04995; 0,16375

0,1840114

Pada Tabel 4.1 dapat dilihat bahwa GCV minimum adalah 0,1840114 sehingga

parameter smoothing optimum yaitu orde respon 1 adalah 2, dan orde respon 2

adalah 2 dengan 3 titik knot yaitu 0,019225; 0,04995; dan 0,16375.

ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA

SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P

Setelah diperoleh perameter smoothing optimum, selanjutnya dilakukan

estimasi dengan menggunakan parameter smoothing optimum tersebut sehingga

diperoleh nilai ε

untuk respon 1 dan respon 2. Pengujian heteroskedastisitas

variansi error perlu dilakukan untuk menentukan matriks pembobot W . Dalam

hal ini, uji heteroskedastisitas dilakukan dengan menggunakan uji Box’s M

dengan hipotesis sebagai berikut:

H0 : 1 2 18...Σ = Σ = = Σ .

H1 : Minimal ada sepasang iΣ yang tidak sama ( )1,2,...,18i =

Berdasarkan hasil uji Box’s M yang terdapat pada Lampiran 3 diperoleh nilai p-

value untuk variansi eror data BOD dan COD adalah 9,259×10-15. Nilai p-value

tersebut kurang dari α bernilai 0,05 sehingga diperoleh keputusan untuk menolah

H0. Dengan demikian diperoleh kesimpulan terdapat kasus heterokedastisitas pada

data BOD dan COD.

Pemilihan parameter smoothing optimum perlu dilakukan ulang dengan

disertai pembobot W karena terdapat kemugkinan bahwa parameter smoothing

optimum yang diperoleh akan berbeda antara sebelum dan setelah ada matriks

pembobot W . Berdasarkan analisis data BOD dan COD dengan menggunakan

program estimasi yang menyertakan pembobot W yang terlampir pada Lampiran

2, diperoleh parameter smoothing dengan menggunakan kombinasi orde dan titik

knot yang terdapat pada Lampiran 3. Pemilihan parameter smoothing optimum

dengan menyertakan matriks pembobot W untuk data BOD dan COD

ditampilkan dalam Tabel 4.2 berikut:

ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA

SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P

Tabel 4.2 Pemilihan Orde Optimum Berdasarkan Jumlah Knot Optimum

pada Data BOD dan COD (Dengan Pembobot)

Orde Respon 1

Orde Respon 2

Jumlah Titik Knot Optimum Titik Knot GCV

1 1 1 0,04995 0,3481324

1 2 5

0,01135; 0,022433; 0,04995; 0,1096; 0,26

0,1929118

2 1 4 0,01382; 0,04336; 0,0752; 0,1806

0,3369376

2 2 3 0,019225; 0,04995; 0,16375

0,1979677

dari Tabel 4.2 dapat dilihat bahwa nilai GCV sebelum dan setelah disertakan

pembobot berbeda. Pada tabel tersebut dapat dilihat bahwa nilai GCV minimum

adalah 0,1929118 sehingga parameter smoothing optimum yaitu orde respon 1

adalah 1, dan orde respon 2 adalah 2, dengan 5 titik knot optimum, yaitu 0,01135;

0,022433; 0,04995; 0,1096; 0,26.

4.2 Menganalisis dan Menginterpretasi Hasil Estimasi Model BOD dan

COD dengan Pendekatan Regresi Nonparametrik Birespon pada Data

Longitudinal Berdasarkan Estimator Weighted Spline Truncated

Berdasarkan Tabel 4.1 dan Tabel 4.2, diperoleh estimasi model BOD adalah

sebagai berikut:

ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA

SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P

( ) ( ) ( ) ( )1ˆ 0,00597 0,215 1,633 0,01135 1,048 0,022433 1,215 0,04995y x x x x+ + +

= − + − + − − − +

( ) ( )1,189 0,1096 2,19 0,26x x+ +

− − − (4.1)

dengan

( )0,01135 untuk 0,01135

0,011350 untuk 0,01135

x xx

x+

− ≥− = <

;

( )0,022433 untuk 0,022433

0,0224330 untuk 0,022433

x xx

x+

− ≥− = <

;

( )0,04995 untuk 0,04995

0.049950 untuk 0,04995

x xx

x+

− ≥− = <

;

( )109,6 untuk 0,1096

0,10960 untuk 0,1096

x xx

x+

− ≥− = <

; dan

( )0,26 untuk 0,26

0,260 untuk 0,26

x xx

x+

− ≥− = <

sehingga persamaan (4.1) dapat diuraikan menjadi fungsi potongan sebagai

berikut:

( )1

0,00597 0,215 ;untuk 0,011350,013 1,418 ;untuk 0,01135 0,0224330,037 2,466 ;untuk 0,022433 0,04995

ˆ0,024 1,251 ;untuk 0,04995 0,1096

0,082 2,44 ;untuk 0,1096 0,260,487 0,25 ;untuk 0,2

x xx xx x

yx x

x xx x

− <− + ≤ <− + ≤ <

=+ ≤ <

− + ≤ <+ ≥ 6

(4.2)

Dari persamaan (4.2), diketahui bahwa perubahan nilai BOD tertinggi di 18 titik

WS Brantas di sekitar lokasi industri adalah ketika nilai TSS 0,022 gr/l sampai

ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA

SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P

nilai TSS kurang dari 0,04995 gr/l, yaitu setiap kenaikan nilai TSS 1 gr/l, maka

kenaikkan BOD sebesar 2,466 gr/l. Sedangkan perubahan nilai BOD terendah di

18 titik sungai tersebut adalah ketika nilai TSS kurang dari 0,01135 gr/l, yaitu

setiap kenaikkan nilai TSS 1 gr/l, maka nilai BOD mengalami penurunan sebesar

0.215 gr/l. Selain itu, dari persamaan (4.2) dapat diketahu estimasi nilai BOD di

18 titik sungai tersebut pada nilai TSS tertentu. Misalkan nilai TSS 0,3 gr/l,

dengan menggunakan persamaan (4.2) pada interval nilai 0, 26x ≥ dapat

diketahui nilai estimasi BOD yaitu sebesar 0,562 gr/l.

Berdasarkan Tabel 4.2, estimasi model BOD adalah:

( ) ( ) ( )2 22 2ˆ 0,034 5,004 326,922 372,022 0,01135 266,964 0,022433y x x x x+ +

= − + − − + − −

( ) ( ) ( )2 2 2302,603 0,04995 63,454 0,1096 21,447 0,26x x x+ + +

− + − + − (4.3)

Dengan

( )2 0,01135 untuk 0,011350,01135

0 untuk 0,01135x x

xx+

− ≥− = <

;

( )2 0,022433 untuk 0,0224330,022433

0 untuk 0,022433x x

xx+

− ≥− = <

;

( )2 0,04995 untuk 0,049950.04995

0 untuk 0,04995x x

xx+

− ≥− = <

;

( )2 109,6 untuk 0,10960,1096

0 untuk 0,1096x x

xx+

− ≥− = <

; dan

ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA

SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P

( )2 0, 26 untuk 0,260,26

0 untuk 0,26x x

xx+

− ≥− = <

sehingga persamaan (4.3) dapat diuraikan menjadi fungsi potongan sebagai

berikut:

( )

2

2

22

2

0,034 5,004 326,922 ;untuk 0,011350,082 13,56 698,944 ;untuk 0,01135 0,022433

0,216 25,538 965,908 ;untuk 0,022433 0,04995ˆ0,971 55,768 1268,511 ;untuk 0,04995 0,1096

1,732 69,664 13

x x xx x xx x x

yx x x

x

− + <− + ≤ <− + ≤ <

=− + ≤ <− + 2

2

31,965 ;untuk 0,1096 0, 263,182 80,816 1353,412 ;untuk 0,26

x xx x x

≤ <

− + ≥

(4.4)

Berdasarkan persamaan (4.4), untuk menduga nilai COD misalkan ketika nilai

TSS 0,01 gr/l dengan menggunakan persamaan (4.4) pada interval nilai 0,011x <

dapat diketahui nilai estimasi COD yaitu sebesar 0,016 gr/l. Berdasarkan

persamaan (4.2) dan persamaan (4.4) dan dengan melihat nilai rata-rata TSS pada

setiap titik pengamatan WS Brantas di sekitar lokasi industri maka diperoleh

model BOD dan COD untuk setiap titik pengamatan tersebut yang disajikan

dalam Tabel 4.3 sebagai berikut,

Tabel 4.3 Model BOD dan COD Untuk Setiap Titik Pengamatan di WS Brantas di

Sekitar Lokasi Industri

No. Nama Industri Model Estimasi

BOD Model Estimasi COD

1 Dinas Pemotongan

Hewan Malang 0,082 2,44x− + 21,732 69,664 1331,965x x− +

2 PT. Pindad 0,00597 0,215x− 20,034 5,004 326,922x x− +

ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA

SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P

No. Nama Industri Model Estimasi

BOD Model Estimasi COD

3 PT. Eka Mas

Fortuna 0,013 1,418x− + 20,082 13,56 698,944x x− +

4 Peternakan Babi

Sempulur 0,082 2,44x− + 21,732 69,664 1331,965x x− +

5 Peternakan Babi

Delta 0,082 2,44x− + 21,732 69,664 1331,965x x− +

6 CV. Sartimbul 0,082 2,44x− + 21,732 69,664 1331,965x x− +

7 Peternakan Babi

Hanjoyo 0,487 0,25x+ 23,182 80,816 1353,412x x− +

8 PT. Setia Kawan 0,024 1,251x+ 20,971 55,768 1268,511x x− +

9 PT. Surya Zig Zag 0,037 2,466x− + 20, 216 25,538 965,908x x− +

10 PT. Surya

Pamenang 0,037 2,466x− + 20, 216 25,538 965,908x x− +

11 UD. Sumberejo 0,487 0,25x+ 23,182 80,816 1353,412x x− +

12 PT. Jaya Kertas 0,037 2,466x− + 20, 216 25,538 965,908x x− +

13 PT. Cheil Jedang 0,013 1,418x− + 20,082 13,56 698,944x x− +

14 PT. Ajinomoto

Indonesia 0,013 1,418x− + 20,082 13,56 698,944x x− +

15 PT. Darmala 0,037 2,466x− + 20, 216 25,538 965,908x x− +

16 PT. Pakerin 0,024 1,251x+ 20,971 55,768 1268,511x x− +

17 PT. Sateliti Sriti 0,013 1,418x− + 20,082 13,56 698,944x x− +

18 PT. Tjiwi Kimia 0,037 2,466x− + 20, 216 25,538 965,908x x− +

dari Tabel 4.3 dapat dilihat bahwa titik pengamatan yang mempunyai nilai BOD

dan COD terendah adalah titik pengamatan di sekitar lokasi PT Pindad yang dapat

ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA

SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P

dilihat dari model BOD dan COD berturut-turut adalah 0,00597 0,215x− dan

20,034 5,004 326,922x x− + , hal ini berarti nilai TSS pada titik pengamatan di

WS Brantas di sekitar lokasi PT Pindad terletak pada interval 0,01135x < ,

sedangkan nilai BOD dan COD tertinggi adalah pada titik pengamatan di sekitar

lokasi Peternakan Babi Hanjoyo dan UD. Sumberejo yang dapat dilihat dari

model BOD dan COD berturut-turut adalah 0,487 0,25x+ dan

23,182 80,816 1353,412x x− + , hal ini berarti nilai TSS pada titik pengamatan di

WS Brantas di sekitar lokasi Peternakan Babi Hanjoyo dan UD. Sumberejo

terletak pada interval 0, 26x ≥ .

Dari persamaan (4.2) dan persamaan (4.4) diperoleh nilai MSE sebesar 0,143 dan

R-Square sebesar 86,14%. Plot antara hasil observasi dan estimasi BOD terhadap

TSS ditunjukkan pada Gambar 4.3 sebagai berikut,

Gambar 4.3 Plot Observasi dan Estimasi Data BOD terhadap TSS

ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA

SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P

Pada Gambar 4.3 di atas menujukkan bentuk kurva estimasi dan plot observasi

BOD terhadap TSS. Dalam Gambar 4.3 tersebut dapat dilihat perubahan bentuk

kurva estimasi. Kurva tersebut juga menunjukkan perubahan bentuk sesuai nilai

titik knot, ketika nilai TDS kurang dari 0,01135 sampai nilai TDS kurang dari

0,26 kurva mengalami kenaikan yang sangat tinggi yaitu dengan rata-rata nilai

kemiringan kurva 1,87 dan ketika nilai TDS 0,26 dan selebihnya perubahan nilai

kenaikan kurva konstan. Sedangakan untuk plot antara hasil estimasi dan

observasi COD terhadap TSS ditunjukkan pada Gambar 4.4 sebagai berikut,

Gambar 4.4 Plot Observasi dan Estimasi Data COD terhadap TSS

Pada Gambar 4.4 di atas menujukkan bentuk kurva estimasi dan plot observasi

COD terhadap TSS. Dalam Gambar 4.4 tersebut dapat dilihat perubahan bentuk

kurva estimasi. Kurva tersebut juga menunjukkan perubahan bentuk sesuai nilai

titik knot. Perubahan kurva sangat tinggi kecuali ketika nilai TDS diantara 0,26

sampai 0,83, perubahan nilai TDS lebih rendah yang ditunjukkan oleh bentuk

kurva dengan rata-rata nilai kemiringan 1,06.

ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA

SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P

Plot hasil estimasi BOD dan COD terhadap TSS dapat dilihat dalam

Gambar 4.5 sebagai berikut

Gambar 4.5 Plot Hasil Estimasi BOD dan COD terhadap TSS

Gambar 4.5 menunjukkan bahwa nilai BOD dan COD mengalami kenaikan

seiring bertambahnya nilai TSS, akan tetapi nilai kenaikan COD lebih tinggi

dibandingkan nilai kenaikan BOD dan dapat dilihat bahwa nilai COD selalu lebih

besar daripada nilai BOD hal ini dikarenakan nilai BOD hanya terpengaruh pada

jumlah TSS dan zat organik yang ada dalam air. Sedangkan COD adalah total

keseluruhan dari pengotor TSS, zat organik, mineral bervalensi rendah, ditambah

dengan zat kimia yang menyerap oksigen. Nurbana (2015) menyatakan ketika

nilai BOD kurang dari sepertiga nilai COD, berarti air limbah tersebut

mengandung banyak sekali zat penangkap oksigen diluar dari TSS ataupun zat

organik.

0

2

4

6

8

10

0 0,5 1 1,5 2

gr/l

estimasi BOD estimasi COD

ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA

SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P

BAB V

PENUTUP

5.1 Kesimpulan

Berdasarkan hasil analisis yang telah dilakukan, kesimpulan yang diperoleh

adalah sebagai berikut :

1. Berdasarkan model yang diperoleh, dapat disimpulkan titik pengamatan

yang mempunyai nilai BOD dan COD terendah adalah titik pengamatan di

sekitar lokasi PT Pindad yang dapat dilihat dari model BOD dan COD

berturut-turut adalah 5,966 0,215x− dan 233,690 5,004 0,326x x− + , hal ini

berarti nilai TSS pada titik pengamatan di WS Brantas di sekitar lokasi PT

Pindad terletak pada interval 0,01135x < , sedangkan nilai BOD dan COD

tertinggi adalah pada titik pengamatan di sekitar lokasi Peternakan Babi

Hanjoyo dan UD. Sumberejo yang dapat dilihat dari model BOD dan COD

berturut-turut adalah 463,697 0,25x+ dan 21572,391 3,294 0,0034x x− + ,

hal ini berarti nilai TSS pada titik pengamatan di WS Brantas di sekitar

lokasi Peternakan Babi Hanjoyo dan UD. Sumberejo terletak pada interval

0, 26x ≥ .

2. Hasil plot estimasi BOD dan COD menunjukkan bahwa nilai BOD dan

COD mengalami kenaikan seiring bertambahnya nilai TSS, akan tetapi nilai

kenaikan COD lebih tinggi dibandingkan nilai kenaikan BOD, dengan rata-

rata nilai kenaikan BOD dan COD berturut-turut adalah 0,017 gr/l dan 0,163

gr/l. Berdasarkan plot hasil estimasi BOD dan COD pada Gambar 4.5 dapat

ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA

SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P

dilihat bahwa nilai COD selalu lebih besar daripada nilai BOD hal ini

dikarenakan nilai BOD hanya terpengaruh pada jumlah TSS dan zat organik

yang ada dalam air. Sedangkan COD adalah total keseluruhan dari pengotor

TSS, zat organik, mineral bervalensi rendah, ditambah dengan zat kimia

yang menyerap oksigen. Ketika nilai BOD kurang dari sepertiga nilai COD,

berarti air limbah tersebut mengandung banyak sekali zat penangkap

oksigen diluar dari TSS ataupun zat organik.

5.2 Saran

1. Diharapkan adanya penambahan data untuk penilitan selanjutnya sehingga

model dapat digunakan untuk insample dan outsample data.

2. Pemodelan BOD dan COD pada titik WS Brantas di sekitar lokasi industri

dapat dilakukan dengan menambah variabel prediktor yang berpengaruh,

sehingga model yang diperoleh lebih signifikan dan estimasi respon yang

diperoleh lebih mendekati nilai yang sebenarnya.

3. Pemodelan BOD dan COD pada titik WS Brantas di sekitar lokasi industri

dapat diestimasi menggunakan pendekatan regresi semiparametrik dengan

variabel X diasumsikan parametrik.

4. Pemodelan BOD dan COD pada titik WS Brantas di sekitar lokasi industri

dapat dietimasi menggunakan pendekatan spasial dengan mengasumsikan

variabel respon dependen satu sama lain.

ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA

SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P

DAFTAR PUSTAKA

Alfiani, M., Indah, M., dan Tiani, W. 2014. Model Regresi Nonparametrik

Berdasarkan Estimator Lokal Kernel pada Kasus Pertumbuhan Balita. Jurnal Statistika Universitas Muhammadiyah Semarang, 2(1).

Brase, C., dan Corine, P. B. 2013. Understanding Basic Statistic Sixth Edition. The United States of America: Brooks/Cole Cengage Language.

Box, G. E. (1949). A General Distribution Theory for a Class of Likelihood Criteria.

Budiantara, I. N. 2012. Penelitian Bidang Regresi Spline Menuju Terwujudnya Penelitian Statistika yang Mandiri dan Berkarakter. Seminar Nasional FMIPA Undiksha. Singaraja: Institut Teknologi Sepuluh November.

Eubank, R. L. 1999. Nonparametric Regression and Spline Smoothing Second Edition. New York:Marcel Dekker.

Farebrother, R. W. (1988). Linear Least Square Computations. New York: Marcel Dekker, Inc.

Frees, E. W. (2003). Longitudinal and Panel Data: Analysis and Aplications for the Social Sciences. Cambridge: Cambrdge University Press.

Harinaldi. (2005). Prinsip-Prinsip Statistik untuk Teknik dan sains. Jakarta: Erlangga.

Herlambang, A. 2006. Pencemaran Air dan strategi Penanggulangannya. Jurnal Ilmiah 19-20.

Jatmiko, A. 2007. Hubungan Kualitas Air Selokan Ngenden Desa Gumpang Kartasura Sukoharjo dengan Air Sumur Penduduk Sekitar. Skripsi. Surakarta: Universitas Sebelas Maret.

Koesnariyanto, R. 2012. Pemodelan Indikator Pencemaran Air Secara Kimia (BOD) dengan Geographically Weighted Regression. Skripsi Surabaya: Fakultas Kesehatan Masyarakat Universitas Airlangga.

Krisnawati, Widya, T. Y., Nurasih, A., dan Santoso, A. M. 2015. Perancangan Molief Bioreactor untuk Remediasi Air Sungai Brantas Kediri Tercemar Limbah Domestik dan Industri. Prosiding Seminar Nasional Pendidikan Biologi 2015. Malang: FKIP Universitas Muhammadiyah Malang. 489

ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA

SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P

Kusumawardani, D. 2010. Evaluasi Ekonomi Air Bersih di Surabaya (Studi Kasus Pada Air PDAM).Majalah Ekonomi. Yogyakarta: Lembaga Penelitian dan Pengabdian Kepada Masyarakat UGM.

Moertinah, S. 2010. Kajian Proses Anaerobk sebagai Alternatif Teknologi Pengolahan Air Limbah Industri Organik Tinggi. Jurnal Riset, 105.

Nurbana, A. (2015). Olah Air.

PJT1. 2014. Laporan Pemantauan Kualitas Air di Wilayah Sungai Brantas dan Bengawan Solo. Surabaya: 2015.

PJT1. 2015. Laporan Pemantauan Kualitas Air di Wilayah Sungai Brantas dan Bengawan Solo. Surabaya: 2016.

Rachmawati, A. A., & Azizah, R. 2005. Perbedaan Kadar BOD, COD, TSS, dan MPN Coliform pada Air Limbah, Sebelum dan Sesudah Pengolahan di RSUD Nganjuk. Jurnal Kesehatan Lingkungan, 99.

Ramadhani, E. 2016. Analisis Pencemaran Kualitas Air Sungai Bengawan Solo Akibat Limbah Industri di Kecamatan Kebakkramat Kabupaten Karanganyar. Skripsi. Surakarta: Universitas Muhammadiyah Surakarta.

Rencher, A. C., & Schaaljee, G. B. (2008). Linier Model in Statistical and Probabilistic Mathematics. USA: Second Edition, John Wiley and Sons, Inc.

Sari, R. P. 2016. Estimasi Model Regresi Nonparametrik Bi-response pada Data Longitudinal Berdasarkan Estimator Weighted Spline Truncated . Skripsi. Surabaya: Universitas Airlangga.

Sukadi, D. 1999. Pencemaran Sungai Akibat Buangan Limbah dan Pengaruhnya Terhadap BOD dan DO. Jurnal. Bandung: FPTK Institut Keguruan dan Ilmu Pendidikan Bandung. 1.

Walpole, R. E. 1997. Pengantar Statistika Edisi Ketiga. Jakarta: PT. Gramedia Pustaka Utama.

Wu, H. L., & Zhang, J.-T. (2006). Nonparametric Regression Methods for Longitudinal Data Analysis. Canada: A Sons John Wiley & Sons, Inc.

Wulandari, I., dan Budiantara, I. N. 2014. Analisis Faktor-Faktor yang Mempengaruhi Presentasi Penduduk Miskin dan Pengeluaran Perkapita Makanan di Jawa Timur menggunakan Regresi Nonparametrik Birespon Spline. Jurnal Sains dan Seni POMITS, 2337-3520.

ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA

SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P

Lampiran 1. Data BOD, COD, dan TSS 18 Titik WS Brantas di Sekitar

Lokasi Industri

SUBYEK Triwulan TSS (gr/l) BOD (gr/l) COD (gr/l) Dinas Pemotongan

Hewan Malang

2 0,177 0,8864 2,37 3 0,2748 0,3227 0 4 0,145 0,1536 0,4451

PT. Pindad 2 0 0,0314 0,1015 3 0 0,0177 0,06448 4 0 0,0773 0,2228

PT. Eka Mas Fortuna 2 0,0434 0,01175 0,033 3 0,0087 0,0202 0,04963 4 0,0131 0,02435 0,05795

Peternakan Babi

Sempulur

2 0,2812 0,2889 1,3 3 0,0526 0,1752 0,4712 4 0,1722 0,1507 0,5111

Peternakan Babi Delta 2 0,3515 0,7414 1,3838 3 0,163 0,0617 0,1939 4 0,0539 0,0661 0,1899

CV. Sartimbul 2 0,0433 0,1027 0,3587 3 0,148 0,09355 0,2494 4 0,273 1,047 3,2

Peternakan Babi

Hanjoyo

2 0,195 0,3089 1,05 3 0,357 0,1311 0,3232 4 0,832 0,7823 1,95

PT. Setia Kawan 2 0,0473 0,1664 0,4185 3 0,0468 0,1677 0,6423 4 0,0961 0,1198 0,3925

PT. Surya Zig Zag 2 0,1134 0,5963 2,13 3 0,03 0,01955 0,05899 4 0,0061 0,0102 0,02119

PT. Surya Pamenang 2 0,0224 0,02218 0,05471 3 0,0592 0,1018 0,3716 4 0,0225 0,0138 0,03963

UD. Sumberejo 2 1,774 0,3764 8,98 3 1,169 1,377 3 4 0,6964 0,5173 1,27

PT. Jaya Kertas 2 0,014 0,0081 0,03 3 0,072 0,082 0,2931 4 0,008 0,0097 0,0551

PT. Cheil Jedang 2 0,0036 0,03153 0,1196

ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA

SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P

3 0,044 0,0256 0,1055 4 0,016 0,01754 0,09603

PT. Ajinomoto

Indonesia

2 0,01 0,00293 0,00938 3 0,011 0,00292 0,01285 4 0,02 0,01428 0,02468

PT. Darmala 2 0,045 0,00977 0,04108 3 0,055 0,01294 0,04755 4 0,019 0,0174 0,06521

PT. Pakerin 2 0,164 0,09593 0,4233 3 0,004 0,01062 0,0361 4 0,08 0,0876 0,5898

PT. Sateliti Sriti 2 0,0095 0,00575 0,01752 3 0,0201 0,0058 0,0112 4 0,0199 0,0513 0,1447

PT. Tjiwi Kimia 2 0,03 0,00991 0,04014 3 0,004 0,01062 0,0361 4 0,102 0,0144 0,02787

ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA

SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P

Lampiran 2. Program Estimasi Model BOD dan COD dengan Pendekatan

Regresi Nonparametrik Birespon pada Data Longitudinal

Berdasarkan Estimator Spline Truncated Menggunakan Aplikasi

OSS-R

trun<-function(prediktor,knot,orde)

prediktor[prediktor<knot]<-knot

b<-(prediktor-knot)^orde

return(b)

quant<-function(prediktor,p)

r<-quantile(prediktor,seq(0,1,by=1/p))

return(r)

spline<-function(data)

t<-data[,1]

tbaru<-sort(unique(t))

alfa<-as.numeric(readline("Inputkan nilai alfa : "))

uji_korelasi<-cor.test(data[,2],data[,3],alternative="two.sided",method="pearson")

cat("==========================================================\n")

cat("\t\tUJI KORELASI\n")

cat("==========================================================")

print(uji_korelasi)

cat("==========================================================\n")

if(uji_korelasi$p.value>alfa)

ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA

SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P

cat("Tidak dapat digunakan analisis regresi birespon/n")

else

n<-as.numeric(readline("Inputkan banyak subyek : "))

P<-as.numeric(readline("Inputkan maksimum orde : "))

p<-matrix(0,(P^2),2)

p[,2]<-rep(c(1:P),P)

a<-rep(1,P)

for(i in 1:P)

a<-rep(i,P)

p[(P*(i-1)+1):(P*i),1]<-a

print(p)

nn<-length(t)

jp<-3

minimumGCV<-rep(0,(P^2))

for(m in 1:(P^2))

cat("\nORDE respon 1 :",p[m,1],"; ORDE respon 2 :",p[m,2],"\n")

cat("==================================================\n")

cat("KNOT\t\t MSE\t\t GCV\n")

cat("==================================================\n")

w1<-quant(tbaru,1+1)

y<-c(data[,2],data[,3])

ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA

SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P

MSE<-rep(0,15)

GCV<-rep(0,15)

v11<-matrix(0,nn,p[m,1]+1)

v12<-matrix(0,nn,p[m,2]+1)

for(i in 1:(p[m,1]+1))

v11[,i]<-data[,1]^(i-1)

for(i in 1:(p[m,2]+1))

v12[,i]<-data[,1]^(i-1)

v21<-matrix(0,nn,1)

v22<-matrix(0,nn,1)

for(j in 1:1)

v21[,j]<-trun(data[,1],w1[j+1],p[m,1])

for(j in 1:1)

v22[,j]<-trun(data[,1],w1[j+1],p[m,2])

XA<-cbind(v11,v21)

XB<-cbind(v12,v22)

XC<-matrix(0,nn,(p[m,2]+1+1))

XD<-matrix(0,nn,(p[m,1]+1+1))

A<-cbind(XA,XC)

B<-cbind(XD,XB)

ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA

SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P

X<-rbind(A,B)

betatopi<-solve(t(X)%*%X)%*%t(X)%*%y

ytopi<-X%*%betatopi

Ah<-X%*%solve(t(X)%*%X)%*%t(X)

MSE[1]<-(t(y-ytopi)%*%(y-ytopi))/(2*nn)

GCV[1]<-MSE[1]/(1-((1/(2*nn))*sum(diag(Ah))))^2

cat(t(w1[2:(1+1)]),"\t\t",MSE[1],"\t",GCV[1],"\n")

cat("--------------------------------------------------\n")

K<-1

repeat

K<-K+1

w<-quant(tbaru,K+1)

y<-c(data[,2],data[,3])

v11<-matrix(0,nn,p[m,1]+1)

v12<-matrix(0,nn,p[m,2]+1)

for(i in 1:(p[m,1]+1))

v11[,i]<-data[,1]^(i-1)

for(i in 1:(p[m,2]+1))

v12[,i]<-data[,1]^(i-1)

v21<-matrix(0,nn,K)

v22<-matrix(0,nn,K)

for(j in 1:K)

ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA

SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P

v21[,j]<-trun(data[,1],w[j+1],p[m,1])

for(j in 1:K)

v22[,j]<-trun(data[,1],w[j+1],p[m,2])

XA<-cbind(v11,v21)

XB<-cbind(v12,v22)

XC<-matrix(0,nn,(p[m,2]+K+1))

XD<-matrix(0,nn,(p[m,1]+K+1))

A<-cbind(XA,XC)

B<-cbind(XD,XB)

X<-rbind(A,B)

betatopi<-solve(t(X)%*%X)%*%t(X)%*%y

ytopi<-X%*%betatopi

Ah<-X%*%solve(t(X)%*%X)%*%t(X)

MSE[K]<-(t(y-ytopi)%*%(y-ytopi))/(2*nn)

GCV[K]<-MSE[K]/(1-((1/(2*nn))*sum(diag(Ah))))^2

if(GCV[K]>GCV[K-1])break

cat(t(w[2:(K+1)]),"\t\t",MSE[K],"\t",GCV[K],"\n")

cat("--------------------------------------------------\n")

g<-GCV[K-1]

print(g)

minimumGCV[m]<-g

print(minimumGCV)

for(a in 1:(P^2))

ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA

SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P

if(minimumGCV[a]==min(minimumGCV))

kecilGCV<-minimumGCV[a]

pmax<-a

cat("Nilai GCV minimum adalah",kecilGCV,"\n")

cat("dengan orde respon 1 :",p[pmax,1],"\n")

cat("dan orde respon 2 :",p[pmax,2],"\n")

KO<-as.numeric(readline("Input jumlah knot maksimum : "))

w1<-rep(0,KO)

for(i in 1:KO)

cat("Input titik knot optimum ke-",i)

w1[i]<-as.numeric(readline(" = "))

v11<-matrix(0,nn,p[pmax,1]+1)

v12<-matrix(0,nn,p[pmax,2]+1)

for(i in 1:(p[pmax,1]+1))

v11[,i]<-data[,1]^(i-1)

for(i in 1:(p[pmax,2]+1))

v12[,i]<-data[,1]^(i-1)

v21<-matrix(0,nn,KO)

ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA

SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P

v22<-matrix(0,nn,KO)

for(j in 1:KO)

v21[,j]<-trun(data[,1],w1[j],p[pmax,1])

for(j in 1:KO)

v22[,j]<-trun(data[,1],w1[j],p[pmax,2])

XA<-cbind(v11,v21)

XB<-cbind(v12,v22)

XC<-matrix(0,nn,(p[pmax,2]+KO+1))

XD<-matrix(0,nn,(p[pmax,1]+KO+1))

A<-cbind(XA,XC)

B<-cbind(XD,XB)

XX<-rbind(A,B)

betatopi<-solve(t(XX)%*%XX)%*%t(XX)%*%y

ytopi<-XX%*%betatopi

error<-y-ytopi

ER<-matrix(0,nn,3)

ER[,1]<-error[1:nn]

ER[,2]<-error[(nn+1):(2*nn)]

c<-rep(0,(nn+1))

c[1]<-0

for(i in 1:n)

c[i+1]<-jp*i

ER[(c[i]+1):c[i+1],3]<-rep(i,jp)

ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA

SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P

hetero<-boxM(ER[,-3],ER[,3])

hettes<-hetero$p.value

print(hetero)

print(hettes)

if(hettes<alfa)

c<-rep(0,(nn+1))

c[1]<-0

vr1<-rep(0,nn)

vr2<-rep(0,nn)

cv<-rep(0,nn)

for(i in 1:n)

c[i+1]<-jp*i

da<-cbind(ER[(c[i]+1):c[i+1],1],ER[(c[i]+1):c[i+1],2])

vr<-var(da)

vr1[(c[i]+1):c[i+1]]<-rep(vr[1,1],jp)

vr2[(c[i]+1):c[i+1]]<-rep(vr[2,2],jp)

cv[(c[i]+1):c[i+1]]<-rep(vr[1,2],jp)

A<-diag(vr1,nn)

B<-diag(cv,nn)

C<-B

D<-diag(vr2,nn)

AA<-cbind(A,B)

BB<-cbind(C,D)

W<-rbind(AA,BB)

ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA

SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P

else

cv<-rep(0,nn)

da<-cbind(error[,1],error[,2])

vr<-var(da)

A<-diag(vr[1,1],nn)

B<-diag(vr[1,2],nn)

C<-B

D<-diag(vr[2,2],nn)

AA<-cbind(A,B)

BB<-cbind(C,D)

W<-rbind(AA,BB)

minimumGCV<-rep(0,(P^2))

for(m in 1:(P^2))

cat("\nORDE respon 1 :",p[m,1],"; ORDE respon 2 :",p[m,2],"\n")

cat("==================================================\n")

cat("KNOT\t\t MSE\t\t GCV\n")

cat("==================================================\n")

w1<-quant(tbaru,1+1)

y<-c(data[,2],data[,3])

MSE<-rep(0,8)

GCV<-rep(0,8)

v11<-matrix(0,nn,p[m,1]+1)

v12<-matrix(0,nn,p[m,2]+1)

ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA

SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P

for(i in 1:(p[m,1]+1))

v11[,i]<-data[,1]^(i-1)

for(i in 1:(p[m,2]+1))

v12[,i]<-data[,1]^(i-1)

v21<-matrix(0,nn,1)

v22<-matrix(0,nn,1)

for(j in 1:1)

v21[,j]<-trun(data[,1],w1[j+1],p[m,1])

for(j in 1:1)

v22[,j]<-trun(data[,1],w1[j+1],p[m,2])

XA<-cbind(v11,v21)

XB<-cbind(v12,v22)

XC<-matrix(0,nn,(p[m,2]+1+1))

XD<-matrix(0,nn,(p[m,1]+1+1))

A<-cbind(XA,XC)

B<-cbind(XD,XB)

X<-rbind(A,B)

betatopi<-solve(t(X)%*%solve(W)%*%X)%*%t(X)%*%solve(W)%*%y

ytopi<-X%*%betatopi

ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA

SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P

Ah<-X%*%solve(t(X)%*%solve(W)%*%X)%*%t(X)%*%solve(W)

MSE[1]<-(t(y-ytopi)%*%(y-ytopi))/(2*nn)

GCV[1]<-MSE[1]/(1-((1/(2*nn))*sum(diag(Ah))))^2

cat(t(w1[2:(1+1)]),"\t\t",MSE[1],"\t",GCV[1],"\n")

cat("--------------------------------------------------\n")

K<-1

repeat

K<-K+1

w1<-quant(tbaru,K+1)

y<-c(data[,2],data[,3])

v11<-matrix(0,nn,p[m,1]+1)

v12<-matrix(0,nn,p[m,2]+1)

for(i in 1:(p[m,1]+1))

v11[,i]<-data[,1]^(i-1)

for(i in 1:(p[m,2]+1))

v12[,i]<-data[,1]^(i-1)

v21<-matrix(0,nn,K)

v22<-matrix(0,nn,K)

for(j in 1:K)

v21[,j]<-trun(data[,1],w1[j+1],p[m,1])

for(j in 1:K)

ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA

SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P

v22[,j]<-trun(data[,1],w1[j+1],p[m,2])

XA<-cbind(v11,v21)

XB<-cbind(v12,v22)

XC<-matrix(0,nn,(p[m,2]+K+1))

XD<-matrix(0,nn,(p[m,1]+K+1))

A<-cbind(XA,XC)

B<-cbind(XD,XB)

X<-rbind(A,B)

betatopi<-solve(t(X)%*%solve(W)%*%X)%*%t(X)%*%solve(W)%*%y

ytopi<-X%*%betatopi

Ah<-X%*%solve(t(X)%*%solve(W)%*%X)%*%t(X)%*%solve(W)

MSE[K]<-(t(y-ytopi)%*%(y-ytopi))/(2*nn)

GCV[K]<-MSE[K]/(1-((1/(2*nn))*sum(diag(Ah))))^2

if(GCV[K]>GCV[K-1])break

cat(t(w1[2:(K+1)]),"\t\t",MSE[K],"\t",GCV[K],"\n")

cat("--------------------------------------------------\n")

g<-GCV[K-1]

print(g)

minimumGCV[m]<-g

print(minimumGCV)

for(a in 1:(P^2))

if(minimumGCV[a]==min(minimumGCV))

ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA

SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P

kecilGCV<-minimumGCV[a]

pmax<-a

cat("Nilai GCV minimum adalah",kecilGCV,"\n")

cat("dengan orde respon 1 :",p[pmax,1],"\n")

cat("dan orde respon 2 :",p[pmax,2],"\n")

KO<-as.numeric(readline("Input jumlah knot maksimum : "))

w<-rep(0,KO)

for(i in 1:KO)

cat("Input titik knot optimum ke-",i)

w[i]<-as.numeric(readline(" = "))

v11<-matrix(0,nn,p[pmax,1]+1)

v12<-matrix(0,nn,p[pmax,2]+1)

for(i in 1:(p[pmax,1]+1))

v11[,i]<-data[,1]^(i-1)

for(i in 1:(p[pmax,2]+1))

v12[,i]<-data[,1]^(i-1)

v21<-matrix(0,nn,KO)

v22<-matrix(0,nn,KO)

for(j in 1:KO)

ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA

SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P

v21[,j]<-trun(data[,1],w[j],p[pmax,1])

for(j in 1:KO)

v22[,j]<-trun(data[,1],w[j],p[pmax,2])

XA<-cbind(v11,v21)

XB<-cbind(v12,v22)

XC<-matrix(0,nn,(p[pmax,2]+KO+1))

XD<-matrix(0,nn,(p[pmax,1]+KO+1))

A<-cbind(XA,XC)

B<-cbind(XD,XB)

XX<-rbind(A,B)

betatopi<-solve(t(XX)%*%solve(W)%*%XX)%*%t(XX)%*%solve(W)%*%y

cat("\nNilai betatopi untuk respon 1 adalah\n")

for(a in 1:(1+p[pmax,1]+KO))

cat((a-1),"\t",betatopi[a],"\n")

cat("Nilai betatopi untuk respon 2 adalah\n")

for(b in (2+p[pmax,1]+KO):(length(betatopi)))

cat((b-(2+p[pmax,1]+KO)),"\t",betatopi[b],"\n")

ytopi<-XX%*%betatopi

ytopisatu<-ytopi[1:nn]

ytopidua<-ytopi[(nn+1):(2*nn)]

ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA

SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P

MSEakhir<-(t(y-ytopi)%*%(y-ytopi))/(2*nn)

JKT<-t(y-(mean(y)))%*%(y-(mean(y)))

JKG<-t(y-ytopi)%*%(y-ytopi)

RK<-1-(JKG/JKT)

xx<-c(t,t)

AA<-cbind(xx,y,ytopi)

cat("\nHasil Estimasinya adalah\n")

cat("=================================\n")

kolom<-cbind(t,ytopisatu,ytopidua)

est<-unique(kolom[order(t),1:3])

print(est)

cat("=================================\n")

cat("\n\nMSE = ",MSEakhir,"\n")

cat("R-square = ",RK,"\n")

TSS<-sort(data[,1])

BOD<-data[,2]

COD<-data[,3]

MSEBOD<-(t(BOD-ytopisatu)%*%(BOD-ytopisatu))/nn

MSECOD<-(t(COD-ytopidua)%*%(COD-ytopidua))/nn

print(MSEBOD)

print(MSECOD)

sBOD<-BOD[order(data[,1])]

sCOD<-COD[order(data[,1])]

sbbtopi<-ytopisatu[order(data[,1])]

stbtopi<-ytopidua[order(data[,1])]

plot(TSS,sBOD,xlab="TSS",ylab="BOD",type="p")

lines(TSS,sbbtopi,xlab="TSS",ylab="BOD",col="red",lwd=3)

win.graph()

ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA

SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P

plot(TSS,sCOD,xlab="TSS",ylab="COD",type="p")

lines(TSS,stbtopi,xlab="TSS",ylab="COD",col="red",lwd=3)

ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA

SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P

Lampiran 3. Output Program Estimasi Model BOD dan COD dengan Pendekatan Regresi Nonparametrik Birespon pada Data Longitudinal Berdasarkan Estimator Spline Truncated Menggunakan Aplikasi OSS-R

> spline(Dataset)

Inputkan nilai alfa : 0.05

==========================================================

UJI KORELASI

==========================================================

Pearson's product-moment correlation

data: data[, 2] and data[, 3]

t = 5.4249, df = 52, p-value = 1.532e-06

alternative hypothesis: true correlation is not equal to 0

95 percent confidence interval:

0.3973797 0.7484551

sample estimates:

cor

0.6011738

==========================================================

Inputkan banyak subyek : 18

Inputkan maksimum orde : 2

[,1] [,2]

[1,] 1 1

[2,] 1 2

[3,] 2 1

[4,] 2 2

ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA

SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P

ORDE respon 1 : 1 ; ORDE respon 2 : 1

==================================================

KNOT MSE GCV

==================================================

0.04995 0.2479039 0.2779269

--------------------------------------------------

[1] 0.2779269

ORDE respon 1 : 1 ; ORDE respon 2 : 2

==================================================

KNOT MSE GCV

==================================================

0.04995 0.1860781 0.2127649

--------------------------------------------------

0.02243333 0.1096 0.1605268 0.1910402

--------------------------------------------------

0.019225 0.04995 0.16375 0.1501151 0.1860923

--------------------------------------------------

[1] 0.1860923

ORDE respon 1 : 2 ; ORDE respon 2 : 1

==================================================

KNOT MSE GCV

==================================================

0.04995 0.2398954 0.2743006

--------------------------------------------------

[1] 0.2743006

ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA

SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P

ORDE respon 1 : 2 ; ORDE respon 2 : 2

==================================================

KNOT MSE GCV

==================================================

0.04995 0.1780696 0.2077004

--------------------------------------------------

0.02243333 0.1096 0.155206 0.1884967

--------------------------------------------------

0.019225 0.04995 0.16375 0.1453917 0.1840114

--------------------------------------------------

[1] 0.1840114

[1] 0.2779269 0.1860923 0.2743006 0.1840114

Nilai GCV minimum adalah 0.1840114

dengan orde respon 1 : 2

dan orde respon 2 : 2

Input jumlah knot maksimum : 3

Input titik knot optimum ke- 1 = 0.019225

Input titik knot optimum ke- 2 = 0.04995

Input titik knot optimum ke- 3 = 0.16375

Box's M-test for Homogeneity of Covariance Matrices

data: ER[, -3]

Chi-Sq (approx.) = 170.29, df = 51, p-value = 9.259e-15

[1] 9.259289e-15

ORDE respon 1 : 1 ; ORDE respon 2 : 1

ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA

SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P

==================================================

KNOT MSE GCV

==================================================

0.04995 0.3105255 0.3481324

--------------------------------------------------

[1] 0.3481324

ORDE respon 1 : 1 ; ORDE respon 2 : 2

==================================================

KNOT MSE GCV

==================================================

0.04995 0.7021605 0.8028624

--------------------------------------------------

0.02243333 0.1096 0.4200848 0.4999357

--------------------------------------------------

0.019225 0.04995 0.16375 0.3132896 0.3883739

--------------------------------------------------

0.01382 0.04336 0.0752 0.1806 0.164626 0.2127643

--------------------------------------------------

0.01135 0.02243333 0.04995 0.1096 0.26 0.1430465 0.1929118

--------------------------------------------------

[1] 0.1929118

ORDE respon 1 : 2 ; ORDE respon 2 : 1

==================================================

KNOT MSE GCV

==================================================

0.04995 0.4659563 0.5327825

ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA

SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P

--------------------------------------------------

0.02243333 0.1096 0.3203815 0.3812805

--------------------------------------------------

0.019225 0.04995 0.16375 0.2993558 0.3711007

--------------------------------------------------

0.01382 0.04336 0.0752 0.1806 0.2607049 0.3369376

--------------------------------------------------

[1] 0.3369376

ORDE respon 1 : 2 ; ORDE respon 2 : 2

==================================================

KNOT MSE GCV

==================================================

0.04995 0.724334 0.8448632

--------------------------------------------------

0.02243333 0.1096 0.4435665 0.5387088

--------------------------------------------------

0.019225 0.04995 0.16375 0.1564189 0.1979677

--------------------------------------------------

[1] 0.1979677

[1] 0.3481324 0.1929118 0.3369376 0.1979677

Nilai GCV minimum adalah 0.1929118

dengan orde respon 1 : 1

dan orde respon 2 : 2

Input jumlah knot maksimum : 5

Input titik knot optimum ke- 1 = 0.01135

Input titik knot optimum ke- 2 = 0.022433

Input titik knot optimum ke- 3 = 0.04995

ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA

SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P

Input titik knot optimum ke- 4 = 0.1096

Input titik knot optimum ke- 5 = 0.26

Nilai betatopi untuk respon 1 adalah

0 0.005966084

1 -0.2152434

2 1.633303

3 1.048057

4 -1.215545

5 1.189208

6 -2.190887

Nilai betatopi untuk respon 2 adalah

0 0.03365039

1 -5.003928

2 326.9218

3 -372.0223

4 266.964

5 -302.6027

6 63.45409

7 21.44725

Hasil Estimasinya adalah

=================================

t ytopisatu ytopidua

[1,] 0.0000 0.005966084 0.03365039

[2,] 0.0000 0.005966084 0.03365039

[3,] 0.0000 0.005966084 0.03365039

[4,] 0.0036 0.005191208 0.01987316

ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA

SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P

[5,] 0.0040 0.005105111 0.01886543

[6,] 0.0040 0.005105111 0.01886543

[7,] 0.0061 0.004653099 0.01529119

[8,] 0.0080 0.004244137 0.01454196

[9,] 0.0087 0.004093467 0.01486093

[10,] 0.0095 0.003921272 0.01561777

[11,] 0.0100 0.003813650 0.01630329

[12,] 0.0110 0.003598407 0.01816472

[13,] 0.0131 0.006004675 0.02306266

[14,] 0.0140 0.007280929 0.02505954

[15,] 0.0160 0.010117047 0.02923547

[16,] 0.0190 0.014371225 0.03482284

[17,] 0.0199 0.015647478 0.03634075

[18,] 0.0200 0.015789284 0.03650490

[19,] 0.0201 0.015931090 0.03666814

[20,] 0.0224 0.019192626 0.04017381

[21,] 0.0225 0.019404652 0.04031661

[22,] 0.0300 0.037900526 0.06365063

[23,] 0.0300 0.037900526 0.06365063

[24,] 0.0433 0.070699876 0.16640591

[25,] 0.0434 0.070946487 0.16747581

[26,] 0.0440 0.072426157 0.17398835

[27,] 0.0450 0.074892274 0.18519757

[28,] 0.0468 0.079331284 0.20649235

[29,] 0.0473 0.080564342 0.21266271

[30,] 0.0526 0.090413565 0.28276358

[31,] 0.0539 0.092039308 0.29978663

[32,] 0.0550 0.093414937 0.31397759

ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA

SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P

[33,] 0.0592 0.098667337 0.36636401

[34,] 0.0720 0.114674653 0.50844901

[35,] 0.0800 0.124679225 0.58381713

[36,] 0.0961 0.144813426 0.70416783

[37,] 0.1020 0.152191798 0.73779155

[38,] 0.1134 0.170967304 0.78775230

[39,] 0.1450 0.248064338 0.89259353

[40,] 0.1480 0.255383677 0.90075261

[41,] 0.1630 0.291980370 0.93688103

[42,] 0.1640 0.294420150 0.93901303

[43,] 0.1722 0.314426342 0.95519143

[44,] 0.1770 0.326137284 0.96358312

[45,] 0.1950 0.370053317 0.98795814

[46,] 0.2730 0.531874594 0.96777661

[47,] 0.2748 0.532322601 0.96581762

[48,] 0.2812 0.533915514 0.95907075

[49,] 0.3515 0.551412673 0.90740270

[50,] 0.3570 0.552781583 0.90509558

[51,] 0.6964 0.637255775 1.24993670

[52,] 0.8320 0.671005629 1.65579163

[53,] 1.1690 0.754882479 3.32732523

[54,] 1.7740 0.905462579 8.70017374

=================================

MSE = 0.1430465

R-square = 0.8613784

ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA

SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P

ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA

SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P