pemodelan hybrid arima (autoregressive integrated moving
TRANSCRIPT
Prosiding Statistika http://dx.doi.org/10.29313/.v7i1.25503
33
Pemodelan Hybrid ARIMA (Autoregressive Integrated Moving
Average) β ANN (Artificial Neural Network) pada Data Inflasi
Indonesia Tahun 2009 - 2020
Rahma Kamadewi*, Anneke Iswani Achmad
Prodi Statistika, Fakultas Matematika dan Ilmu Pengetahuan Alam,
Universitas Islam Bandung, Indonesia.
*[email protected], [email protected]
Abstract. ARIMA model is one of the models suitable for predicting time series data. In the ARIMA model, the problem of linearity is not considered so that
sometimes the ARIMA model still produces quite large errors. In an effort to
improve the accuracy of the forecasting model, a hybrid method was carried out
where this method combines two methods, namely ARIMA and ANN. ANN is a time series analysis method which contains nonlinear components from
ARIMA. The data used is secondary data recorded by Bank Indonesia for 2009
to 2020. Where inflation is a continuous increase in prices within a certain period of time. From the results of the analysis using the ARIMA model (1,1,0) gives
quite good results with an MSE value of 0.566139. Because the resulting residue
still contains nonlinearity, the ARIMA-ANN hybrid is carried out so that a more accurate MSE value is obtained at 0.4591. Thus, it can be seen that the ARIMA-
ANN hybrid model is a better model than the ARIMA model (1,1,0) because it
produces a smaller MSE value.
Keywords: ARIMA, ANN, Hybrid ARIMA-ANN, Inflation, MSE.
Abstrak. Model ARIMA merupakan salah satu model yang cocok untuk
meramalkan data time series. Pada model ARIMA permasalahan tentang
kelinearan tidak diperhatikan sehingga menjadikan model ARIMA terkadang masih menghasilan error yang cukup besar. Dalam upaya untuk meningkatkan
akurasi model peramalan maka dilakukan suatu metode hybrid dimana metode
ini menggabungkan dua metode yaitu ARIMA dengan ANN. ANN merupakan
metode analisis time series yang mana berisikan komponen nonlinier dari ARIMA. Data yang digunakan adalah data sekunder hasil pencatatan Bank
Indonesia untuk tahu 2009 sampai 2020. Dimana inflasi merupakan kenaikan
harga secara terus menerus dalam jangka waktu tertentu. Dari hasil analisis dengan menggunakan model ARIMA (1,1,0) memberikan hasil yang cukup baik
dengan nilai MSE sebesar 0,566139. Karena residu yang dihasilkan masih
mengandung nonlinier, maka dilakukan hybrid ARIMA-ANN sehingga didapat nilai MSE yang lebih akurat sebesar 0,4591. Dengan demikian dapat diketahui
bahwa model hybrid ARIMA-ANN merupakan model yang lebih baik
dibandingkan model ARIMA (1,1,0) karena menghasilkan nilai MSE yang lebih
kecil.
Kata Kunci: ARIMA, ANN, Hybrid ARIMA-ANN, Inflasi, MSE.
34 | Rahma Kamadewi, et al.
Volume 7, No. 1, Tahun 2021
1. Pendahuluan
Menurut Pramita (2007), model ARIMA adalah model univariate, sehingga model ini cocok digunakan jika observasi dari time series secara statistik tidak berhubungan satu sama lain.
Kekurangan dari model ARIMA adalah residual yang dihasilkan masih terdapat unsur nonlinear.
Zhang (2003), dalam penelitiannya mengatakan bahwa model ARIMA memerlukan model yamg
dapat menangkap pola-pola yang nonlinear, yaitu salah satunya dengan menggunakan model Artificial Neural Network (ANN). Dimana ANN merupakan salah satu pemprosesan informasi yang
mempunyai karakteristik mirip jaringan syaraf biologis pada manusia. Keuntungan utama dari ANN
adalah bisa memodelkan data yang memiliki unsur nonlinear. Salah satu algoritma yang digunakan pada ANN yaitu algoritma backpropagation.
Menurut Wang, dkk (2012) dengan menggunakan ANN, tidak membutuhkan bentuk model
yang tetap melainkan model dengan adaptif dibentuk berdasarkan model yang ditampilkan dari data.
Sehingga gabungan antara metode ARIMA dan ANN akan memberikan hasil permalan yang lebih akurat dibandingkan hanya dengan menggunakan satu metode saja. Inflasi dari tahun ke tahun
menjadi suatu masalah yang cukup pelik. menurut Dornbucsh, dkk (1997) inflasi dapat diartikan
sebagai kejadian ekonomi yang sering terjadi meskipun kita tidak pernah menghendaki. Biasanya informasi mengenai inflasi disajikan dalam bentuk laju inflasi.
Dalam penelitian ini, akan diterapkan model hybrid ARIMA-ANN pada data inflasi Indonesia yang
kemudian akan dibandingkan dengan model peramalan ARIMA untuk melihat model dengan akurasi terbaik berdasarkan prediksi peramalannya dengan menggunakan nilai MSE. Selanjutnta tujuan
dalam penelitian ini adalah:
1. Untuk mendapatkan model ARIMA untuk data inflasi Indonesia bulan Januari 2009 sampai
dengan bulan Juli 2020. 2. Untuk memperoleh model ANN untuk data inflasi Indonesia bulan Januari 2009 sampai
dengan bulan Juli 2020.
3. Untuk mengetahui pemodelan hybrid ARIMA-ANN untuk data inflasi Indonesia bulan Januari 2009 sampai dengan bulan Juli 2020.
4. Untuk mengetahui model peramalan yang paling cocok dengan menggunakan nilai MSE
terkecil untuk data inflasi Indonesia bulan Januari 2009 sampai dengan bulan Juli 2020.
2. Landasan Teori
Analisis Data Deret Waktu
Menurut Markidakis, dkk (1999) Analisis data deret waktu merupakan salah satu prosedur statistika yang diterapkan untuk meramalkan struktur probabilitas keadaan yang akan datang dalam
rangka pengambilan keputusan. Dasar deret waktu adakah pengamatan sekarang (Xt) yang
dipengaruhi oleh satu atau beberapa pengamatan sebelumnya (Xt-k) dimana t adalah indeks waktu dari urutan pengamatan stasioner.
Membagi Data
Sebelum melakukan analisis, data terlebih dahulu dibagi menjadi dua yaitu data training
digunakan untuk membangun data, dan data testing untuk validasi model. Panjang data training dievaluasi dengan menghitung nilai koefisien Hurst sebagai berikut:
2log/log minmax n
S
RRH
d
β¦(1)
Ketika nilai dari koefisien Hurst H > 0.5, maka panjang data training sudah cukup dan sisanya
ditetapkan sebagai data testing.
Stasioneritas Suatu data dapat dikatakan stasioner apabila pola data tersebut berada pada kesetimbangan
disekitar nilai rata-rata yang konstan dan varians disekitar rata-rata tersebut konstan selama waktu
tertentu (Makridakis, 1999).
Augmented Dickey Fuller (ADF Test)
Salah satu cara untuk menguji apakah data stasioner dalam rata-rata adalah dengan cara
Pemodelan Hybrid ARIMA (Autoregressive Integratedβ¦| 35
Statistika
menggunakan uji akar unit atau yang biasa disebut sebagai Augmented Dickey Fuller Test (ADF
Test). Hipotesis yang digunakan:
π―π : πΉ = π (data tidak stasioner dalam rata-rata)
π―π βΆ πΉ β π (data stasioner dalam rata-rata)
Statistik Uji yang digunakan yaitu:
π =πΏ
π ποΏ½οΏ½
β¦.(2)
Dengan kriteria uji tolak π»0 jika π hasil perhitungan lebih besar dari π tabel atau jika probabilitas
hasil perhitungan lebih kecil daripada nilai πΌ yang sudah ditentukan.
Transformasi Kuasa Box Cox Transformasi Box-Cox digunakan untuk mengetahui kestasioneran data berdasarkan nilai varians.
Rumus matematis transformasi tersebut sebagai berikut:
π(π‘) =ππ‘
πβ1
π β¦(3)
Tabel dibawah ini adalah beberapa nilai π dengan transformasinya.
Tabel 1. Transformasi Box Cox
Nilai Transformasi
-1.0 1
ππ‘
-0.5 1
βππ‘
0.0 ln(Zt)
0.5 βππ‘
1.0 Zt (tidak ada transformasi)
Metode Box Jenkins ARIMA Model umum untuk ARIMA (p,d,q) adalah:
ππ(π΅)(1 β π΅)πππ‘ = ππ(π΅)ππ‘ β¦(4)
dimana orde-orde modelnya diperkirakan berdasarkan plot ACF dan PACF dari data yang telah
stasioner dalam rata-rata dan varians. 1. Identifikasi Model
Tahap identifikasi model adalah memperkirakan model yang terjadi pada deret waktu berdasarkan
pola data apakah data sudah stasioner atau mengandung unsur musiman.
2. Penaksiran Parameter Setelah melakukan identifikasi model, kemudian parameter-parameter yang didapatkan di uji
keberartiannya dengan hipotesis:
:0H Parameter SARIMA tidak signifikan dalam model.
:1H Parameter SARIMA signifikan dalam model.
Statistik uji :
)(ParameterSE
Parametert
β¦(5)
Kriteria keputusan: tolak H0 jika df
hitung tt,
2
, dengan derajat bebas df = n β 1, n adalah banyaknya
data. 3. Diagnostik Model
Model yang telah didapatkan di uji diagnostik dengan uji Ljung-Box dengan hipotesis:
0: 210 kH , (tidak terdapat autokorelasi residual)
:1H minimal terdapat satu 0k , (terdapat autokorelasi residual)
36 | Rahma Kamadewi, et al.
Volume 7, No. 1, Tahun 2021
Statistik uji:
πΏπ΅ = π(π + 2) βππ
2
πβππΎπ=1 β¦(6)
Jika πΏπ΅ < π(πΌ;πΎβπβπ)2 atau π β π£πππ’π > πΌ maka H0 diterima, artinya residual independen.Selain
itu, residu dari model diuji kelinearannya dengan melihat periodogram kumulatifnya dimana ketika
titik-titik garis nilai Cp membentuk garis yang hampir linear mengikuti garis yang terbentuk melalui
titik (0,0) dan (0.5,1), artinya residunya tidak linear.
Pemilihan Model Terbaik
Untuk memilih model terbaik, digunakan nilai Aikakeβs information criterion (AIC) dengan
persamaan:
π΄πΌπΆ = ππ (β ππ‘
2ππ‘=1
π) +
2π
π β¦(7)
dimana model terbaik adalah model dengan nilai AIC minimum.
ANN (Artificial Neural Network) Menurut Zhang (2003), ANN (Artificial Neural Network) adalah suatu model yang menangkap
pola-pola nonlinear pada data time series. ANN mempresentasikan cara kerja dari otak manusia
yang selalu melakukan proses pembelajaran. Didalam ANN terdapat tiga elemen yang berperan penting yaitu:
1. Arsitektur jaringan beserta hubungan anar neuron.
2. Algoritma pembelajaran yang berfungsi untuk penggunaan penemuan bobot-bobot jaringan.
3. Fungsi dari aktivasi yang digunakan.
Bentuk umum dari model ANN adalah sebagai berikut:
οΏ½οΏ½ = π0 [π€0 + β (π€π1πβ(π£0 + β π£πππ₯π1π=1 ))1
π=1 ] β¦(8)
Pelatihan Backpropagation
Backpropagation merupakan algoritma yang paling sering digunakan pada ANN khususnya perceptron untuk mengubah bobot-bobot yang terhubung dengan neuron pada lapisan
tersembunyi dengan banyak lapisan. Dalam backpropagation ada tiga Langkah yang digunakan
yaitu:
1. Feedforward dari pola input training. 2. Backpropagation dari error yang terhubung.
3. Penyesuaian nilai bobot.
Model Hybrid ARIMA-ANN Hybrid adalah kombinasi dua atau lebih system dalam satu fungsi, dalam hal ini adalah
kombinasi antara ARIMA dengan ANN. Persamaan untuk model hybrid yaitu sebagai berikut:
π¦οΏ½οΏ½ = ποΏ½οΏ½ + ποΏ½οΏ½ β¦(9)
Dimana ποΏ½οΏ½ menunjukkan nilai ramalan ARIMA pada waktu t dan ππ‘ menunjukkan nilai ramalan dari
ANN.
Ukuran Akurasi Peramalan
Salah satu ukuran yang digunakan untuk mengukur ketepatan adalah MSE, dengan persamaan:
πππΈ =1
πβ (π¦π β π¦οΏ½οΏ½)
2ππ=1 β¦(10)
Inflasi
Menurut Boediono (1985), Inflasi dapat diartikan sebagai kecenderungan kenaikan harga secara umum dan terus menerus. Kenaikan harga pada satu atau dua barang saja tidak bisa disebut inflasi,
kenaikan harga dapat dikatakan sebagai inflasi jika kenaikan tersebut meluas kepada sebagian besar
Pemodelan Hybrid ARIMA (Autoregressive Integratedβ¦| 37
Statistika
harga lainnya. Syarat adanya kecenderungan kenaikan secara terus menerus juga perlu menjadi
perhatian.
3. Hasil Penelitian dan Pembahasan
Data penelitian merupakan data inflasi Indonesia periode Januari 2009 sampai Juli 2020 yaitu
sebanyak 139 pengamatan. Data tersebut kemudian di plotkan sehingga didapatkan sebagai berikut:
Gambar 1. Plot Data Tingkat Inflasi Periode Bulan Januari 2009-Juli 2020.
Berdasarkan teori yang sudah dibahas pada sebelumnya, terlihat bahwa plot data inflasi Indonesia menunjukan adanya ketidakstasioneran baik dalam varians maupun rata-rata.
Model akan di bangun dengan menggunakan 125 data yaitu data inflasi periode Januari
2009 sampai Mei 2019. Berdasarkan hasil output software R, didapatkan nilai koefisien Hurst
sebesar 0,88091 yang artinya 125 data training sudah cukup untuk membangun model, da sisanya 11 data akan digunakan sebagai data testing.Kemudian, dilakukan uji stasioneritas
pada varians dengan menggunakan pengujian box-cox. Dengan software matlab didapatkan
hasil sebagai berikut:
Gambar 2. Plot Box-Cox Data Inflasi
Dari Gambar 2, karena nilai π = 0, maka transformasi yang digunakan adalah ln(ππ‘).
Data hasil transformasi diuji kembali dan didapatkan nilai π = 1 maka dapat dikatakan bahwa
data sudah stasioner dalam varians.
Selanjutnya dilakukan uji ADF pada data yang telah stasioner dalam varian. Dengan
πΌ = 5% menggunakan software R didapatkan hasil output yaitu nilai π β π£πππ’π = 0,1128 >0,05 yang berarti data tidak stasioner dalam rata-rata sehingga perlu dilakukan differencing.
Data hasil differencing kemudian diuji kembali dan didapakna hasil p-value = 0,01 < 0,05.
Sehingga dapat disimpulkan bahwa data sudah stasioner dalam rata-rata. Setelah data stasioner dalam rata-rata dan varians,tahap indentifikasi model dilakukan
dengan melihat plot ACF dan PACF sebagai berikut:
38 | Rahma Kamadewi, et al.
Volume 7, No. 1, Tahun 2021
Gambar 3. Plot ACF dan PACF data Inflasi
Dari gambar diatas terlihat bahwa pada plot ACF lag ke-1 keluar dari batas signifikansi dan
setelah lag ke-1 mengalami cutoff (turun drastis) kemudian pada lag ke-12 keluar dari batas
signifikansi. Selanjutnya pada plot PACF terlihat mengalami cutoff setelah lag ke-1, kemudian pada lag ke-1 dan ke-2 keluar dari batas signifikansi, lalu pada lag ke-12 juga keluar dari batas
signifikansi. Dari hasil pengamatan pada plot ACF dan PACF tersebut, tidak terindikasi adanya
pola musiman. Dari beberapa model penduga, didapatkan model ARIMA (1,1,0) sebagai model
terbaik karena semua parameternya signifikan dan menghasilkan nilai AIC paling kecil.
Tabel 2. Estimasi dan Pengujian Parameter Model-model ARIMA
Model Estimasi
Parameter
t-statistik Keputusan AIC
(1,1,0) π1 = 0,3045 3,5407 Signifikan -
532,07
Sehingga didapatkan model ARIMA terbaik untuk meramalkan data inflasi adalah
sebagai berikut:
ln(οΏ½οΏ½π‘) = 1,3045ln(ππ‘β1) β 0,3045ln (ππ‘β2) + ππ‘
Hasil diagnostik model dengan menggunakan 10 lag didapatkan nilai probabilitas sebesar
0,4666. Dengan πΌ = 0,05 artinya p-value > πΌ. Sehingga tidak terdapat autokorelasi residual dan residualnya bersifat acak.
Gambar 4. Periodogram Kumulatif dari Residu
Dari Gambar 4, terlihat bahwa titik-titik garis nilai πΆπ membentuk garis yang hampir
linear mengikuti garis yang melewati garis diagonal, artinya residu dari model tidak linear. Residu
model ARIMA (1,1,0) selanjutnya dimodelkan dengan ANN dengan mengkombinasikan 4
Pemodelan Hybrid ARIMA (Autoregressive Integratedβ¦| 39
Statistika
input layer, 5 hidden layer, dan 1 output layer. Dengan menggunakan kombinasi tersebut
didapatkan sebanyak 20 model yang kemudian dicari nilai MSE terkecilnya. Dari 20 model didapatkan model ANN (4,1,1) sebagi model terbaik karena menghasilkan nilai MSE terkecil.
Tabel 3. Model ANN hasil Trial and Error.
Model Lag
input
Banyaknya
parameter
MSE
ANN(4,1,1) 1,2,3,4 7 0,022041
Berikut gambar arsitektur dari model ANN(4,1,1):
Gambar 5. Arsitektur ANN(4,1,1)
Dari Gambar 5, didapatkan model umum dari ANN(4,1,1) yaitu:
ποΏ½οΏ½ = 0,98205 + 1,33279πβ(π1,π‘) + 1,33279πβ(π2,π‘) + 1,33279πβ(π3,π‘) + 1,33279πβ (π4,π‘)
Dengan :
πβ =1
1+πβππ,π‘
; dimana: j = 1, 2, 3, 4
π1,π‘ = 0,51616 + 1,72158π1
π2,π‘ = 0,51616 β 0,85225π2
π3,π‘ = 0,51616β2,19433π3
π4,π‘ = 0,51616 + 0,90766π4
Dari hasil analisis ARIMA dan ANN yang telah dilakukan, didapatkan model dari masing-masing analisis yang kemudian di hybrid sehingga menghasilkan persamaan model
hybrid ARIMA-ANN sebagai berikut:
ln(οΏ½οΏ½π‘) = 1,3045ln(ππ‘β1) β 0,3045ln (ππ‘β2) + ππ‘
ποΏ½οΏ½ = 0,98205 + 1,33279πβ(π1,π‘) + 1,33279πβ(π2,π‘) + 1,33279πβ(π3,π‘) + 1,33279πβ (π4,π‘)
ln(π¦οΏ½οΏ½) = ln(οΏ½οΏ½π‘) + ποΏ½οΏ½
Kemudian dihitung nilai MSE dari model ARIMA(1,1,0) dan model hybrid ARIMA-ANN, untuk kemudian dibandingkan sehingga didapatkan hasil perbandingan sebagai berikut:
Tabel 4. Nilai MSE Model ARIMA dan Model Hybrid ARIMA-ANN
Model MSE
ARIMA(1,1,0) 0,566139
Hybrid
ARIMA-ANN
0,459152
40 | Rahma Kamadewi, et al.
Volume 7, No. 1, Tahun 2021
Gambar 6. Plot Ramalan Model
Dari Tabel 4, terlihat bahwa nilai MSE yang dihasilkan oleh model hybrid ARIMA-ANN lebih kecil daripada MSE yang dihasilkan oleh model ARIMA saja. Selain itu, dari Gambar 6
terlihat bahwa titik-titik nilai ramalan model hybrid ARIMA-ANN lebih rapat dibandingkan
dengan nilai ramalan yang dihasilkan oleh model ARIMA saja. Dari kedua perbandingan tersebut, dapat diketahui bahwa dengan melakukan hybrid dapat meningkatkan akurasi dari model tersebut.
4. Kesimpulan Berdasarkan pembahasan dalam penelitian ini, peneliti menyimpulkan sebagai berikut:
Model ARIMA untuk data inflasi Indonesia bulan Januari 2009 sampai bulan Mei 2019
menghasilkan model ARIMA (1,1,0) sebagai model terbaik untuk peramalan dengan persamaan
model: ln(οΏ½οΏ½π‘) = 1,3045ln(ππ‘β1) β 0,3045ln (ππ‘β2) + ππ‘
Model ANN untuk komponen residu yang nonlinear dari hasil pemodelan ARIMA (1,1,0)
dilakukan dengan mengkombinasikan 4 input layer, 5 hidden layer, dan 1 output layer. Dari hasil analisis, didapatkan model ANN (4,1,1) yang memberikan hasil akurasi terbaik. Maka didapatkan
persamaan model ANNnya yaitu:
ποΏ½οΏ½ = 0,98205 + 1,33279πβ(π1,π‘) + 1,33279πβ(π2,π‘) + 1,33279πβ(π3,π‘) + 1,33279πβ (π4,π‘)
Dari model-model tersebut, didapatkan model hybrid ARIMA-ANN untuk data inflasi
Indonesia yaitu sebagai berikut:
ln(οΏ½οΏ½π‘) = 1,3045ln(ππ‘β1) β 0,3045ln (ππ‘β2) + ππ‘
ποΏ½οΏ½ = 0,98205 + 1,33279πβ(π1,π‘) + 1,33279πβ(π2,π‘) + 1,33279πβ(π3,π‘) + 1,33279πβ (π4,π‘)
ln(π¦οΏ½οΏ½) = ln(οΏ½οΏ½π‘) + ποΏ½οΏ½
Hasil validasi model dengan menggunakan 14 data inflasi bulan Juni 2019 sampai dengan
bulan Juli 2020, menunjukkan model hybrid ARIMA-ANN dengan nilai MSE 0,459152
merupakan model yang lebih akurat dibandingkan dengan model ARIMA(1,1,0) yang
menghasilkan nilai MSE 0,566139. Hal ini menunjukkan bahwa dengan melakukan hybrid pada model ARIMA dapat meningkatkan akurasi dari model terebut. Sehingga dapat disimpulkan bahwa
model terbaik untuk meramalkan data inflasi Indonesia merupakan model hybrid ARIMA-ANN.
5. Saran
1. Disarankan untuk peneliti lain melakukan Hybrid model ARIMA dengan model peramalan
lain seperti Radial Basis Function Neural Network (RBFNN), General Regression Neural Network (GBNN), Feed Forward Neural Network (FFNN), dan model peramalan berbasis
jaringan syaraf tiruan yang lainnya.
2. Disarankan untuk menganalisis lebih lanjut metode Hybrid ARIMA-ANN dengan
menggunakan data yang memiliki variabel lebih dari satu.
0
1
2
3
4
1 2 3 4 5 6 7 8 9 10 11 12 13 14
Hasil Ramalan Inflasi dengan ARIMA dan Hybrid ARIMA-ANN
Inflasi
ARIMA
hybrid
Pemodelan Hybrid ARIMA (Autoregressive Integratedβ¦| 41
Statistika
Daftar Pustaka [1] Boediono. 1982. Seri Sinopsis Pengantar Ilmu Ekonomi Makro. (Edisi 4). Yogyakarta: BPFE.
[2] Makridakis, S., Wheelwright, S.C., & Mcgee, V.E. 1995. Metode dan Aplikasi Peramalan.
Terjemahan oleh Untung Sus Andriyanto dan Abdul Basith. 1999. Jakarta: Erlangga.
[3] Siang, J.J. 2005. Aplikasi Jaringan Syaraf Tiruan dan Pemrograman Menggunakan MATLAB. Jogjakarta: Andi Jogjakarta.
[4] Supriyanto, Pramita Luciana. 2017. Peramalan Jumlah Penumpang Penerbangan Di Terminal 1
Bandara Internasional Juanda Menggunakan Metode ARIMA Box-Jenkins dan Hybrid ARIMA-ANN. Tugas Akhir. Program Studi Sistem Informasi, Institut Teknologi Sepuluh
November.
[5] Wang, X. & Meng, M. 2012. A Hybrid Neural Network and ARIMA Model for Consumtion
Forecasting. Journal of Computer. [6] Zhang, G.P. 2003. Time Series Forecasting Using A Hybrid ARIMA and Neural Network Model.
Neurocomputing, 50: 159-175.