(fixed) decomposition and smoothing data analysis

Post on 15-Apr-2017

96 Views

Category:

Documents

3 Downloads

Preview:

Click to see full reader

TRANSCRIPT

Decomposition and Smoothing Time-Series Data Analysis

Muhammad Rafi Al-Hariri Nasution12812035

Pendahuluan

Prosedur dekomposisi digunakan dalam suatu time-series untuk memisahkan suatu sinyal seperti trend dan seasonal dalam time-series itu sendiri. Lebih luas lagi, dekomposisi juga termasuk dalam siklus panjang, mingguan, atau harian, dsb. Namun pada modul ini kita akan fokus pada trend dan seasonal decomposition.

Tujuan utama dalam dekomposisi adalah mengestimasi efek musiman yang digunaan untuk membuat dan menyajikan nilai musiman yang disesuaikan. Nilai musiman yang telah disesuaikan akan menghilangkan efek musman dari suatu nilai sehingga trend dapat terlihat lebih jelas.

Moving Average/Running Mean

Smoothing data-series adalah teknik biasa dalam sains, banyak textbook yang menjelaskan tentang beberapa pendekatan untuk Smoothing ini. Banyaknya data pada suatu data-series, akan menjadikannya sulit untuk direpresentasikan karena terlihat seperti noise atau gangguan. Banyaknya data yang serupa dalam data Geofisika seperti Meteorologi dan Klimatologi, menjadikan Smoothing atau filtering menjadi penting sehingga kita dapat merepresentasikan confusing data tersebut.

(Source: https://bobtisdale.files.wordpress.com/2012/04/figure-31.png)

Dimana,n = Periode yang dibutuhkan dalam moving average

Di = Data dalam periode i

1 1 3 2 2 4 3 3 5 4 4 6  5/3 2 7/3 8/3 3 10/

311/3

4 13/3

14/3

 

    9/5 12/5

14/5

14/5

17/5

19/5

19/5

22/5

   

Empirical Mode Decomposition (EMD)

Empirical Mode Decomposition (EMD) adalah sebuah metode yang dikembangkan oleh Norden Huang di NASA sebagai bagian dari Hilbert-Huang Transformasi. Aslinya, EMD dikembangkan untuk menghitung frekuensi yang terukur saat itu juga dari suatu data non-stasioner dan non-linear (Huang, 1998). Namun, dikarenakan banyaknya fenomena alam yang juga merupakan proses nonstasioner dan non-stationary, metode ini mulai digunakan untuk banyak data sains termasuk data-data Meteorologi dan Iklim (Peel 2005 dan McMahon 2008)

Jika dibandingkan dengan teknik dekomposisi lain seperti Fourier analisis, Wavelet atau bahkan Principle Componen Analysis (PCA), EMD memiliki lebih banyak keunggulan karena ini dapat menangani suatu data time-series yang nonstasioner dan non-linear. Dikarenakan dekomosisi didasarkan pada karakteristik skala waktu lokal dari data, EMD dapat mengkomputasi proposi dari suatu variasi dalam time-series yang dapat dikaitkan pada fluktuasi (baik rendah ataupun frekuensi yang tinggi) pada skala waktu yang berbeda (McMahon, 2008).

Contoh Keluaran EMD Dengan menggunakan metode EMD,

suatu time series data akan didekomposisi kedalam beberapa komponen yang independen dan tidak berkolerasi satu dengan lainnya. Komponen ini biasa disebut sebagai Intrinstic Mode Functions (IMFs). Bagian akhir IMF merupakan sisa atau trend dari seluruh time-series. Jika semua IMF dan semua sisanya dijumlahkan kembali, maka data asli akan terbentuk kembali.

Secara teoritis, tiap-tiap IMF merupakan orthogonal dan tidak berkorelasi.

(Huang, 2005), prosedur untuk memperoleh IMF dengan EMD terdiri dari beberapa step

Harmonik Analisis

Harmonik Analisis terdiri dari representasi fluktuasi atau variasi dalam suatu time-series data yang muncul dari berbagai fungsi sinus dan kosinus suatu data. Fungsi Trigonometri ini merupakan sesuatu yang harmonic dalam arti bahwa mereka terpilih karena mereka memiliki frekuensi yang menunjukkan adanya kelipatan suatu bilangan bulat pada frekuensi yang ditentukan pada pengambilan suatu ukuran sampel data-series.

Konsep Dasar – Ubah Unit Sudut ke Waktu

Fungsi trigonometri menggunakan sudut, sedangkan data dalam bentuk time-series

Solusi:   Adapun frekuensi dasar dapat didefinisikan sebagai

Kuantitas ini merupakan frekuensi angular, yang memiliki dimensi fisis dalam radian per satuan waktu. Frekuensi angular ini menggambarkan siklus penuh dan jumlah unit n dalam satuan waktu.

Konsep Dasar – Jika Amplitudo data > 1 dan < -1

Solusi: Pada suatu fungsi sinus dan kosinus, kita dapat menambah besar amplitude yang akan membuat range nilai semakin tinggi. Jika amplitude A = 5, maka nilai sinus dan kosinus akan berada disekitar -5 dan +5 variatif berdasarkan besar sudut ataupun waktu. Adapun kita dapat menambahkan nilai yang merupakan nilai rata-rata time-series data. Sehingga, kita akan mendapatkan bahwa

Konsep Dasar - Fasa

Fungsi sinus dan kosinus berada pada nilai α = 0 dan α = 2π. Namun, bagaimana jika kondisi ini tidak cocok terhadap kondisi aslinya? 

Solusi: Penambahan fasa sangat perlu dilakukan ketika suatu fungsi ternyata tidak cocok untuk mendekati nilai tersebut, sehingga kita dapat menuliskan suatu fungsi baru dengan suatu penambahan besar fasa ф1 sebagai berikut.

Contoh bagaimana pengurangan atau penambahan fasa dapat mengestimasi suatu nilai dengan baik.

LANGKAH KERJAMOVING AVERAGE (MA)

Running MeanSintesis dan Normalisasi data sintesis dengan periode 5, 10, 15 dan jumlah bilangan gelombang untuk setiap Periode.

Dekomposisi masing-masing sinyal sesuai dengan periode yang telah didefinisikan, plot gambar

Terlihat bahwa terdapat transfer energy yang tidak merata dalam mendekati nilai-nilai aslinya.

Dengan MA periode 5, terlihat hasil under-estimate

Dengan MA periode 10 karena merupakan periode tengah, terlihat bahwa hasil kurang baik. Akibat transfer energy yang tidak merata di 5 dan 15.

Dengan MA periode 15, terlihat hasil yang cenderung Overestimate. Namun ketika digabungkan lagi, MA dapat membentuk data asli

LANGKAH KERJAEMPIRICAL MODE DECOMPOSITION

1. Sintesis dan Normalisasi data yang samaclear all; close all; clc %Data sintetis dengan bilangan gelombang yang berbedat=[1:120]';n=length(t);P=[5 10 15]; %periodeK=n./P; %bilangan gelombang (jumlah gelombang)%time seriesy5=4*sin(2*pi*K(1)*t/n);y10=2*sin(2*pi*K(2)*t/n);y15=3*sin(2*pi*K(3)*t/n);y=y5+y10+y15;y=y'; %NORMALISASI!n=length(y);t=(1:n)';ybar=nanmean(y);y=y-ybar;

3. Gunakan fungsi EMD.m dan plot hasil IMFnya

%Menggunakan EMDimf = emd2(y);figure; subplot(7,1,1);plot(y,'LineWidth',3); hold on;title('Data Empirical Mode Decomposition');subplot(7,1,2);plot(imf(1,:),'red','LineWidth',2);title('IMF 1');subplot(7,1,3);plot(imf(2,:),'black','LineWidth',2); title('IMF 2');subplot(7,1,4);plot(imf(3,:),'yellow','LineWidth',2);title('IMF 3');

subplot(7,1,5);plot(imf(4,:),'green','LineWidth',2);title('IMF 4');subplot(7,1,6);plot(imf(5,:),'cyan','LineWidth',2);title('IMF 5');feelingsomething=imf(3,:)+imf(4,:)+imf(5,:);subplot(7,1,7);plot(feelingsomething,'black','LineWidth',2);title('IMF 3+4+5');saveas(gcf,'IMF.jpg')

Karena data sintetis kita dibangun dari fungsi sinus-kosinus yang stasioner, pendekatan menggunakan EMD kurang cocok karena pendekatan metode ini menggunakan suatu fungsi non-stasioner. Sehingga tidak kita temukan suatu sinyal gelombang berperiode 10.

Kita dapat mendekati gelombang tersebut dengan menjumlah gelombang/IMF yang ada

LANGKAH KERJAHARMONIC ANALYSIS

1. Buatlah data sintetis dan Normalisasi data tersebutclear all; close all; clct=[1:120]';n=length(t);P=[5 10 15]; %periodeK=n./P; %bilangan gelombang (jumlah gelombang)%time series

y5=4*sin(2*pi*K(1)*t/n);y10=2*sin(2*pi*K(2)*t/n);y15=3*sin(2*pi*K(3)*t/n);y=y5+y10+y15;y=y; %NORMALISASI!n=length(y);t=(1:n)';%Kenapa nanmean? Karena Nanmean membantu merata-ratakan data tanpa%memperhatikan NaN. Kalau kalian punya data NaN dan pake fungsi mean biasa,%yang terjadi adalah, rata-rata kalian bakal NaN :)ybar=nanmean(y);y=y-ybar;

3. Definisikan Himpunan X, yang akan diisi oleh pendekatan fungsi sinus kosinus untuk setiap bilangan gelombang (total n/2 gelombang)

%BUAT MATRIKS X-nya Dulu X=[];%Pendekatan Harmonik Analysis dengan fungsi Sinus dan Kosinus di tiap%bilangan gelombangfor k=1:fix(n/2) x1=cos(2*pi*k*t/n); x2=sin(2*pi*k*t/n); X=[X x1 x2];end

4. Dengan pendekatan Multiple stasioner Regression (MLR), akan didekati nilai Amplitudo dan fasa gelombang

%Multiple Linear Regressionwarning('off','all');b=regress(y,X);A=b(1:2:end);B=b(2:2:end);%Amplitude (C)C=sqrt(A.^2+B.^2);%Sudut fasa (THETA)theta=ones(length(A),1);theta(A>0.0)=atan(B(A>0.0)./A(A>0.0));theta(A<0.0)=atan(B(A<0.0)./A(A<0.0))+pi;theta(A==0.0)=pi/2;

5. Estimasi nilai Yi dengan jumlah bilangan gelombang (n/2); Plot gambar dengan menggunakan script berikut.

%Estimasi Yifor k=1:fix(n/2); yi(:,k)=(C(k)*cos(2*pi*k*t/n - theta(k)))';end

% gambar dua harmonik pertama data sintetikfigure;hold all;grid on;plot([y yi(:,[8])],'linestyle','-','linewidth',1.5);plot(sum(yi(:,[8]),1),'--k','linewidth',3);legend('data','bilangan gelombang 8','location','best'); title ('Contoh hasil analisa harmonik dengan data sintetis');saveas(gcf,'HA_bilangan_gelombang8.jpg'); % C=[];theta=[];yi=[];figure;hold all;grid on;plot([y yi(:,[12])],'linestyle','-','linewidth',1.5);plot(sum(yi(:,[12]),1),'--k','linewidth',3);legend('data','bilangan gelombang 12','location','best'); title ('Contoh hasil analisa harmonik dengan data sintetis');saveas(gcf,'HA_bilangan_gelombang12.jpg');

Masih plotting!figure;hold all;grid on;plot([y yi(:,[24])],'linestyle','-','linewidth',1.5);plot(sum(yi(:,[24]),1),'--k','linewidth',3);

legend('data','bilangan gelombang 24','location','best'); title ('Contoh hasil analisa harmonik dengan data sintetis');saveas(gcf,'HA_bilangan_gelombang24.jpg');figure;hold all;grid on;plot([y yi(:,[1:7,9,10])],'linestyle','-','linewidth',1.5);plot(sum(yi(:,[1:7,9,10]),9),'--k','linewidth',3);legend('data','harmonik 1','harmonik 2','harmonik 3','harmonik 4','harmonik 5','harmonik 6','harmonik7','harmonik 9','harmonik 10','location','best'); title ('Contoh hasil analisa harmonik dengan data sintetis');saveas(gcf,'HA_bilangangelombang1-10.jpg');

Pada kasus ini, Dekomposisi atau pemisahan sinyal yang

terbaik ditunjukkan oleh Harmonic Analisis karena

dapat menggambarkan gelombang penyusun data

pada tiap periodenya dengan amplitude yang sesuai.

TUGAS!

Download 10 tahun data satu stasiun (Data primer atau observasi langsung). Stasiun tiap kelompok tidak boleh berada dalam 1 provinsi

Pilih 2 parameter Meteorologi (Contoh: Temperatur x Tekanan atau Temperatur x Kelembaban, Tekanan x Kecepatan Angin)

Lakukan normalisasi terhadap data terlebih dahulu Lakukan dekomposisi dengan Moving Average pada kedua parameter, untuk menghilangkan:1. Efek Diurnal,2. Efek Semi-annual, dan3. Efek Annual Lakukan dekomposisi dengan Harmonic Analisis dan EMD. Bandingkan hasil keluaran keduanya! Analisis fenomena fisis apa saja yang menjadi faktor pembangun kedua parameter tersebut berdasarkan

tiap-tiap keluaran Harmonic Analisis, EMD, dan Moving Average! Berdasarkan tiap-tiap metode, apakah terdapat kesamaan pola antara Parameter 1 dengan lainnya?

DEADLINE DAN FORMAT PENGUMPULAN TUGAS

Laporan dikerjakan sesuai dengan format berikut.1. Cover2. Kata Pengantar3. Pendahuluan4. Tujuan Praktikum5. Algoritma pengerjaan tugas6. Analisis dan Pembahasan7. Kesimpulan dan Saran8. Daftar Pustaka Lampirkan Papers atau jurnal ilmiah yang digunakan untuk analisis, jika diambil dari Buku, sebutkan halaman

kajian pustakanya Lampirkan pula script yang digunakan dalam pengerjaan DEADLINE : Minggu, 06 Maret 2016, 18.00

top related