slide presentasi em algorithm (play tennis & brain tissue segmentation)

Expectation-Maximalization (EM) Algorithm

Hendri Karisma 23512060Luqman Abdul Mushawwir 23512146

Referensi

● Lecture Notes, Andrew Ng● Machine Learning, Tom M. Mitchell● Maximum Likelihood from Incomplete Data via

the EM Algorithm, A. P. Dempster; N. M. Laird; D. B. Rubin; 1977

● Dll

Konsep EM

● Maximum Likelihood Estimation (MLE)● Mixtures of Gaussians● Estimation-Maximization (EM)● Rate of Convergence

Maximum Likelihood Estimation (MLE)

● Sebuah dataset dengan instans sebanyak m

● Parameter dari model p(x, z) akan disesuaikan dengan data, likelihood diberikan berupa

● Dengan Mixture of Gaussian

Maximum yang Digunakan Dalam EM-Algorithm

Formula Gaussian

● Gaussian Normal

● Gaussian Multivariet (extension)– Perbedaannya adalah penggunaan matrik covariant

guna memperbaiki model yang dibangun.

Distribusi Gaussian Normal

● Model distribusi data dengan mean μ dan variansi σ². Contoh:

Visualisasi Gaussian 3D dengan Mean & Variance yang Berbeda

Contoh Gaussian pada histogram

Contoh Distribusi Gaussian X1 dan X2

● Contoh penerapan:

Visualisasi Gaussian 3D

● Contoh distribusi dan pemodelan dengan Gaussian

Gaussian Multivariate

Mixture Gaussian

Estimation-Maximization (EM)

● Iterasi yang terdiri dari dua langkah:● Step E (Estimation): mendekati z(i)

● Step M (Maximization): memperbaharui parameter

Fungsi E-M-Step

● Fungsi E-Step, melakukan estimasi gaussian awal dan akan di maksimalisasi oleh step M.

● Fungsi M-Step, atau Maximization step, melakukan perubahan parameter pada step estimasi, sehingga akan merubah posisi gaussian selanjutnya sehingga mencapai nilai maksimum.

Implementasi EM

● Inisialisasi– Menentukan probabilitas sense P(Sk) dari jumlah cluster yang ditentukan

– total P(Sk) adalah 1

– Menentukan probabilitas P(Vj|Sk): angka random

● Langkah E– Calculate the posterior probability that Sk generated Ci

● Langkah M– re-estimate P(Vj|Sk) and P(Sk)

● Perhitungan Konvergensi– Hitung model likelihood score: l(C|u) = Sum_I[Log_K(P(Ci|Sk)*P(Sk))]

– Jika | model score baru – model score lama | < threshold, konvergen

Pengujian dengan PlayTennis

● Pengujian dengan dataset 1 PlayTennis (14 instance)

Cont'd

● Representasi instance biner (0 dan 1), akurasi 57%

● Representasi instance index (0-2), akurasi 50%

EKSPERIMEN EM (Partial Volume Segmentation of Brain)

● Deskripsi Data● Hasil Eksperimen● Kesimpulan

Partial Volume Segmentationof Brain

● Dibagi menjadi 3 cluster utama + 3 irisan cluster.

● 3 Cluster : White Matter, Black Matter, CSF (Cerebrospinal Fluid)

● Data yang diambil adalah histogram dari MRI

Input Data

Hasil Eksperimen

Hasil dalam Histogram

Kesimpulan

● Dalam Algoritma Clustering Expectation Maximization Data harus didistribusikan dalam bentuk mixture gaussian, dan pada kasus eksplorasi kedua, mixture dapat memanfaatkan histogram citra MRI.

● Dalam Eksplorasi kedua terdapat perbedaan implementasi dengan paper pertama, dan hasilnya pun berbeda secara signifikan, tidak semua terdistribusi pada setiap cluster dan penyebab adalah data yang digunakan hanya 1 citra MRI pada eksplorasi sedangkan pada paper referensi utama 16 MRI.

● EM Algorithm untuk kasus segmentasi jaringan otak menghasilkan kompleksitas yang cukup tinggi.

● Belum dapat ditarik kesimpulan mengenai hasil dari eksplorasi karena dataset yang digunakan belum tepat digunakan dalam proses eksplorasi untuk mendapatkan akurasi dari implementasi em-algorithm dalam partial volume segmentation of human brain.

slide presentasi em algorithm (play tennis & brain tissue segmentation)

Documents

visualisasi gaussian

contoh gaussian pada

step fungsi estep

d dengan

step e estimation

hasil dalam histogram

dan variansi

atau maximization step