Download - Pertemuan 3- Arsitektur Data Mining
7/21/2019 Pertemuan 3- Arsitektur Data Mining
http://slidepdf.com/reader/full/pertemuan-3-arsitektur-data-mining 1/29
ARSITEKTUR DATA
MINING
7/21/2019 Pertemuan 3- Arsitektur Data Mining
http://slidepdf.com/reader/full/pertemuan-3-arsitektur-data-mining 2/29
Arsitektur : Sistem Data Mining
Graphical User Interface (GUI)
Pattern evaluation
Data Mining ngine
!no"le#ge$%ase
Data%ase or #ata "arehouse
server
Data clening & #ata integration
Data base
'iltering
Data warehouse
7/21/2019 Pertemuan 3- Arsitektur Data Mining
http://slidepdf.com/reader/full/pertemuan-3-arsitektur-data-mining 3/29
!eterangan :
* Data cleaning (Pem%ersihan Data) : untuk mem%uang #ata
+ang ti#ak konsisten #an noise
2* Data integration : pengga%ungan #ata #ari %e%erapa sum%er * Data Mining ngine : Mentranformasikan #ata men,a#i
%entuk +ang sesuai untuk #i mining
-* Pattern evaluation : untuk menemukan +ang %ernilai melalui
kno"le#ge %ase
.* Graphical User Interface (GUI) : untuk en# user
Semua tahap bersifat interaktif di mana user terlibat langsung
atau dengan perantaraan knowledge base
Arsitektur #an Mo#el Data Mining
7/21/2019 Pertemuan 3- Arsitektur Data Mining
http://slidepdf.com/reader/full/pertemuan-3-arsitektur-data-mining 4/29
Mo#el Data Mining
/Pre#iction Metho#s
0Menggunakan %e%erapa varia%el untuk
mempre#iksi sesuatu atau suatu nilai +ang
akan #atang*
/Description Metho#sArsitektur #an Mo#el Data Mining
7/21/2019 Pertemuan 3- Arsitektur Data Mining
http://slidepdf.com/reader/full/pertemuan-3-arsitektur-data-mining 5/29
•Pemodelan prediktif adalah proses yang digunakan dala
analisis prediktif untuk membuat model statistik dari perilamasa depan. Predictive analytics adalah bidang data min
yang bersangkutan dengan probabilitas peramalan dan tr
•Sebuah model prediktif terdiri dari sejumlah prediksi, bai
faktor variabel yang mungkin mempengaruhi perilaku ma
depan atau hasil. Dalam pemasaran, misalnya, jenis kelapelanggan, usia, dan sejarah pembelian mungkin
memprediksi kemungkinan penjualan masa depan.
Prediksi Pemodelan
7/21/2019 Pertemuan 3- Arsitektur Data Mining
http://slidepdf.com/reader/full/pertemuan-3-arsitektur-data-mining 6/29
•Pada pemodelan prediktif, data dikumpulkan untuk prediktor y
relevan, model statistik dirumuskan, prediksi yang dibuat dan
model divalidasi (atau revisi) sebagai data tambahan telah
tersedia. odel ini dapat menggunakan persamaan liniersederhana atau jaringan syaraf kompleks , dipetakan oleh
perangkat lunak yang canggih.
•Pemodelan prediktif digunakan secara luas dalam teknologi
informasi. Dalam sistem penyaringan spam, misalnya, pemode
prediktif kadang!kadang digunakan untuk mengidentifikasikemungkinan bah"a pesan yang diberikan adalah spam. #plik
lain dari pemodelan prediktif termasuk manajemen hubungan
pelanggan ($%), perencanaa kapasitas, manajemen perubah
disaster recovery (pemulihan bencana), manajemen keamanan
teknik, meteorologi dan perencanaan kota.
7/21/2019 Pertemuan 3- Arsitektur Data Mining
http://slidepdf.com/reader/full/pertemuan-3-arsitektur-data-mining 7/29
Deskriptif Pemodelan
Pemodelan deskriptif, atau clustering membagi data ke dala
kelompok.
Dengan clustering&• Dapat menentukan kelompok yang tepat, yang tidak diketa
sebelumnya• Pola ditemukan dengan menganalisis data digunakan untu
menentukan kelompok.
isalnya, pengiklan bisa menganalisis masyarakat umum untu
mengklasifikasikan pelanggan potensial ke dalam kelompok ya
berbeda dan kemudian mengembangkan terpisah kampanye
iklan ditargetkan pada setiap kelompok.
Deteksi fraud juga membuat penggunaan clustering untuk
mengidentifikasi kelompok individu dengan pola pembelian yan
sama.
7/21/2019 Pertemuan 3- Arsitektur Data Mining
http://slidepdf.com/reader/full/pertemuan-3-arsitektur-data-mining 8/29
!lasifikasi
Proses untuk menemukan mo#el atau fungsi +ang men,elaskan atau mem%e#a
konsep atau kelas #ata #engan tu,uan untuk #apat mempre#iksi kelas #ari sua
o%,ek +ang la%eln+a ti#ak #iketahui
Contoh : Mendeteksi Penipuan
Tujuan : Memprediksi kasus kecurangan transaksi kartu kredit.
0 Pendekatan :
/ Menggunakan transaksi kartu kredit dan informasi dilihat dari atribut
account holder
0 Kapan cutomer melakukan pembelian, Dengan cara apa customer
membaar, sebarapa sering customer membaar secara tepat waktu
dll
/ !eri nama"tanda transaksi ang telah dilaksanakan sebagai transaksi a
curang atau ang baik. #ni sebagai atribut klass $ the class attribute.%
/ Pelajari model untuk class transaksi
/ &unakan model ini untuk mendetekdi kecurangan dengan meneliti trans
kartu kredit pada account.Arsitektur #an Mo#el Data Mining
7/21/2019 Pertemuan 3- Arsitektur Data Mining
http://slidepdf.com/reader/full/pertemuan-3-arsitektur-data-mining 9/29
3egression
Digunakan untuk memetakan #ata #engan pre#iksi atri%ut
%ernilai real
4ontoh:
0 Mempre#iksi ,umlah pen,ualan pro#uk %aru pa#a
a#vertising e5pen#iture*
0 Mempre#iksi kecepatan memutar ("in# velocities) pa#a
fungsi temperatur6 tekanan u#ara 6 #ll
Arsitektur #an Mo#el Data Mining
7/21/2019 Pertemuan 3- Arsitektur Data Mining
http://slidepdf.com/reader/full/pertemuan-3-arsitektur-data-mining 10/29
Decision tree (Pohon keputusan)
Salah satu mo#el klasifikasi +ang mu#ah #i interpretasikan4ontoh : i#entifikasi pem%eli komputer ( #ari #ecision tree #i %a"ah
ini tern+ata salah satu kelompok +ang potensial a#alah orang +ang
%erusia 8 9 #an pela,ar
age89
stu#en
$-9
+es
;-9
4re#it ratingno
no
+es
+es
e5celent
no
fair
+es
Arsitektur #an Mo#el Data Mining
7/21/2019 Pertemuan 3- Arsitektur Data Mining
http://slidepdf.com/reader/full/pertemuan-3-arsitektur-data-mining 11/29
<eural <et"ork (=aringan s+araf tiruan)
=aringan s+araf %uatan #i mulai #engan la+er input6 #imana tiap
simpul %erkorespon#ensi #engan varia%el pre#iktor*
Simpul$ simpul input ini terhu%ung ke%e%erapa simpul #alam
hi##en la+er*
Dan simpul #alam hi##en la+er #apat terhu%ung ke simpul lain
#alam hi##en la+er atau ke output la+er*
>utput la+er ter#iri #ari satu atau %e%erapa varia%le respon
2
- 1
output
27 Septem%er 299.
input .
?i##en la+er
7/21/2019 Pertemuan 3- Arsitektur Data Mining
http://slidepdf.com/reader/full/pertemuan-3-arsitektur-data-mining 12/29
@elekomunikasi
Data mining #igunakan untuk melihat ,utaan transaksi +ang
masuk #engan tu,uan menam%ah la+anan otomatis
!euangan
Data mining #igunakan untuk men#eteksi transaksi$
transaksi keuangan +ang mencurigakan #imana akan
susah #ilakukan ,ika menggunakan analisis stan#ar*
Asuransi27 Septem%er 299. Arsitektur #an Mo#el Data Mining
7/21/2019 Pertemuan 3- Arsitektur Data Mining
http://slidepdf.com/reader/full/pertemuan-3-arsitektur-data-mining 13/29
>lah raga
IM A#vance# Scout menggunakan #ata mining untuk
menganalisis statistik permainan <A #alam rangka competit
a#vantage untuk tim <e" Bork !nicks
Astronomi
=et Propulsion Ca%orator+ (=PC) #i Pasa#ena #an Pulomar
>%servator+ menemukan 22 uasar #engan %antuan #ata
mining*
Internet Ee% Surf$Ai#27 Septem%er 299. Arsitektur #an Mo#el Data Mining
7/21/2019 Pertemuan 3- Arsitektur Data Mining
http://slidepdf.com/reader/full/pertemuan-3-arsitektur-data-mining 14/29
@ools Data Mining
!arateristik$karateristik penting #ari tool #ata mining meliputi
0 Data preparation facilities
0 Selection of #ata mining operation (algorithms)
0 Pro#uct scala%ilit+ an# performance
0 'acilities for visualiFation of result
Data mining tool6 meliputi :
0 Integral Solution Ct#s 4lementine
0 DataMin# 4orps Data 4rusher
0 IMs Intelligent Miner
0 Silicon Graphics Inc*s MineSet
0 Informations Discover+ Inc*s Data Mining Suite0
Arsitektur #an Mo#el Data Mining
7/21/2019 Pertemuan 3- Arsitektur Data Mining
http://slidepdf.com/reader/full/pertemuan-3-arsitektur-data-mining 15/29
volusi Data%ase
@h H19
0 Pengumpulan #ata6 pem%uatan #ata6 IMS #an net"ork DMS
@h H9
0 Mo#el #ata relasional6 Implementasi DMS relasional
@h H79
0 3DMS6 Mo#el #ata lan,utan (e5ten#e#$relational6 >>6 #e#uctive)
@h HH9
0 Data mining6 #ata "arehouse6 #ata%ase multime#ia6 #an Ee%
#ata%ase*Arsitektur #an Mo#el Data Mining
7/21/2019 Pertemuan 3- Arsitektur Data Mining
http://slidepdf.com/reader/full/pertemuan-3-arsitektur-data-mining 16/29
%erurut atau
@eknik 0 teknik Data%ase
Searching Searching #ilakukan untuk memeriksa serangkaian item +ang memiliki sifat
sifat +ang #iinginkan*
@in#akan untuk menemukan suatu item tertentu %aik +ang #iketahuike%era#aann+a maupun ti#ak*
Memasukkan kata #alam suatu program komputer untuk mem%an#ingkan#engan informasi +ang a#a #alam #ata%ase*
In#e5ing In#e5ing a#alah struktur$struktur akses +ang #igunakan untuk mempercepat
respon #alam men#apatkan recor#$recor# pa#a kon#isi$kon#isi pencarian
tertentu*
In#e5ing fiel# a#alah suatu struktur akses in#e5 +ang %iasan+a men,elaskanfiel# tunggal #ari suatu file*
In#e5ing organiFation mem%erikan efisiensi akses ke recor#$recor# secara
7/21/2019 Pertemuan 3- Arsitektur Data Mining
http://slidepdf.com/reader/full/pertemuan-3-arsitektur-data-mining 17/29
Data 3e#uction
Data reduction a#alah transformasi suatu masalah ke masalah
lain #an #apat #igunakan untuk men#efinisikan serangkaian
masalah +ang kompleks*
Data reduction merupakan teknik +ang #igunakan untuk mentransformasi #ari #ata mentah ke %entuk format #ata +ang
le%ih %erguna* Se%agai contoh groupping, summing #an
averaging data.
Data reduction #ilakukan untuk mengatasi ukuran #ata +ang
terlalu %esar* Ukuran #ata +ang terlalu %esar #apat menim%ulkan
keti#akefisienan proses #an peningkatan %ia+a pemrosesan*Arsitektur #an Mo#el Data Mining
7/21/2019 Pertemuan 3- Arsitektur Data Mining
http://slidepdf.com/reader/full/pertemuan-3-arsitektur-data-mining 18/29
>CAP (>n$line anal+tical processing)
>CAP a#alah suatu sistem atau teknologi +ang #irancang untuk men#ukung proses analisis kompleks #alam rangka mengungkapkan
kecen#erungan pasar #an faktor$faktor penting #alam %isnis
>CAP #itan#ai #engan kemampuann+a menaikkan atau menurunkan
#imensi #ata sehingga kita #apat menggali #ata sampai pa#a level +ang
sangat #etail #an memperoleh pan#angan +ang le%ih luas mengenai
o%,ek +ang se#ang kita analisis*
>CAP secara khusus memfokuskan pa#a pem%uatan #ata agar #apat
#iakses pa#a saat pen#efinisian kem%ali #imensi*
>CAP #apat #igunakan mem%uat rangkuman #ari multi#imensi #ataan %er%e#a ran kuman %aru #an men#a atkan res on secara online
7/21/2019 Pertemuan 3- Arsitektur Data Mining
http://slidepdf.com/reader/full/pertemuan-3-arsitektur-data-mining 19/29
Data Earehouse
Definisi :
Data Earehouse a#alah Pusat repositori informasi +ang mampu
mem%erikan #ata%ase %erorientasi su%+ek untuk informasi +ang
%ersifat historis +ang men#ukung DSS (Decision Suport S+stem)
#an IS (5ecutive Information S+stem)*
Salinan #ari transaksi #ata +ang terstruktur secara spesifik pa#a
uer+ #an analisa*
Salinan #ari transaksi #ata +ang terstruktur spesifik untuk uer+
#an laporan
@u,uan :Arsitektur #an Mo#el Data Mining
7/21/2019 Pertemuan 3- Arsitektur Data Mining
http://slidepdf.com/reader/full/pertemuan-3-arsitektur-data-mining 20/29
0
0
0
0
4iri$ciri Data Earehouse
@er#apat - karateristik #ata "arehouse
/ Su%,ect oriente#
Data +ang #isusun menurut su%+ek %erisi han+a informasi +ang penting %agi pemprosesa
#ecision support*
0 Data%ase +ang semua informasi +ang tersimpan #i kelompokkan %er#asarkan
su%+ek tertentu misaln+a: pelanggan6 gu#ang6 pasar6 #s%*
0 Semua Informasi terse%ut #isimpan #alam suatu sistem data warehouse.
0 Data$#ata #i setiap su%+ek #irangkum ke #alam #imensi6 misaln+a : perio#e
"aktu6 pro#uk6 "ila+ah6 #s%6 sehingga #apat mem%erikan nilai se,arah untuk %ahan analisa*
/ Integrate#
=ika #ata terletak pa#a %er%agai aplikasi +ang terpisah #alam suatu lingkungan
operasional6 enco#ing #ata sering ti#ak seragam sehinggga %ila #ata #ipin#ahkan ke #ata
"arehouse maka co#ing akan #iasumsikan sama seperti laFimn+a*
/ @ime$variant
Data "arehouse a#alah tempat untuk storing #ata selama . sampai 9 tahun atau le%ih6Arsitektur #an Mo#el Data Mining
7/21/2019 Pertemuan 3- Arsitektur Data Mining
http://slidepdf.com/reader/full/pertemuan-3-arsitektur-data-mining 21/29
/
/
/
2
Masalah$masalah #alam menerapkan Data warehouse :
Dokumentasi #an pengelolaan meta#ata #ari data
warehouse.
Penentuan aturan #alam proses transformasi untuk
memetakan %er%agai sum%er legac+ #ata +ang akan#imasukkan ke #alam data warehouse.
Pencapaian proses pengem%angan +ang han#al6 %aik
#alam mem%angun6 mempimplementasikan6 maupun
memelihara data warehouse.
Arsitektur #an Mo#el Data Mining
7/21/2019 Pertemuan 3- Arsitektur Data Mining
http://slidepdf.com/reader/full/pertemuan-3-arsitektur-data-mining 22/29
2
Data Preprocessing
Data preprocessing menerangkan tipe$tipe proses +ang melaksanakan #atamentah untuk mempersiapkan proses prose#ur +ang lainn+a*
Dalam #ata mining menstrasformasi #ata ke suatu format +ang prosesn+ale%ih mu#ah #an efektif untuk ke%utuhan pemakai6 contohn+a <eural
<et"ork*
@er#apat %e%erapa alat #an meto#e +ang %er%e#a +ang #igunakan untuk preprocessing seperti :
0 Sampling : men+eleksi su%set representatif #ari populasi #ata +ang %esar*
0 Transformation : memanipulasi #ata mentah untuk menghasilkaninput tunggal*
0 Denoising : menghilangkan noise #ari #ata
0 Normaliation : mengorganisasi #ata untuk pengaksesan +ang le%ihspesifik
0 !eature e"tration : mem%uka spesifikasi #ata +ang signifikan #alam
7/21/2019 Pertemuan 3- Arsitektur Data Mining
http://slidepdf.com/reader/full/pertemuan-3-arsitektur-data-mining 23/29
2
!no"le#ge Discover+ In Data%ase (!DD)
!DD %erhu%ungan #engan teknik integrasi #an penemuan
ilmiah6 interprestasi #an visualisasi #ari pola$pola
se,umlah kumpulan #ata*
Knowledge discovery in databases (!DD) a#alah
keseluruhan proses non$trivial untuk mencari #an
mengi#entifikasi pola (pattern) #alam #ata6 #imana pola
+ang #itemukan %ersifat sah6 %aru6 #apat %ermanfaat #an
#apat #imengerti*
7/21/2019 Pertemuan 3- Arsitektur Data Mining
http://slidepdf.com/reader/full/pertemuan-3-arsitektur-data-mining 24/29
2
Gam%ar* * @ahapan !DD
Arsitektur #an Mo#el Data Mining
7/21/2019 Pertemuan 3- Arsitektur Data Mining
http://slidepdf.com/reader/full/pertemuan-3-arsitektur-data-mining 25/29
2
@ahapan Proses !DD
. Data Selection
0 Menciptakan himpunan #ata target 6 pemilihanhimpunan #ata6 atau memfokuskan pa#a su%set varia%el
atau sampel #ata6 #imana penemuan (#iscover+) akan
#ilakukan*
0 Pemilihan (seleksi) #ata #ari sekumpulan #ata
operasional perlu #ilakukan se%elum tahap penggalian27 Septem%er 299. Arsitektur #an Mo#el Data Mining
7/21/2019 Pertemuan 3- Arsitektur Data Mining
http://slidepdf.com/reader/full/pertemuan-3-arsitektur-data-mining 26/29
2
#. Pre$processing% &leaning
0 Pemprosesan pen#ahuluan #an pem%ersihan #ata merupakan
operasi #asar seperti penghapusan noise #ilakukan*
0 Se%elum proses data mining #apat #ilaksanakan6 perlu
#ilakukan proses cleaning pa#a #ata +ang men,a#i fokus
!DD*
0 Proses cleaning mencakup antara lain mem%uang #uplikasi
#ata6 memeriksa #ata +ang inkonsisten6 #an memper%aiki
kesalahan pa#a #ata6 seperti kesalahan cetak (tipografi)*
0 J
Arsitektur #an Mo#el Data Mining
7/21/2019 Pertemuan 3- Arsitektur Data Mining
http://slidepdf.com/reader/full/pertemuan-3-arsitektur-data-mining 27/29
2
'. Transformation
0 Pencarian fitur$fitur +ang %erguna untuk
mempresentasikan #ata %ergantung kepa#a goal +ang
ingin #icapai*
0 Merupakan proses transformasi pa#a #ata +ang telah
#ipilih6 sehingga #ata terse%ut sesuai untuk proses data
mining. Proses ini merupakan proses kreatif #an sangat
tergantung pa#a ,enis atau pola informasi +ang akan
#icari #alam %asis #ata
Arsitektur #an Mo#el Data Mining
7/21/2019 Pertemuan 3- Arsitektur Data Mining
http://slidepdf.com/reader/full/pertemuan-3-arsitektur-data-mining 28/29
2
(. Data mining
0 Pemilihan tugas #ata miningK pemilihan goal #ari proses
!DD misaln+a klasifikasi6 regresi6 clustering6 #ll*
0 Pemilihan algoritma #ata mining untuk pencarian
(searching)
0 Proses Data mining +aitu proses mencari pola atau
informasi menarik #alam #ata terpilih #engan
menggunakan teknik atau meto#e tertentu* @eknik6
meto#e6 atau algoritma #alam data mining sangat %ervariasi* Pemilihan meto#e atau al oritma an te at
Arsitektur #an Mo#el Data Mining
7/21/2019 Pertemuan 3- Arsitektur Data Mining
http://slidepdf.com/reader/full/pertemuan-3-arsitektur-data-mining 29/29
2
). *nterpretation% +valuation
0 Pener,emahan pola$pola +ang #ihasilkan #ari data
mining.
0 Pola informasi +ang #ihasilkan #ari proses data mining
perlu #itampilkan #alam %entuk +ang mu#ah #imengerti
oleh pihak +ang %erkepentingan* 0 @ahap ini merupakan %agian #ari proses !DD +ang
mencakup pemeriksaan apakah pola atau informasi
+ang #itemukan %ertentangan #engan fakta atau
hipotesa +ang a#a se%elumn+a*
Arsitektur #an Mo#el Data Mining