pertemuan 3- arsitektur data mining

29
7/21/2019 Pertemuan 3- Arsitektur Data Mining http://slidepdf.com/reader/full/pertemuan-3-arsitektur-data-mining 1/29 ARSITEKTUR DATA MINING

Upload: niamah-la-adzkia

Post on 05-Mar-2016

219 views

Category:

Documents


0 download

DESCRIPTION

menerangkan tentang konseptual dan virtualisasi terhadap program

TRANSCRIPT

Page 1: Pertemuan 3- Arsitektur Data Mining

7/21/2019 Pertemuan 3- Arsitektur Data Mining

http://slidepdf.com/reader/full/pertemuan-3-arsitektur-data-mining 1/29

ARSITEKTUR DATA

MINING

Page 2: Pertemuan 3- Arsitektur Data Mining

7/21/2019 Pertemuan 3- Arsitektur Data Mining

http://slidepdf.com/reader/full/pertemuan-3-arsitektur-data-mining 2/29

Arsitektur : Sistem Data Mining

Graphical User Interface (GUI)

Pattern evaluation

Data Mining ngine

!no"le#ge$%ase

Data%ase or #ata "arehouse

server 

Data clening & #ata integration

Data base

'iltering

Data warehouse

Page 3: Pertemuan 3- Arsitektur Data Mining

7/21/2019 Pertemuan 3- Arsitektur Data Mining

http://slidepdf.com/reader/full/pertemuan-3-arsitektur-data-mining 3/29

!eterangan :

* Data cleaning (Pem%ersihan Data) : untuk mem%uang #ata

+ang ti#ak konsisten #an noise

2* Data integration : pengga%ungan #ata #ari %e%erapa sum%er * Data Mining ngine : Mentranformasikan #ata men,a#i

 %entuk +ang sesuai untuk #i mining

-* Pattern evaluation : untuk menemukan +ang %ernilai melalui

kno"le#ge %ase

.* Graphical User Interface (GUI) : untuk en# user 

 Semua tahap bersifat interaktif di mana user terlibat langsung 

atau dengan perantaraan knowledge base

Arsitektur #an Mo#el Data Mining

Page 4: Pertemuan 3- Arsitektur Data Mining

7/21/2019 Pertemuan 3- Arsitektur Data Mining

http://slidepdf.com/reader/full/pertemuan-3-arsitektur-data-mining 4/29

Mo#el Data Mining

/Pre#iction Metho#s

 0Menggunakan %e%erapa varia%el untuk 

mempre#iksi sesuatu atau suatu nilai +ang

akan #atang*

/Description Metho#sArsitektur #an Mo#el Data Mining

Page 5: Pertemuan 3- Arsitektur Data Mining

7/21/2019 Pertemuan 3- Arsitektur Data Mining

http://slidepdf.com/reader/full/pertemuan-3-arsitektur-data-mining 5/29

•Pemodelan prediktif adalah proses yang digunakan dala

analisis prediktif untuk membuat model statistik dari perilamasa depan. Predictive analytics adalah bidang data min

yang bersangkutan dengan probabilitas peramalan dan tr

•Sebuah model prediktif terdiri dari sejumlah  prediksi, bai

faktor variabel yang mungkin mempengaruhi perilaku ma

depan atau hasil. Dalam pemasaran, misalnya, jenis kelapelanggan, usia, dan sejarah pembelian mungkin

memprediksi kemungkinan penjualan masa depan.

Prediksi Pemodelan

Page 6: Pertemuan 3- Arsitektur Data Mining

7/21/2019 Pertemuan 3- Arsitektur Data Mining

http://slidepdf.com/reader/full/pertemuan-3-arsitektur-data-mining 6/29

•Pada pemodelan prediktif, data dikumpulkan untuk prediktor y

relevan, model statistik dirumuskan, prediksi yang dibuat dan

model divalidasi (atau revisi) sebagai data tambahan telah

tersedia. odel ini dapat menggunakan persamaan liniersederhana atau jaringan syaraf kompleks , dipetakan oleh

perangkat lunak yang canggih.

•Pemodelan prediktif digunakan secara luas dalam teknologi

informasi. Dalam sistem penyaringan spam, misalnya, pemode

prediktif kadang!kadang digunakan untuk mengidentifikasikemungkinan bah"a pesan yang diberikan adalah spam. #plik

lain dari pemodelan prediktif termasuk manajemen hubungan

pelanggan ($%), perencanaa kapasitas, manajemen perubah

disaster recovery (pemulihan bencana), manajemen keamanan

teknik, meteorologi dan perencanaan kota.

Page 7: Pertemuan 3- Arsitektur Data Mining

7/21/2019 Pertemuan 3- Arsitektur Data Mining

http://slidepdf.com/reader/full/pertemuan-3-arsitektur-data-mining 7/29

Deskriptif Pemodelan

Pemodelan deskriptif, atau clustering  membagi data ke dala

kelompok.

Dengan clustering&• Dapat menentukan kelompok yang tepat, yang tidak diketa

sebelumnya• Pola ditemukan dengan menganalisis data digunakan untu

menentukan kelompok.

isalnya, pengiklan bisa menganalisis masyarakat umum untu

mengklasifikasikan pelanggan potensial ke dalam kelompok ya

berbeda dan kemudian mengembangkan terpisah kampanye

iklan ditargetkan pada setiap kelompok.

Deteksi fraud juga membuat penggunaan clustering untuk

mengidentifikasi kelompok individu dengan pola pembelian yan

sama.

Page 8: Pertemuan 3- Arsitektur Data Mining

7/21/2019 Pertemuan 3- Arsitektur Data Mining

http://slidepdf.com/reader/full/pertemuan-3-arsitektur-data-mining 8/29

!lasifikasi

  Proses untuk menemukan mo#el atau fungsi +ang men,elaskan atau mem%e#a

konsep atau kelas #ata #engan tu,uan untuk #apat mempre#iksi kelas #ari sua

o%,ek +ang la%eln+a ti#ak #iketahui

  Contoh : Mendeteksi Penipuan

  Tujuan : Memprediksi kasus kecurangan transaksi kartu kredit.

 0 Pendekatan :

/ Menggunakan transaksi kartu kredit dan informasi dilihat dari atribut

account holder

 0 Kapan cutomer melakukan pembelian, Dengan cara apa customer

membaar, sebarapa sering customer membaar secara tepat waktu

dll

/ !eri nama"tanda transaksi ang telah dilaksanakan sebagai transaksi a

curang atau ang baik. #ni sebagai atribut klass $ the class attribute.%

/ Pelajari model untuk class transaksi

/ &unakan model ini untuk mendetekdi kecurangan dengan meneliti trans

kartu kredit pada account.Arsitektur #an Mo#el Data Mining

Page 9: Pertemuan 3- Arsitektur Data Mining

7/21/2019 Pertemuan 3- Arsitektur Data Mining

http://slidepdf.com/reader/full/pertemuan-3-arsitektur-data-mining 9/29

3egression

  Digunakan untuk memetakan #ata #engan pre#iksi atri%ut

 %ernilai real

  4ontoh:

 0 Mempre#iksi ,umlah pen,ualan pro#uk %aru pa#a

a#vertising e5pen#iture*

 0 Mempre#iksi kecepatan memutar ("in# velocities) pa#a

fungsi temperatur6 tekanan u#ara 6 #ll

Arsitektur #an Mo#el Data Mining

Page 10: Pertemuan 3- Arsitektur Data Mining

7/21/2019 Pertemuan 3- Arsitektur Data Mining

http://slidepdf.com/reader/full/pertemuan-3-arsitektur-data-mining 10/29

Decision tree (Pohon keputusan)

Salah satu mo#el klasifikasi +ang mu#ah #i interpretasikan4ontoh : i#entifikasi pem%eli komputer ( #ari #ecision tree #i %a"ah

ini tern+ata salah satu kelompok +ang potensial a#alah orang +ang

 %erusia 8 9 #an pela,ar 

age89

stu#en

$-9

+es

;-9

4re#it ratingno

no

+es

+es

e5celent

no

fair 

+es

Arsitektur #an Mo#el Data Mining

Page 11: Pertemuan 3- Arsitektur Data Mining

7/21/2019 Pertemuan 3- Arsitektur Data Mining

http://slidepdf.com/reader/full/pertemuan-3-arsitektur-data-mining 11/29

 <eural <et"ork (=aringan s+araf tiruan)

  =aringan s+araf %uatan #i mulai #engan la+er input6 #imana tiap

simpul %erkorespon#ensi #engan varia%el pre#iktor*

  Simpul$ simpul input ini terhu%ung ke%e%erapa simpul #alam

hi##en la+er*

  Dan simpul #alam hi##en la+er #apat terhu%ung ke simpul lain

#alam hi##en la+er atau ke output la+er*

  >utput la+er ter#iri #ari satu atau %e%erapa varia%le respon

2

- 1

output

27 Septem%er 299.

input .

?i##en la+er 

Page 12: Pertemuan 3- Arsitektur Data Mining

7/21/2019 Pertemuan 3- Arsitektur Data Mining

http://slidepdf.com/reader/full/pertemuan-3-arsitektur-data-mining 12/29

  @elekomunikasi

Data mining #igunakan untuk melihat ,utaan transaksi +ang

masuk #engan tu,uan menam%ah la+anan otomatis

  !euangan

Data mining #igunakan untuk men#eteksi transaksi$

transaksi keuangan +ang mencurigakan #imana akan

susah #ilakukan ,ika menggunakan analisis stan#ar*

  Asuransi27 Septem%er 299. Arsitektur #an Mo#el Data Mining

Page 13: Pertemuan 3- Arsitektur Data Mining

7/21/2019 Pertemuan 3- Arsitektur Data Mining

http://slidepdf.com/reader/full/pertemuan-3-arsitektur-data-mining 13/29

  >lah raga

IM A#vance# Scout menggunakan #ata mining untuk 

menganalisis statistik permainan <A #alam rangka competit

a#vantage untuk tim <e" Bork !nicks

  Astronomi

=et Propulsion Ca%orator+ (=PC) #i Pasa#ena #an Pulomar 

>%servator+ menemukan 22 uasar #engan %antuan #ata

mining*

  Internet Ee% Surf$Ai#27 Septem%er 299. Arsitektur #an Mo#el Data Mining

Page 14: Pertemuan 3- Arsitektur Data Mining

7/21/2019 Pertemuan 3- Arsitektur Data Mining

http://slidepdf.com/reader/full/pertemuan-3-arsitektur-data-mining 14/29

@ools Data Mining

  !arateristik$karateristik penting #ari tool #ata mining meliputi

 0 Data preparation facilities

 0 Selection of #ata mining operation (algorithms)

 0 Pro#uct scala%ilit+ an# performance

 0 'acilities for visualiFation of result

  Data mining tool6 meliputi :

 0 Integral Solution Ct#s 4lementine

 0 DataMin# 4orps Data 4rusher 

 0 IMs Intelligent Miner 

 0 Silicon Graphics Inc*s MineSet

 0 Informations Discover+ Inc*s Data Mining Suite0

Arsitektur #an Mo#el Data Mining

Page 15: Pertemuan 3- Arsitektur Data Mining

7/21/2019 Pertemuan 3- Arsitektur Data Mining

http://slidepdf.com/reader/full/pertemuan-3-arsitektur-data-mining 15/29

volusi Data%ase

  @h H19

 0 Pengumpulan #ata6 pem%uatan #ata6 IMS #an net"ork DMS

  @h H9

 0 Mo#el #ata relasional6 Implementasi DMS relasional

  @h H79

 0 3DMS6 Mo#el #ata lan,utan (e5ten#e#$relational6 >>6 #e#uctive)

  @h HH9

 0 Data mining6 #ata "arehouse6 #ata%ase multime#ia6 #an Ee%

#ata%ase*Arsitektur #an Mo#el Data Mining

Page 16: Pertemuan 3- Arsitektur Data Mining

7/21/2019 Pertemuan 3- Arsitektur Data Mining

http://slidepdf.com/reader/full/pertemuan-3-arsitektur-data-mining 16/29

 %erurut atau

@eknik 0 teknik Data%ase

Searching  Searching #ilakukan untuk memeriksa serangkaian item +ang memiliki sifat

sifat +ang #iinginkan*

  @in#akan untuk menemukan suatu item tertentu %aik +ang #iketahuike%era#aann+a maupun ti#ak*

  Memasukkan kata #alam suatu program komputer untuk mem%an#ingkan#engan informasi +ang a#a #alam #ata%ase*

In#e5ing  In#e5ing a#alah struktur$struktur akses +ang #igunakan untuk mempercepat

respon #alam men#apatkan recor#$recor# pa#a kon#isi$kon#isi pencarian

tertentu*

  In#e5ing fiel# a#alah suatu struktur akses in#e5 +ang %iasan+a men,elaskanfiel# tunggal #ari suatu file*

  In#e5ing organiFation mem%erikan efisiensi akses ke recor#$recor# secara

Page 17: Pertemuan 3- Arsitektur Data Mining

7/21/2019 Pertemuan 3- Arsitektur Data Mining

http://slidepdf.com/reader/full/pertemuan-3-arsitektur-data-mining 17/29

Data 3e#uction

  Data reduction a#alah transformasi suatu masalah ke masalah

lain #an #apat #igunakan untuk men#efinisikan serangkaian

masalah +ang kompleks*

 Data reduction merupakan teknik +ang #igunakan untuk mentransformasi #ari #ata mentah ke %entuk format #ata +ang

le%ih %erguna* Se%agai contoh groupping, summing #an

averaging data.

  Data reduction #ilakukan untuk mengatasi ukuran #ata +ang

terlalu %esar* Ukuran #ata +ang terlalu %esar #apat menim%ulkan

keti#akefisienan proses #an peningkatan %ia+a pemrosesan*Arsitektur #an Mo#el Data Mining

Page 18: Pertemuan 3- Arsitektur Data Mining

7/21/2019 Pertemuan 3- Arsitektur Data Mining

http://slidepdf.com/reader/full/pertemuan-3-arsitektur-data-mining 18/29

>CAP (>n$line anal+tical processing)

  >CAP a#alah suatu sistem atau teknologi +ang #irancang untuk men#ukung proses analisis kompleks #alam rangka mengungkapkan

kecen#erungan pasar #an faktor$faktor penting #alam %isnis

  >CAP #itan#ai #engan kemampuann+a menaikkan atau menurunkan

#imensi #ata sehingga kita #apat menggali #ata sampai pa#a level +ang

sangat #etail #an memperoleh pan#angan +ang le%ih luas mengenai

o%,ek +ang se#ang kita analisis*

  >CAP secara khusus memfokuskan pa#a pem%uatan #ata agar #apat

#iakses pa#a saat pen#efinisian kem%ali #imensi*

  >CAP #apat #igunakan mem%uat rangkuman #ari multi#imensi #ataan %er%e#a ran kuman %aru #an men#a atkan res on secara online

Page 19: Pertemuan 3- Arsitektur Data Mining

7/21/2019 Pertemuan 3- Arsitektur Data Mining

http://slidepdf.com/reader/full/pertemuan-3-arsitektur-data-mining 19/29

Data Earehouse

Definisi :

  Data Earehouse a#alah Pusat repositori informasi +ang mampu

mem%erikan #ata%ase %erorientasi su%+ek untuk informasi +ang

 %ersifat historis +ang men#ukung DSS (Decision Suport S+stem)

#an IS (5ecutive Information S+stem)*

  Salinan #ari transaksi #ata +ang terstruktur secara spesifik pa#a

uer+ #an analisa*

  Salinan #ari transaksi #ata +ang terstruktur spesifik untuk uer+

#an laporan

@u,uan :Arsitektur #an Mo#el Data Mining

Page 20: Pertemuan 3- Arsitektur Data Mining

7/21/2019 Pertemuan 3- Arsitektur Data Mining

http://slidepdf.com/reader/full/pertemuan-3-arsitektur-data-mining 20/29

 0 

 0 

 0 

 0 

4iri$ciri Data Earehouse

@er#apat - karateristik #ata "arehouse

/ Su%,ect oriente#

Data +ang #isusun menurut su%+ek %erisi han+a informasi +ang penting %agi pemprosesa

#ecision support*

 0 Data%ase +ang semua informasi +ang tersimpan #i kelompokkan %er#asarkan

su%+ek tertentu misaln+a: pelanggan6 gu#ang6 pasar6 #s%*

 0 Semua Informasi terse%ut #isimpan #alam suatu sistem data warehouse.

 0 Data$#ata #i setiap su%+ek #irangkum ke #alam #imensi6 misaln+a : perio#e

"aktu6 pro#uk6 "ila+ah6 #s%6 sehingga #apat mem%erikan nilai se,arah untuk  %ahan analisa*

/ Integrate#

=ika #ata terletak pa#a %er%agai aplikasi +ang terpisah #alam suatu lingkungan

operasional6 enco#ing #ata sering ti#ak seragam sehinggga %ila #ata #ipin#ahkan ke #ata

"arehouse maka co#ing akan #iasumsikan sama seperti laFimn+a*

/ @ime$variant

Data "arehouse a#alah tempat untuk storing #ata selama . sampai 9 tahun atau le%ih6Arsitektur #an Mo#el Data Mining

Page 21: Pertemuan 3- Arsitektur Data Mining

7/21/2019 Pertemuan 3- Arsitektur Data Mining

http://slidepdf.com/reader/full/pertemuan-3-arsitektur-data-mining 21/29

/

/

/

2

Masalah$masalah #alam menerapkan Data warehouse :

Dokumentasi #an pengelolaan meta#ata #ari data

warehouse.

Penentuan aturan #alam proses transformasi untuk 

memetakan %er%agai sum%er legac+ #ata +ang akan#imasukkan ke #alam data warehouse.

Pencapaian proses pengem%angan +ang han#al6 %aik 

#alam mem%angun6 mempimplementasikan6 maupun

memelihara data warehouse.

Arsitektur #an Mo#el Data Mining

Page 22: Pertemuan 3- Arsitektur Data Mining

7/21/2019 Pertemuan 3- Arsitektur Data Mining

http://slidepdf.com/reader/full/pertemuan-3-arsitektur-data-mining 22/29

2

 Data Preprocessing 

  Data preprocessing menerangkan tipe$tipe proses +ang melaksanakan #atamentah untuk mempersiapkan proses prose#ur +ang lainn+a*

  Dalam #ata mining menstrasformasi #ata ke suatu format +ang prosesn+ale%ih mu#ah #an efektif untuk ke%utuhan pemakai6 contohn+a <eural

 <et"ork*

  @er#apat %e%erapa alat #an meto#e +ang %er%e#a +ang #igunakan untuk  preprocessing seperti :

 0 Sampling : men+eleksi su%set representatif #ari populasi #ata +ang %esar*

 0 Transformation : memanipulasi #ata mentah untuk menghasilkaninput tunggal*

 0  Denoising : menghilangkan noise #ari #ata

 0  Normaliation : mengorganisasi #ata untuk pengaksesan +ang le%ihspesifik 

 0  !eature e"tration : mem%uka spesifikasi #ata +ang signifikan #alam

Page 23: Pertemuan 3- Arsitektur Data Mining

7/21/2019 Pertemuan 3- Arsitektur Data Mining

http://slidepdf.com/reader/full/pertemuan-3-arsitektur-data-mining 23/29

2

!no"le#ge Discover+ In Data%ase (!DD)

  !DD %erhu%ungan #engan teknik integrasi #an penemuan

ilmiah6 interprestasi #an visualisasi #ari pola$pola

se,umlah kumpulan #ata*

  Knowledge discovery in databases (!DD) a#alah

keseluruhan proses non$trivial untuk mencari #an

mengi#entifikasi pola (pattern) #alam #ata6 #imana pola

+ang #itemukan %ersifat sah6 %aru6 #apat %ermanfaat #an

#apat #imengerti*

Page 24: Pertemuan 3- Arsitektur Data Mining

7/21/2019 Pertemuan 3- Arsitektur Data Mining

http://slidepdf.com/reader/full/pertemuan-3-arsitektur-data-mining 24/29

2

Gam%ar* * @ahapan !DD

Arsitektur #an Mo#el Data Mining

Page 25: Pertemuan 3- Arsitektur Data Mining

7/21/2019 Pertemuan 3- Arsitektur Data Mining

http://slidepdf.com/reader/full/pertemuan-3-arsitektur-data-mining 25/29

2

@ahapan Proses !DD

. Data Selection

 0 Menciptakan himpunan #ata target 6 pemilihanhimpunan #ata6 atau memfokuskan pa#a su%set varia%el

atau sampel #ata6 #imana penemuan (#iscover+) akan

#ilakukan*

 0 Pemilihan (seleksi) #ata #ari sekumpulan #ata

operasional perlu #ilakukan se%elum tahap penggalian27 Septem%er 299. Arsitektur #an Mo#el Data Mining

Page 26: Pertemuan 3- Arsitektur Data Mining

7/21/2019 Pertemuan 3- Arsitektur Data Mining

http://slidepdf.com/reader/full/pertemuan-3-arsitektur-data-mining 26/29

2

#. Pre$processing% &leaning 

 0 Pemprosesan pen#ahuluan #an pem%ersihan #ata merupakan

operasi #asar seperti penghapusan noise #ilakukan*

 0 Se%elum proses data mining #apat #ilaksanakan6 perlu

#ilakukan proses cleaning pa#a #ata +ang men,a#i fokus

!DD*

 0 Proses cleaning mencakup antara lain mem%uang #uplikasi

#ata6 memeriksa #ata +ang inkonsisten6 #an memper%aiki

kesalahan pa#a #ata6 seperti kesalahan cetak (tipografi)*

0 J

Arsitektur #an Mo#el Data Mining

Page 27: Pertemuan 3- Arsitektur Data Mining

7/21/2019 Pertemuan 3- Arsitektur Data Mining

http://slidepdf.com/reader/full/pertemuan-3-arsitektur-data-mining 27/29

2

'. Transformation

 0 Pencarian fitur$fitur +ang %erguna untuk 

mempresentasikan #ata %ergantung kepa#a goal +ang

ingin #icapai*

 0 Merupakan proses transformasi pa#a #ata +ang telah

#ipilih6 sehingga #ata terse%ut sesuai untuk proses data

mining. Proses ini merupakan proses kreatif #an sangat

tergantung pa#a ,enis atau pola informasi +ang akan

#icari #alam %asis #ata

Arsitektur #an Mo#el Data Mining

Page 28: Pertemuan 3- Arsitektur Data Mining

7/21/2019 Pertemuan 3- Arsitektur Data Mining

http://slidepdf.com/reader/full/pertemuan-3-arsitektur-data-mining 28/29

2

(. Data mining 

 0 Pemilihan tugas #ata miningK pemilihan goal #ari proses

!DD misaln+a klasifikasi6 regresi6 clustering6 #ll*

 0 Pemilihan algoritma #ata mining untuk pencarian

(searching)

 0  Proses Data mining +aitu proses mencari pola atau

informasi menarik #alam #ata terpilih #engan

menggunakan teknik atau meto#e tertentu* @eknik6

meto#e6 atau algoritma #alam data mining sangat %ervariasi* Pemilihan meto#e atau al oritma an te at

Arsitektur #an Mo#el Data Mining

Page 29: Pertemuan 3- Arsitektur Data Mining

7/21/2019 Pertemuan 3- Arsitektur Data Mining

http://slidepdf.com/reader/full/pertemuan-3-arsitektur-data-mining 29/29

2

). *nterpretation% +valuation

 0 Pener,emahan pola$pola +ang #ihasilkan #ari data

mining.

 0 Pola informasi +ang #ihasilkan #ari proses data mining 

 perlu #itampilkan #alam %entuk +ang mu#ah #imengerti

oleh pihak +ang %erkepentingan* 0 @ahap ini merupakan %agian #ari proses !DD +ang

mencakup pemeriksaan apakah pola atau informasi

+ang #itemukan %ertentangan #engan fakta atau

hipotesa +ang a#a se%elumn+a*

Arsitektur #an Mo#el Data Mining