mata kuliah :web mining dosen nama : mulaab, ssi, m.kom ruang : puskom contact : 0857 3321 5507

25
Mata Kuliah :Web Mining Dosen Nama : Mulaab, Ssi, M.Kom Ruang : Puskom Contact : 0857 3321 5507 SKS : 3

Upload: wilma-mcmahon

Post on 03-Jan-2016

88 views

Category:

Documents


3 download

DESCRIPTION

Mata Kuliah :Web Mining Dosen Nama : Mulaab, Ssi, M.Kom Ruang : Puskom Contact : 0857 3321 5507 SKS : 3. Materi Kuliah. Pengantar Web Mining Dasar-dasar data Mining Association Rules and Sequential Patterns Supervised Learning Unsupervised Learning Partially Supervised Learning - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: Mata Kuliah :Web Mining Dosen Nama : Mulaab, Ssi, M.Kom Ruang : Puskom Contact : 0857 3321 5507

Mata Kuliah :Web Mining Dosen

Nama : Mulaab, Ssi, M.Kom Ruang : Puskom Contact : 0857 3321 5507

SKS : 3

Page 2: Mata Kuliah :Web Mining Dosen Nama : Mulaab, Ssi, M.Kom Ruang : Puskom Contact : 0857 3321 5507

Materi Kuliah Pengantar Web Mining Dasar-dasar data Mining Association Rules and Sequential Patterns Supervised Learning Unsupervised Learning Partially Supervised Learning Information Retrieval and Web Search Opinion Mining Web Usage Mining

Page 3: Mata Kuliah :Web Mining Dosen Nama : Mulaab, Ssi, M.Kom Ruang : Puskom Contact : 0857 3321 5507

Pengantar

Tantangan Web Mining Dasar dasar Web Mining Klasifikasi Web Minin

Page 4: Mata Kuliah :Web Mining Dosen Nama : Mulaab, Ssi, M.Kom Ruang : Puskom Contact : 0857 3321 5507

Web Mining – The Idea Banyaknya dokumen HTML, gambar dan file

multimedia yang ada di internet, sehinggan menemukan content yang yang diinginkan adalah tugas yang sangat sulit

Page 5: Mata Kuliah :Web Mining Dosen Nama : Mulaab, Ssi, M.Kom Ruang : Puskom Contact : 0857 3321 5507

Web Mining Web adalah salah satu sumber data yang

sangat besar Berbagai bidang yang dipersiapakan:

data mining, machine learning, natural language processing, statistics, databases, information retrieval, multimedia, .

Page 6: Mata Kuliah :Web Mining Dosen Nama : Mulaab, Ssi, M.Kom Ruang : Puskom Contact : 0857 3321 5507

Peluang dan Tantangan Jumlah informasi di web sangat besar dan mudah diakses Mencari informasi yang beragam. Kita dapat menemukan berbagai macam informasi Information/data dari berbagai bentuk tipe data., structured tables,

texts, multimedia data, . Ada banyak hyperlinks dalam website dan antar website Banyak informasi Web information yang redundantis redundant.

Page 7: Mata Kuliah :Web Mining Dosen Nama : Mulaab, Ssi, M.Kom Ruang : Puskom Contact : 0857 3321 5507

Peluand dan Tantangan The Web is noisy. Informasi dari web berisi banyak berbagai macam

informasi , content utama, iklan, panel navigasi dll. The Web juga ada services. The Web is dynamic. the Web is a virtual society.

Page 8: Mata Kuliah :Web Mining Dosen Nama : Mulaab, Ssi, M.Kom Ruang : Puskom Contact : 0857 3321 5507

Web Mining

Application dari data mining secara otomatis menemukan dan mengektrak informasi dari data web

Page 9: Mata Kuliah :Web Mining Dosen Nama : Mulaab, Ssi, M.Kom Ruang : Puskom Contact : 0857 3321 5507

Data Mining vs. Web Mining Traditional data mining

data terstruktur tabel

Web data Semi-structured and unstructured kaya fitur dan pola

Page 10: Mata Kuliah :Web Mining Dosen Nama : Mulaab, Ssi, M.Kom Ruang : Puskom Contact : 0857 3321 5507

Klasifikasi Teknik Web Mining

Web Content Mining Web-Structure Mining Web-Usage Mining

Page 11: Mata Kuliah :Web Mining Dosen Nama : Mulaab, Ssi, M.Kom Ruang : Puskom Contact : 0857 3321 5507

Web-Structure MiningMenemukan hirarki dari hiperlink dalam website dan strukturnya.

Web Mining

Web Usage Mining

Web Content Mining

Web Structure Mining

Page 12: Mata Kuliah :Web Mining Dosen Nama : Mulaab, Ssi, M.Kom Ruang : Puskom Contact : 0857 3321 5507

Web-Structure Mining cont… Menemukan informasi tentang relevansi dan kualitas dari web dari topik dan content

Page 13: Mata Kuliah :Web Mining Dosen Nama : Mulaab, Ssi, M.Kom Ruang : Puskom Contact : 0857 3321 5507

Web-Usage Mining

Web Mining

Web Usage Mining

Web Content Mining

Web Structure Mining

Menemukan pola navigasi dari data web : memprediksi interaksi user dengan web, membantu memperbaiki resources.

Page 14: Mata Kuliah :Web Mining Dosen Nama : Mulaab, Ssi, M.Kom Ruang : Puskom Contact : 0857 3321 5507

Web-Usage Mining Teknik Usage Mining

Data PreparationData Collection Data SelectionData Cleaning

Data MiningNavigation PatternsSequential Patterns

Page 15: Mata Kuliah :Web Mining Dosen Nama : Mulaab, Ssi, M.Kom Ruang : Puskom Contact : 0857 3321 5507

Web-Usage Mining cont… Data Mining Techniques – Navigation Patterns

A

B

C D

E

Page 16: Mata Kuliah :Web Mining Dosen Nama : Mulaab, Ssi, M.Kom Ruang : Puskom Contact : 0857 3321 5507

Web-Usage Mining Data Mining Techniques – Navigation Patterns

Analysis:

Page 17: Mata Kuliah :Web Mining Dosen Nama : Mulaab, Ssi, M.Kom Ruang : Puskom Contact : 0857 3321 5507

Web-Usage Mining cont… Data Mining Techniques – Sequential Patterns

Example:

Supermarket

Cont…

Customer Transaction Time Purchased Items John 6/21/05 5:30 pm BeerJohn 6/22/05 10:20 pm Brandy

Frank 6/20/05 10:15 am Juice, CokeFrank 6/20/05 11:50 am BeerFrank 6/20/05 12:50 am Wine, Cider

Mary 6/20/05 2:30 pm BeerMary 6/21/05 6:17 pm Wine, CiderMary 6/22/05 5:05 pm Brandy

Page 18: Mata Kuliah :Web Mining Dosen Nama : Mulaab, Ssi, M.Kom Ruang : Puskom Contact : 0857 3321 5507

Web-Usage Mining cont… Data Mining Techniques – Sequential PatternsContoh

In Google search, dalam minggu terakhir 30% pengguna telah mengunjungi /company/product/ had dengan ‘camera’ sebagai kunci pencarian

Page 19: Mata Kuliah :Web Mining Dosen Nama : Mulaab, Ssi, M.Kom Ruang : Puskom Contact : 0857 3321 5507

Web Content Mining Meneumukan informasi dari jutaan content dari

berbagai sumber informasi World Wide Web Misalkan, Web data contents: text, Image, audio, video,

metadata and hyperlinks

Page 20: Mata Kuliah :Web Mining Dosen Nama : Mulaab, Ssi, M.Kom Ruang : Puskom Contact : 0857 3321 5507

Web Content Mining Pre-processing data sebelum web content mining:

feature selection Post-processing data untuk mengurangi kebingungan

dari hasil pencarian Search Engine Mining

Memperbaiki pencarian content.

Page 21: Mata Kuliah :Web Mining Dosen Nama : Mulaab, Ssi, M.Kom Ruang : Puskom Contact : 0857 3321 5507

Web Content Mining Web content mining terkaita dengan

datamining dan text mining Terkait daengan data mining karena teknik

datamining digunakan dalam web content mining. Terkait dengan text mining karena sebagian

besar konten adalah text Web data adalah semi-structured dan atau

unstructured, karena data mining adalah terstruktur dan text adalah unstructured.

Page 22: Mata Kuliah :Web Mining Dosen Nama : Mulaab, Ssi, M.Kom Ruang : Puskom Contact : 0857 3321 5507

Teknik untuk Web Content Mining

Classifications Clustering Association

Page 23: Mata Kuliah :Web Mining Dosen Nama : Mulaab, Ssi, M.Kom Ruang : Puskom Contact : 0857 3321 5507

Document Classification Supervised Learning

Klasifikasi dokumen

Techniques used are Nearest Neighbor Classifier Feature Selection Decision Tree

Page 24: Mata Kuliah :Web Mining Dosen Nama : Mulaab, Ssi, M.Kom Ruang : Puskom Contact : 0857 3321 5507

Feature Selection

Menghilang istilah-istilah dalam training documents which yang secara statistik tidak terkait dengan label kelas

Page 25: Mata Kuliah :Web Mining Dosen Nama : Mulaab, Ssi, M.Kom Ruang : Puskom Contact : 0857 3321 5507

Thank You!