classification steps (1) · 2013-08-11 · classification steps (1)...
TRANSCRIPT
![Page 1: CLASSIFICATION STEPS (1) · 2013-08-11 · CLASSIFICATION STEPS (1) ข้อมูลการเรียนรู้ (Train data) เทคนิค Classification ข้อมูลทดสอบ](https://reader033.vdocuments.us/reader033/viewer/2022042003/5e6ea7b1ba5c475a9c171a54/html5/thumbnails/1.jpg)
CLASSIFICATION STEPS (1)
ขอมลการเรยนร(Train data)
ขอมลการเรยนร(Train data)
เทคนคClassification
ขอมลทดสอบ(Evaluation)
โมเดลModel
แอทรบวต 1 แอทรบวต 1 แอทรบวต 1
1 0 A
0 1 B
ขนตอนการสรางโมเดล(Classification modelbuilding)
1
แอทรบวต 1 แอทรบวต 2
1 0
คลาสทท านาย
A
คลาสทท านาย
A
ขนตอนการวดประสทธภาพ(Evaluation)
2
เปรยบเทยบผลทไดจากโมเดลและค าตอบจรง
![Page 2: CLASSIFICATION STEPS (1) · 2013-08-11 · CLASSIFICATION STEPS (1) ข้อมูลการเรียนรู้ (Train data) เทคนิค Classification ข้อมูลทดสอบ](https://reader033.vdocuments.us/reader033/viewer/2022042003/5e6ea7b1ba5c475a9c171a54/html5/thumbnails/2.jpg)
CLASSIFICATION STEPS (2)ขอมลการเรยนร(Trainy data)ขอมลการเรยนร(Trainy data)
เทคนคClassification
ขอมลทดสอบ(Evaluation)
โมเดลModel
แอทรบวต 1 แอทรบวต 1 แอทรบวต 1
1 0 A
0 1 B
ขนตอนการสรางโมเดล(Classification modelbuilding)
1
แอทรบวต 1 แอทรบวต 2
1 0
คลาสทท านาย
A
คลาสทท านาย
A
ขนตอนการวดประสทธภาพ(Evaluation)
2
โมเดลModel
แอทรบวต 1 แอทรบวต 2
1 0
คลาส
Aการใชงานจรง
3 Unseen data
![Page 3: CLASSIFICATION STEPS (1) · 2013-08-11 · CLASSIFICATION STEPS (1) ข้อมูลการเรียนรู้ (Train data) เทคนิค Classification ข้อมูลทดสอบ](https://reader033.vdocuments.us/reader033/viewer/2022042003/5e6ea7b1ba5c475a9c171a54/html5/thumbnails/3.jpg)
EVALUATION MODEL :SELF CONSISTENCY TEST
การวดประสทธภาพของโมเดลโดยใชขอมลเรยนร training data ใชขอมลเรยนรทงหมดเพอ Evaluate โมเดล (Self Consistency Test) ควรจะไดคาความถกตองทสงหรอเทากบ 100 %
1 2 76
4 35
89 10
Training data
1 2 76
4 35
89 10
Evaluation Data
![Page 4: CLASSIFICATION STEPS (1) · 2013-08-11 · CLASSIFICATION STEPS (1) ข้อมูลการเรียนรู้ (Train data) เทคนิค Classification ข้อมูลทดสอบ](https://reader033.vdocuments.us/reader033/viewer/2022042003/5e6ea7b1ba5c475a9c171a54/html5/thumbnails/4.jpg)
EVALUATION MODEL :CROSS VALIDATION
การวดประสทธภาพของโมเดลแบบ cross-validation
แบงขอมลเรยนรออกเปน k ชดเทา ๆ กน ใชขอมลสวนทเหลอ (k ‟ 1 ชด) เพอท า การสรางโมเดล เกบขอมลทแบงไว 1 ชด เพอท าการ
Evaluate วนท าซ าจนขอมลทกสวนถกน ามา
ทดสอบ
1 5
2 7
6 8
9
4 3
10
ขอมลชดท 1 ขอมลชดท 2
ขอมลชดท 4ขอมลชดท 3
ขอมลชดท 5
Training data
![Page 5: CLASSIFICATION STEPS (1) · 2013-08-11 · CLASSIFICATION STEPS (1) ข้อมูลการเรียนรู้ (Train data) เทคนิค Classification ข้อมูลทดสอบ](https://reader033.vdocuments.us/reader033/viewer/2022042003/5e6ea7b1ba5c475a9c171a54/html5/thumbnails/5.jpg)
EVALUATION MODEL :CROSS VALIDATION(2) การวดประสทธภาพของโมเดลแบบ cross ‟ validation ทนยมไดแก
1. 5-fold cross-validation2. 10-fold cross-validation3. Leave ‟ One ‟ Out cross-validation
![Page 6: CLASSIFICATION STEPS (1) · 2013-08-11 · CLASSIFICATION STEPS (1) ข้อมูลการเรียนรู้ (Train data) เทคนิค Classification ข้อมูลทดสอบ](https://reader033.vdocuments.us/reader033/viewer/2022042003/5e6ea7b1ba5c475a9c171a54/html5/thumbnails/6.jpg)
EVALUATION MODEL :CROSS VALIDATION (3) 5 ‟ fold cross -validation
2 7
9
4 3
10
ขอมลชดท 2
ขอมลชดท 4
ขอมลชดท 3
Training data
1 5
ขอมลชดท 1
Evaluate data
6 8
ขอมลชดท 5
รอบท 1 Accuracy %Accuracy รอบท 1 = 80.74 %
![Page 7: CLASSIFICATION STEPS (1) · 2013-08-11 · CLASSIFICATION STEPS (1) ข้อมูลการเรียนรู้ (Train data) เทคนิค Classification ข้อมูลทดสอบ](https://reader033.vdocuments.us/reader033/viewer/2022042003/5e6ea7b1ba5c475a9c171a54/html5/thumbnails/7.jpg)
EVALUATION MODEL :CROSS VALIDATION (4) 5 ‟ fold cross -validation
2 7
9
1 5
10
ขอมลชดท 1
ขอมลชดท 4
ขอมลชดท 3
Training data
4 3
ขอมลชดท 2
Evaluate data
6 8
ขอมลชดท 5
รอบท 2 Accuracy %Accuracy รอบท 2 = 82.39 %
![Page 8: CLASSIFICATION STEPS (1) · 2013-08-11 · CLASSIFICATION STEPS (1) ข้อมูลการเรียนรู้ (Train data) เทคนิค Classification ข้อมูลทดสอบ](https://reader033.vdocuments.us/reader033/viewer/2022042003/5e6ea7b1ba5c475a9c171a54/html5/thumbnails/8.jpg)
EVALUATION MODEL :CROSS VALIDATION (5) 5 ‟ fold cross -validation
4 3
9
1 5
10
ขอมลชดท 1
ขอมลชดท 4
ขอมลชดท 2
Training data
2 7
ขอมลชดท 3
Evaluate data
6 8
ขอมลชดท 5
รอบท 3 Accuracy %Accuracy รอบท 3 = 80.69 %
![Page 9: CLASSIFICATION STEPS (1) · 2013-08-11 · CLASSIFICATION STEPS (1) ข้อมูลการเรียนรู้ (Train data) เทคนิค Classification ข้อมูลทดสอบ](https://reader033.vdocuments.us/reader033/viewer/2022042003/5e6ea7b1ba5c475a9c171a54/html5/thumbnails/9.jpg)
EVALUATION MODEL :CROSS VALIDATION (6) 5 ‟ fold cross -validation
4 3
2 7
1 5
ขอมลชดท 1
ขอมลชดท 3
ขอมลชดท 2
Training data
9
ขอมลชดท 4
Evaluate data
6 8
ขอมลชดท 5
รอบท 4 Accuracy %Accuracy รอบท 4 = 81.24 %
10
![Page 10: CLASSIFICATION STEPS (1) · 2013-08-11 · CLASSIFICATION STEPS (1) ข้อมูลการเรียนรู้ (Train data) เทคนิค Classification ข้อมูลทดสอบ](https://reader033.vdocuments.us/reader033/viewer/2022042003/5e6ea7b1ba5c475a9c171a54/html5/thumbnails/10.jpg)
EVALUATION MODEL :CROSS VALIDATION (7) 5 ‟ fold cross -validation
4 3
2 7
1 5
ขอมลชดท 1
ขอมลชดท 3
ขอมลชดท 2
Training data
6 8
ขอมลชดท 5
Evaluate data
9
ขอมลชดท 4
รอบท 5 Accuracy %Accuracy รอบท 5 = 80.72 %
10
![Page 11: CLASSIFICATION STEPS (1) · 2013-08-11 · CLASSIFICATION STEPS (1) ข้อมูลการเรียนรู้ (Train data) เทคนิค Classification ข้อมูลทดสอบ](https://reader033.vdocuments.us/reader033/viewer/2022042003/5e6ea7b1ba5c475a9c171a54/html5/thumbnails/11.jpg)
EVALUATION MODEL :CROSS VALIDATION (8) คาความถกตองของ Model
overall accuracy = Average(∑ Accuracy)k
i=1 i
![Page 12: CLASSIFICATION STEPS (1) · 2013-08-11 · CLASSIFICATION STEPS (1) ข้อมูลการเรียนรู้ (Train data) เทคนิค Classification ข้อมูลทดสอบ](https://reader033.vdocuments.us/reader033/viewer/2022042003/5e6ea7b1ba5c475a9c171a54/html5/thumbnails/12.jpg)
EVALUATION MODEL :CROSS VALIDATION (9) Leave-One-Out cross-validation
Training data
1
Evaluate data
รอบท 1
2 76
4 35
89 10
![Page 13: CLASSIFICATION STEPS (1) · 2013-08-11 · CLASSIFICATION STEPS (1) ข้อมูลการเรียนรู้ (Train data) เทคนิค Classification ข้อมูลทดสอบ](https://reader033.vdocuments.us/reader033/viewer/2022042003/5e6ea7b1ba5c475a9c171a54/html5/thumbnails/13.jpg)
EVALUATION MODEL :CROSS VALIDATION (10) Leave-One-Out cross-validation
Training data
2
Evaluate data
รอบท 2
1 76
4 35
89 10
![Page 14: CLASSIFICATION STEPS (1) · 2013-08-11 · CLASSIFICATION STEPS (1) ข้อมูลการเรียนรู้ (Train data) เทคนิค Classification ข้อมูลทดสอบ](https://reader033.vdocuments.us/reader033/viewer/2022042003/5e6ea7b1ba5c475a9c171a54/html5/thumbnails/14.jpg)
EVALUATION MODEL :CROSS VALIDATION (11) Leave-One-Out cross-validation
Training data
3
Evaluate data
รอบท 3
1 2 76
45
89 10
![Page 15: CLASSIFICATION STEPS (1) · 2013-08-11 · CLASSIFICATION STEPS (1) ข้อมูลการเรียนรู้ (Train data) เทคนิค Classification ข้อมูลทดสอบ](https://reader033.vdocuments.us/reader033/viewer/2022042003/5e6ea7b1ba5c475a9c171a54/html5/thumbnails/15.jpg)
EVALUATION MODEL :CROSS VALIDATION (12) Leave-One-Out cross-validation
Training data Evaluate data
รอบท N (N = 10)
1 2 76
4 35 8
9
10
![Page 16: CLASSIFICATION STEPS (1) · 2013-08-11 · CLASSIFICATION STEPS (1) ข้อมูลการเรียนรู้ (Train data) เทคนิค Classification ข้อมูลทดสอบ](https://reader033.vdocuments.us/reader033/viewer/2022042003/5e6ea7b1ba5c475a9c171a54/html5/thumbnails/16.jpg)
EVALUATION MODEL :SPLIT DATA
การวดประสทธภาพของโมเดลการใชขอมลเรยนรบางสวน แบงขอมลออกเปน 2 สวน สวนท 1 ส าหรบใชในการเรยนร
(training) เปนขอมลสวนใหญ ประมาณ 2 ใน 3 หรอ 66 % ของขอมล เรยนรสวนท 1 ส าหรบใชในการทดสอล(testing) เปนขอมลสวนนอยทเหลอในขอมลเรยนร ประมาณ 1 ใน 3 หรอ 33 % ของขอมล เรยนร
Training data
Evaluate data
1
2
7
64 35
89
1033 %
67 %
![Page 17: CLASSIFICATION STEPS (1) · 2013-08-11 · CLASSIFICATION STEPS (1) ข้อมูลการเรียนรู้ (Train data) เทคนิค Classification ข้อมูลทดสอบ](https://reader033.vdocuments.us/reader033/viewer/2022042003/5e6ea7b1ba5c475a9c171a54/html5/thumbnails/17.jpg)
EVALUATE STEP 2 (2) ตววดประสทธภาพโมเดล
คาความถกตอง (Accuracy) ส าหรบขอมลประเภท (nominal) คาความคลาดเคลอน(Error) ส าหรบขอมลตวเลข (numeric)
![Page 18: CLASSIFICATION STEPS (1) · 2013-08-11 · CLASSIFICATION STEPS (1) ข้อมูลการเรียนรู้ (Train data) เทคนิค Classification ข้อมูลทดสอบ](https://reader033.vdocuments.us/reader033/viewer/2022042003/5e6ea7b1ba5c475a9c171a54/html5/thumbnails/18.jpg)
EVALUATE STEP 2 (3) คาความถกตอง (accuracy)
% ของจ านวนขอมลทตอบถก คาทตรงกนระหวางขอมลจรงและขอมลท ท านายได
คาความคลาดเคลอน (error) คาทแตกตางจากคาจรง
คาทคาดเดาได (predicted)- คาจรง
ขอมลจรง ขอมลทท านายได
A A
D D
A D
D A
A A
D D
ขอมลจรง ขอมลทท านายได
10 10
15 16
17 17.1
20 19.8
25 25
30 30
คาความถกตอง = (4/6)x100=66.67%คาความผดพลาดรวม=|15-16|+ |17.1-17|+|20-19.8|=1.3
![Page 19: CLASSIFICATION STEPS (1) · 2013-08-11 · CLASSIFICATION STEPS (1) ข้อมูลการเรียนรู้ (Train data) เทคนิค Classification ข้อมูลทดสอบ](https://reader033.vdocuments.us/reader033/viewer/2022042003/5e6ea7b1ba5c475a9c171a54/html5/thumbnails/19.jpg)
CLASSIFICATION IN WEKA
เปด Weka > เลอก Explorer > กดปม Open file…. > เลอกไฟล data\weather.arff
![Page 20: CLASSIFICATION STEPS (1) · 2013-08-11 · CLASSIFICATION STEPS (1) ข้อมูลการเรียนรู้ (Train data) เทคนิค Classification ข้อมูลทดสอบ](https://reader033.vdocuments.us/reader033/viewer/2022042003/5e6ea7b1ba5c475a9c171a54/html5/thumbnails/20.jpg)
CLASSIFICATION IN WEKA (CONT’) คลกท tab Classify
12
3
4
![Page 21: CLASSIFICATION STEPS (1) · 2013-08-11 · CLASSIFICATION STEPS (1) ข้อมูลการเรียนรู้ (Train data) เทคนิค Classification ข้อมูลทดสอบ](https://reader033.vdocuments.us/reader033/viewer/2022042003/5e6ea7b1ba5c475a9c171a54/html5/thumbnails/21.jpg)
1: CLASSIFIER
เทคนคในการท า classification แบบตาง ๆ Bayes
สรางโมเดลโดยอาศยการค านวณความนาจะเปนของขอมลตาง ๆ
Functions สรางโมเดลโดยอาศยการค านวณทางคณตศาสตร โมเดลเปนรปแบบของสมการ
Lazy ตางจากเทคนค classification แบบอน ๆ ไมมการสรางโมเดลไวกอน ใชขอมลเรยนรเพอจ าแนกประเภทขอมลของขอมลใหมไดเลย
![Page 22: CLASSIFICATION STEPS (1) · 2013-08-11 · CLASSIFICATION STEPS (1) ข้อมูลการเรียนรู้ (Train data) เทคนิค Classification ข้อมูลทดสอบ](https://reader033.vdocuments.us/reader033/viewer/2022042003/5e6ea7b1ba5c475a9c171a54/html5/thumbnails/22.jpg)
1: CLASSIFIER (CONT’)
เทคนคในการท า classification แบบตาง ๆ Meta
เปนการสรางโมเดลโดยอาศยเทคนคของ Classifications หลาย ๆ เทคนค เพอเพมความถกตองในการจ าแนกประเภทขอมล(classification)หรอคาดเดา (prediction)
Trees สรางโมเดลแบบตนไม (tree) ในการจ าแนกขอมล
(classify) Rules
สรางโมเดลในรปแบบของกฏ
![Page 23: CLASSIFICATION STEPS (1) · 2013-08-11 · CLASSIFICATION STEPS (1) ข้อมูลการเรียนรู้ (Train data) เทคนิค Classification ข้อมูลทดสอบ](https://reader033.vdocuments.us/reader033/viewer/2022042003/5e6ea7b1ba5c475a9c171a54/html5/thumbnails/23.jpg)
1: CLASSIFIER (CONT’)
คลกทบรเวณชอของเทคนค ปรากฏหนาตางใหก าหนดคา พารามเตอร
ตาง ๆ More เพอดรายละเอยดของพารามเตอร
ตาง ๆ Save...บนทกคาพารามเตอรทเซตไว Open...เปดไฟลทเกบคาพารามเตอรทเซตไว
![Page 24: CLASSIFICATION STEPS (1) · 2013-08-11 · CLASSIFICATION STEPS (1) ข้อมูลการเรียนรู้ (Train data) เทคนิค Classification ข้อมูลทดสอบ](https://reader033.vdocuments.us/reader033/viewer/2022042003/5e6ea7b1ba5c475a9c171a54/html5/thumbnails/24.jpg)
1: CLASSIFIER (CONT’) เลอกขอมลเพอใชทดสอบ
Use training set ใชขอมลเรยนรทงหมดเพอเปนตวทดสอบ
ประสทธภาพ Supplied test set
ใชขอมลใหม (unseen data) เพอท าการทดสอบโมเดลทสรางขน
Cross-validation ( default 10 folds ) แบงขอมลเรยนรออกเปน k สวนเทา ๆ กน (folds)
เพอใชในการทดสอบ ระบจ านวน k ในชอง Folds
Percentage split แบงขอมลเรยนรออกเปน x % เพอใชในการสราง
โมเดล สวนทเหลอใชเปนขอมลทดสอบ ก าหนดในชอง %
แอตทรบวตทจะใชเปนคลาส(class)ในการจ าแนกประเภทขอมล(ปกตจะเปนแอตทรบวตสดทาย)
![Page 25: CLASSIFICATION STEPS (1) · 2013-08-11 · CLASSIFICATION STEPS (1) ข้อมูลการเรียนรู้ (Train data) เทคนิค Classification ข้อมูลทดสอบ](https://reader033.vdocuments.us/reader033/viewer/2022042003/5e6ea7b1ba5c475a9c171a54/html5/thumbnails/25.jpg)
3: RESULT LIST
แสดงผลการท างานครงกอน ๆ แสดงเวลา เทคนคทใช คลกขวาทผลจะแสดง option เพมเตม
Load model เปดโมเดลทไดเคยเกบไว Save model บนทกโมเดลไวใชในคราวตอไป
Visualize tree (มเฉพาะเทคนค J48)ใชแสดงโมเดล (decision tree) ในรปแบบตนไม
![Page 26: CLASSIFICATION STEPS (1) · 2013-08-11 · CLASSIFICATION STEPS (1) ข้อมูลการเรียนรู้ (Train data) เทคนิค Classification ข้อมูลทดสอบ](https://reader033.vdocuments.us/reader033/viewer/2022042003/5e6ea7b1ba5c475a9c171a54/html5/thumbnails/26.jpg)
4: CLASSIFIER OUTPUT (2)แสดงผลการจ าแนกประเภทขอมล (classify)Run information
แสดงรายละเอยดของขอมลทใช เทคนคและพารามเตอรทเลอก การทดสอบประสทธภาพ
Classifier model (full training set) สรางโมเดล เชน tree ทสรางไดจากขอมลเรยนรทงหมด
Summary คาความถกตอง (Accuracy)
„ กรณทคลาสเปนขอมลแบบประเภท Nominal
คาความคลาดเคลอน (error)„ กรณทคลาสเปนขอมลแบบตวเลข (numeric)
![Page 27: CLASSIFICATION STEPS (1) · 2013-08-11 · CLASSIFICATION STEPS (1) ข้อมูลการเรียนรู้ (Train data) เทคนิค Classification ข้อมูลทดสอบ](https://reader033.vdocuments.us/reader033/viewer/2022042003/5e6ea7b1ba5c475a9c171a54/html5/thumbnails/27.jpg)
4: CLASSIFIER OUTPUTแสดงผลการจ าแนกประเภทขอมล (classify)Detailed accuracy By Class คาทางสถตของเมอแยกตามคลาส TP Rate (True Positive) คาททายถก FP Rate (False Positive) คาททายผด
Confusion Matrix คอลมน : คาทท านายได แถว : คาจรง
ขอมล 2 สวนทายนจะไมมเมอคลาสเปนตวเลข !!!
![Page 28: CLASSIFICATION STEPS (1) · 2013-08-11 · CLASSIFICATION STEPS (1) ข้อมูลการเรียนรู้ (Train data) เทคนิค Classification ข้อมูลทดสอบ](https://reader033.vdocuments.us/reader033/viewer/2022042003/5e6ea7b1ba5c475a9c171a54/html5/thumbnails/28.jpg)
4: CLASSIFIER OUTPUT (3)
![Page 29: CLASSIFICATION STEPS (1) · 2013-08-11 · CLASSIFICATION STEPS (1) ข้อมูลการเรียนรู้ (Train data) เทคนิค Classification ข้อมูลทดสอบ](https://reader033.vdocuments.us/reader033/viewer/2022042003/5e6ea7b1ba5c475a9c171a54/html5/thumbnails/29.jpg)
CONFUSION MATRIX
พจารณาท class A True Positive (TP)คอจ านวนท classifyถกวาเปน class A
Class A B
A 8 2
B 3 4
8
True Positive
{Actual
Predicted
![Page 30: CLASSIFICATION STEPS (1) · 2013-08-11 · CLASSIFICATION STEPS (1) ข้อมูลการเรียนรู้ (Train data) เทคนิค Classification ข้อมูลทดสอบ](https://reader033.vdocuments.us/reader033/viewer/2022042003/5e6ea7b1ba5c475a9c171a54/html5/thumbnails/30.jpg)
CONFUSION MATRIX (2) พจารณาท class A
True Positive (TP) คอจ านวนท classify ถกวาเปน class A
False Positive (FP) คอ จ านวนท classify ผดวาเปน class A (ซงจรง ๆ แลวเปน class B)
Class A B
A 8 2
B 3 43
False Positive
{Actual
Predicted
![Page 31: CLASSIFICATION STEPS (1) · 2013-08-11 · CLASSIFICATION STEPS (1) ข้อมูลการเรียนรู้ (Train data) เทคนิค Classification ข้อมูลทดสอบ](https://reader033.vdocuments.us/reader033/viewer/2022042003/5e6ea7b1ba5c475a9c171a54/html5/thumbnails/31.jpg)
CONFUSION MATRIX (3)
Class A B
A 8 2
B 3 4
8
True Positive
{Actual
Predicted พจารณาท class A
True Positive (TP) คอจ านวนท classify ถกวาเปน class A
False Positive (FP) คอ จ านวนท classify ผดวาเปน class A (ซงจรง ๆ แลวเปน class B)
TP Rate = 8/10 = 0.8
TP Rate = TP/#data in class X
![Page 32: CLASSIFICATION STEPS (1) · 2013-08-11 · CLASSIFICATION STEPS (1) ข้อมูลการเรียนรู้ (Train data) เทคนิค Classification ข้อมูลทดสอบ](https://reader033.vdocuments.us/reader033/viewer/2022042003/5e6ea7b1ba5c475a9c171a54/html5/thumbnails/32.jpg)
CONFUSION MATRIX (4) พจารณาท class A
True Positive (TP) คอจ านวนท classify ถกวาเปน class A
False Positive (FP) คอ จ านวนท classify ผดวาเปน class A (ซงจรง ๆ แลวเปน class B)
TP Rate = 8/10 = 0.8 FP Rate = 3/10 = 0.428
Class A B
A 8 2
B 3 43
False Positive
{Actual
Predicted
FP Rate = TP/#data in class X
TP Rate = TP/#data in class X
![Page 33: CLASSIFICATION STEPS (1) · 2013-08-11 · CLASSIFICATION STEPS (1) ข้อมูลการเรียนรู้ (Train data) เทคนิค Classification ข้อมูลทดสอบ](https://reader033.vdocuments.us/reader033/viewer/2022042003/5e6ea7b1ba5c475a9c171a54/html5/thumbnails/33.jpg)
CONFUSION MATRIX (5)
Class A B
A 8 2
B 3 4{Actual
Predicted พจารณาท class A
True Positive (TP) คอจ านวนท classify ถกวาเปน class A
False Positive (FP) คอ จ านวนท classify ผดวาเปน class A (ซงจรง ๆ แลวเปน class B)
TP Rate = 8/10 = 0.8 FP Rate = 3/10 = 0.428 Precision = 8/(8+3) = 0.727
TP Rate = TP/#data in class X
FP Rate = FP/#data in class ~X
Precision = TP/(TP+FP)
![Page 34: CLASSIFICATION STEPS (1) · 2013-08-11 · CLASSIFICATION STEPS (1) ข้อมูลการเรียนรู้ (Train data) เทคนิค Classification ข้อมูลทดสอบ](https://reader033.vdocuments.us/reader033/viewer/2022042003/5e6ea7b1ba5c475a9c171a54/html5/thumbnails/34.jpg)
CONFUSION MATRIX (6)
Class A B
A 8 2
B 3 4{Actual
Predicted พจารณาท class A
True Positive (TP) คอจ านวนท classify ถกวาเปน class A
False Positive (FP) คอ จ านวนท classify ผดวาเปน class A (ซงจรง ๆ แลวเปน class B)
TP Rate = 8/10 = 0.8 FP Rate = 3/10 = 0.428 Precision = 8/(8+3) = 0.727 Recall = 8/(8+2) = 0.8 = TP Rate
TP Rate = TP/#data in class X
FP Rate = FP/#data in class ~X
Precision = TP/(TP+FP)
Recall = TP Rate
![Page 35: CLASSIFICATION STEPS (1) · 2013-08-11 · CLASSIFICATION STEPS (1) ข้อมูลการเรียนรู้ (Train data) เทคนิค Classification ข้อมูลทดสอบ](https://reader033.vdocuments.us/reader033/viewer/2022042003/5e6ea7b1ba5c475a9c171a54/html5/thumbnails/35.jpg)
CONFUSION MATRIX (7)
Class A B
A 8 2
B 3 4{Actual
Predicted พจารณาท class A
True Positive (TP) คอจ านวนท classify ถกวาเปน class A
False Positive (FP) คอ จ านวนท classify ผดวาเปน class A (ซงจรง ๆ แลวเปน class B)
TP Rate = 8/10 = 0.8 FP Rate = 3/10 = 0.428 Precision = 8/(8+3) = 0.727 Recall = 8/(8+2) = 0.8 = TP Rate Accuracy = (8+4)/(8+2+3+4) = 0.706
=70.6 %
TP Rate = TP/#data in class X
FP Rate = FP/#data in class ~X
Precision = TP/(TP+FP)
Recall = TP Rate Accuracy = #correctly classified instancesAccuracy = #correctly classified instances#instances
![Page 36: CLASSIFICATION STEPS (1) · 2013-08-11 · CLASSIFICATION STEPS (1) ข้อมูลการเรียนรู้ (Train data) เทคนิค Classification ข้อมูลทดสอบ](https://reader033.vdocuments.us/reader033/viewer/2022042003/5e6ea7b1ba5c475a9c171a54/html5/thumbnails/36.jpg)
PRECISION & RECALL
A
A
A
A
A
X
X
Y
Z
A
![Page 37: CLASSIFICATION STEPS (1) · 2013-08-11 · CLASSIFICATION STEPS (1) ข้อมูลการเรียนรู้ (Train data) เทคนิค Classification ข้อมูลทดสอบ](https://reader033.vdocuments.us/reader033/viewer/2022042003/5e6ea7b1ba5c475a9c171a54/html5/thumbnails/37.jpg)
PRECISION & RECALL(2)
A
X
A
A
Z
A
X
Y
Z
A= 6 ฉบบ
= 2 ฉบบ
= 1 ฉบบ
= 1 ฉบบ
![Page 38: CLASSIFICATION STEPS (1) · 2013-08-11 · CLASSIFICATION STEPS (1) ข้อมูลการเรียนรู้ (Train data) เทคนิค Classification ข้อมูลทดสอบ](https://reader033.vdocuments.us/reader033/viewer/2022042003/5e6ea7b1ba5c475a9c171a54/html5/thumbnails/38.jpg)
PRECISION & RECALL(3)
A
X
A
A
Z
A
X
Y
Z
A= 6 ฉบบ
= 2 ฉบบ
= 1 ฉบบ
= 1 ฉบบ
•Precision = จ านวนเอกสารทคนเจอและมเนอหาสมพนธกบค าคนจ านวนเอกสารทงหมดทสบคนได
![Page 39: CLASSIFICATION STEPS (1) · 2013-08-11 · CLASSIFICATION STEPS (1) ข้อมูลการเรียนรู้ (Train data) เทคนิค Classification ข้อมูลทดสอบ](https://reader033.vdocuments.us/reader033/viewer/2022042003/5e6ea7b1ba5c475a9c171a54/html5/thumbnails/39.jpg)
PRECISION & RECALL(4)
A
X
A
A
Z
A
X
Y
Z
A= 6 ฉบบ
= 2 ฉบบ
= 1 ฉบบ
= 1 ฉบบ• Recall= จ านวนเอกสารทคนเจอและมเนอหาสมพนธกบค าคน
จ านวนเอกสารทงหมดทมเนอหาสมพนธกบค าคนได=3/6=0.5
![Page 40: CLASSIFICATION STEPS (1) · 2013-08-11 · CLASSIFICATION STEPS (1) ข้อมูลการเรียนรู้ (Train data) เทคนิค Classification ข้อมูลทดสอบ](https://reader033.vdocuments.us/reader033/viewer/2022042003/5e6ea7b1ba5c475a9c171a54/html5/thumbnails/40.jpg)
4 : CLASSIFIER OUTPUT(3)
![Page 41: CLASSIFICATION STEPS (1) · 2013-08-11 · CLASSIFICATION STEPS (1) ข้อมูลการเรียนรู้ (Train data) เทคนิค Classification ข้อมูลทดสอบ](https://reader033.vdocuments.us/reader033/viewer/2022042003/5e6ea7b1ba5c475a9c171a54/html5/thumbnails/41.jpg)
KAPPA STATISTIC - MEASURE OF AGREEMENT
![Page 42: CLASSIFICATION STEPS (1) · 2013-08-11 · CLASSIFICATION STEPS (1) ข้อมูลการเรียนรู้ (Train data) เทคนิค Classification ข้อมูลทดสอบ](https://reader033.vdocuments.us/reader033/viewer/2022042003/5e6ea7b1ba5c475a9c171a54/html5/thumbnails/42.jpg)
KAPPA STATISTIC (2) สมาชกบาน AF 12 คน Raters ม 2 คน คอ ครเงาะ และครเมย คณครท าแบบสอบถามเพอพจารณาวา AF ไหนควรอยในบานตอหรอควรออกจากบาน
Yes = ควรอยในบานตอ No = ควรออกจากบาน
พจารณาวาความเหนของครทงสองสอดคลองกนหรอไม
6 1
2 3ครเงาะ Yes
No
NoYesครเมย
![Page 43: CLASSIFICATION STEPS (1) · 2013-08-11 · CLASSIFICATION STEPS (1) ข้อมูลการเรียนรู้ (Train data) เทคนิค Classification ข้อมูลทดสอบ](https://reader033.vdocuments.us/reader033/viewer/2022042003/5e6ea7b1ba5c475a9c171a54/html5/thumbnails/43.jpg)
KAPPA STATISTIC (3)
Pr(a) = observed percentage agreement= (6+3)/12 = 0.75
Pr(e) = obed percentage agreement = (0.3889 + 0.1389) = 0.5278 ค านวณจาก ครเมย vote “Yes” = 8 , Vote “No” = 4 ดงนน โอกาสตอบ Yes คดเปน 8/12 = 0.6667 ครเงาะ vote “Yes” = 7 , Vote “No” = 5 ดงนน โอกาสตอบ Yes คดเปน 7/12 = 0.5833 โอกาสทครทงสอง Vote “Yes” เหมอนกน = 0.6667 x 0.5833 = 0.3889 โอกาสทครทงสอง Vote “No” เหมอนกน =(1 - 0.6667) x (1 - 0.5833) = 0.1389
6 1
2 3ครเงาะ Yes
No
NoYesครเมย
Total 8 4
![Page 44: CLASSIFICATION STEPS (1) · 2013-08-11 · CLASSIFICATION STEPS (1) ข้อมูลการเรียนรู้ (Train data) เทคนิค Classification ข้อมูลทดสอบ](https://reader033.vdocuments.us/reader033/viewer/2022042003/5e6ea7b1ba5c475a9c171a54/html5/thumbnails/44.jpg)
KAPPA STATISTIC (4)
K = Pr(a)-Pr(e)1-Pr(e)
= ( 0.75 - 0.5278 ) / ( 1 ‟ 0.5278)= 0.4706
6 1
2 3ครเงาะ Yes
No
NoYesครเมย
Total 8 4
Note : Fleiss’s guidelines characterize kappas over .75 as excellent, .40 to .75 as fair to good, and below .40 as poor.
![Page 45: CLASSIFICATION STEPS (1) · 2013-08-11 · CLASSIFICATION STEPS (1) ข้อมูลการเรียนรู้ (Train data) เทคนิค Classification ข้อมูลทดสอบ](https://reader033.vdocuments.us/reader033/viewer/2022042003/5e6ea7b1ba5c475a9c171a54/html5/thumbnails/45.jpg)
4: CLASSIFIER OUTPUT (4)
![Page 46: CLASSIFICATION STEPS (1) · 2013-08-11 · CLASSIFICATION STEPS (1) ข้อมูลการเรียนรู้ (Train data) เทคนิค Classification ข้อมูลทดสอบ](https://reader033.vdocuments.us/reader033/viewer/2022042003/5e6ea7b1ba5c475a9c171a54/html5/thumbnails/46.jpg)
ROC CURVE Class ทก าลงพจารณา (Positive Class) คอ Class “Yes”
Rank PredictedProbability
Rank Rank PredictedProbability
Rank
1 0.95 Yes 11 0.77 No
2 0.93 Yes 12 0.76 Yes
3 0.93 No 13 0.73 Yes
4 0.88 Yes 14 0.65 No
5 0.86 Yes 15 0.63 Yes
6 0.85 Yes 16 0.58 No
7 0.82 Yes 17 0.56 Yes
8 0.80 Yes 18 0.49 No
9 0.80 No 19 0.48 Yes
10 0.79 Yes … … …
![Page 47: CLASSIFICATION STEPS (1) · 2013-08-11 · CLASSIFICATION STEPS (1) ข้อมูลการเรียนรู้ (Train data) เทคนิค Classification ข้อมูลทดสอบ](https://reader033.vdocuments.us/reader033/viewer/2022042003/5e6ea7b1ba5c475a9c171a54/html5/thumbnails/47.jpg)
ROC CURVE
Plot คา TP vs FP
![Page 48: CLASSIFICATION STEPS (1) · 2013-08-11 · CLASSIFICATION STEPS (1) ข้อมูลการเรียนรู้ (Train data) เทคนิค Classification ข้อมูลทดสอบ](https://reader033.vdocuments.us/reader033/viewer/2022042003/5e6ea7b1ba5c475a9c171a54/html5/thumbnails/48.jpg)
ROC CURVE
พนทใตกราฟ ROC (AUC-Area Under Curve) แสดง performance ในการจ าแนกคลาสของ Model
![Page 49: CLASSIFICATION STEPS (1) · 2013-08-11 · CLASSIFICATION STEPS (1) ข้อมูลการเรียนรู้ (Train data) เทคนิค Classification ข้อมูลทดสอบ](https://reader033.vdocuments.us/reader033/viewer/2022042003/5e6ea7b1ba5c475a9c171a54/html5/thumbnails/49.jpg)
DECISION TREE APPLICATIONS
ตอบค าถามทตองากรจดจ าแนกประเภทขอมล (classification) ทตองการเขาใจประกอบ ใชในการพจารณาใหสนเชอแกบคคลตาง ๆ ใชในการท านายวาลกคาคนไหนบางทมโอกาสจะยกเลกการใชบรการและเหตผลเพราะอะไร
![Page 50: CLASSIFICATION STEPS (1) · 2013-08-11 · CLASSIFICATION STEPS (1) ข้อมูลการเรียนรู้ (Train data) เทคนิค Classification ข้อมูลทดสอบ](https://reader033.vdocuments.us/reader033/viewer/2022042003/5e6ea7b1ba5c475a9c171a54/html5/thumbnails/50.jpg)
EXAMPLE 2 : DECISION TREE
Weather.arff
ขอมลทใชในการวเคราะห คาทตองการคาดเดา (class)
![Page 51: CLASSIFICATION STEPS (1) · 2013-08-11 · CLASSIFICATION STEPS (1) ข้อมูลการเรียนรู้ (Train data) เทคนิค Classification ข้อมูลทดสอบ](https://reader033.vdocuments.us/reader033/viewer/2022042003/5e6ea7b1ba5c475a9c171a54/html5/thumbnails/51.jpg)
EXAMPLE 2 : DECISION TREE (2) เปด Weka > เลอก Explorer > กดปม Open file… > เลอกไฟล data\weather.arff
![Page 52: CLASSIFICATION STEPS (1) · 2013-08-11 · CLASSIFICATION STEPS (1) ข้อมูลการเรียนรู้ (Train data) เทคนิค Classification ข้อมูลทดสอบ](https://reader033.vdocuments.us/reader033/viewer/2022042003/5e6ea7b1ba5c475a9c171a54/html5/thumbnails/52.jpg)
EXAMPLE 2 : DECISION TREE (3) คลกท tab Classify กดปม Choose
เลอก Classifiers เลอก trees เลอก J48
กดปม Start
![Page 53: CLASSIFICATION STEPS (1) · 2013-08-11 · CLASSIFICATION STEPS (1) ข้อมูลการเรียนรู้ (Train data) เทคนิค Classification ข้อมูลทดสอบ](https://reader033.vdocuments.us/reader033/viewer/2022042003/5e6ea7b1ba5c475a9c171a54/html5/thumbnails/53.jpg)
EXAMPLE 2 : DECISION TREE (4) ผลทได
![Page 54: CLASSIFICATION STEPS (1) · 2013-08-11 · CLASSIFICATION STEPS (1) ข้อมูลการเรียนรู้ (Train data) เทคนิค Classification ข้อมูลทดสอบ](https://reader033.vdocuments.us/reader033/viewer/2022042003/5e6ea7b1ba5c475a9c171a54/html5/thumbnails/54.jpg)
EXAMPLE 2 : DECISION TREE (5) คลกขวาทโมเดลในชอง Result list เลอก Visualize tree
![Page 55: CLASSIFICATION STEPS (1) · 2013-08-11 · CLASSIFICATION STEPS (1) ข้อมูลการเรียนรู้ (Train data) เทคนิค Classification ข้อมูลทดสอบ](https://reader033.vdocuments.us/reader033/viewer/2022042003/5e6ea7b1ba5c475a9c171a54/html5/thumbnails/55.jpg)
EXAMPLE 2 : DECISION TREE (6) กฎการตดสนใจจาก decision tree
IF outlook = sunny AND humidity < 75 Then playIF outlook = sunny AND humidity < 75 Then play
IF outlook = sunny AND humidity > 75 Then no play
IF outlook = overcast Then play IF outlook = rainy AND windy = TRUE
Then play IF outlook = rainy AND windy = FALSE
Then no play
![Page 56: CLASSIFICATION STEPS (1) · 2013-08-11 · CLASSIFICATION STEPS (1) ข้อมูลการเรียนรู้ (Train data) เทคนิค Classification ข้อมูลทดสอบ](https://reader033.vdocuments.us/reader033/viewer/2022042003/5e6ea7b1ba5c475a9c171a54/html5/thumbnails/56.jpg)
EXAMPLE 2 : DECISION TREE (7) บนทกโมเดลทไดสรางไว
คลกขวาเลอก Save model
![Page 57: CLASSIFICATION STEPS (1) · 2013-08-11 · CLASSIFICATION STEPS (1) ข้อมูลการเรียนรู้ (Train data) เทคนิค Classification ข้อมูลทดสอบ](https://reader033.vdocuments.us/reader033/viewer/2022042003/5e6ea7b1ba5c475a9c171a54/html5/thumbnails/57.jpg)
EXAMPLE 2 : DECISION TREE (8) Testing file Weather-test.arff
Play
?
?
?
?
?
?
![Page 58: CLASSIFICATION STEPS (1) · 2013-08-11 · CLASSIFICATION STEPS (1) ข้อมูลการเรียนรู้ (Train data) เทคนิค Classification ข้อมูลทดสอบ](https://reader033.vdocuments.us/reader033/viewer/2022042003/5e6ea7b1ba5c475a9c171a54/html5/thumbnails/58.jpg)
EXAMPLE 2 : DECISION TREE (9) เปดโมเดลทสรางไว
คลกขวาเลอก Load model
![Page 59: CLASSIFICATION STEPS (1) · 2013-08-11 · CLASSIFICATION STEPS (1) ข้อมูลการเรียนรู้ (Train data) เทคนิค Classification ข้อมูลทดสอบ](https://reader033.vdocuments.us/reader033/viewer/2022042003/5e6ea7b1ba5c475a9c171a54/html5/thumbnails/59.jpg)
EXAMPLE 2 : DECISION TREE (11) เลอก Supplied test set กดปม Set… เลอกไฟลWeather-test.arff
![Page 60: CLASSIFICATION STEPS (1) · 2013-08-11 · CLASSIFICATION STEPS (1) ข้อมูลการเรียนรู้ (Train data) เทคนิค Classification ข้อมูลทดสอบ](https://reader033.vdocuments.us/reader033/viewer/2022042003/5e6ea7b1ba5c475a9c171a54/html5/thumbnails/60.jpg)
EXAMPLE 2 : DECISION TREE (11) เลอก Supplied test set กดปม Set… เลอกไฟลWeather-test.arff• กดปม More options…
• เลอก output predictions
![Page 61: CLASSIFICATION STEPS (1) · 2013-08-11 · CLASSIFICATION STEPS (1) ข้อมูลการเรียนรู้ (Train data) เทคนิค Classification ข้อมูลทดสอบ](https://reader033.vdocuments.us/reader033/viewer/2022042003/5e6ea7b1ba5c475a9c171a54/html5/thumbnails/61.jpg)
EXAMPLE 2 : DECISION TREE (12) เลอก Supplied test set กดปม Set… เลอกไฟลWeather-test.arff• กดปม More options• เลอก output predictions• คลกขวาทโมเดลเลอก Re-
evaluate model on current test set
![Page 62: CLASSIFICATION STEPS (1) · 2013-08-11 · CLASSIFICATION STEPS (1) ข้อมูลการเรียนรู้ (Train data) เทคนิค Classification ข้อมูลทดสอบ](https://reader033.vdocuments.us/reader033/viewer/2022042003/5e6ea7b1ba5c475a9c171a54/html5/thumbnails/62.jpg)
EXAMPLE 3 : CUSTOMERS
ผลทไดผลทท านายได
![Page 63: CLASSIFICATION STEPS (1) · 2013-08-11 · CLASSIFICATION STEPS (1) ข้อมูลการเรียนรู้ (Train data) เทคนิค Classification ข้อมูลทดสอบ](https://reader033.vdocuments.us/reader033/viewer/2022042003/5e6ea7b1ba5c475a9c171a54/html5/thumbnails/63.jpg)
EXAMPLE 3 : CUSTOMERS
แกไขไฟล customer_wmissing.arff ทเคยสรางไวใน Lab 4-3%costomers_wmissing.arff@relation customers_wmissing%The following is attributes@attribute member_id real@attribute sex{male, female} @attribute age real@attribute Income numeric@attribute A0001 {0,1}@attribute A0002 {0,1}@attribute A0003 {0,1}@attribute level {A,D}%The following is attributes@data1,male,20,12000,0,0,0,D2,female,18,7000,1,1,1,A3,female,35,35000,0,0,0,D4,?,16,4000,1,1,0,A5,female,?,20000,0,0,0,D
หมายเลขสมาชก
เพศ อาย รายได สนคา A สนคา B สนคา C ระดบของสมาชก
1 ชาย 20 12,000 0 0 0 D
2 หญง 18 7,000 1 1 1 A
3 หญง 35 35,000 0 0 0 D
4 เดก 16 4,000 1 1 0 A
5 หญง 300 20,000 0 0 0 D
![Page 64: CLASSIFICATION STEPS (1) · 2013-08-11 · CLASSIFICATION STEPS (1) ข้อมูลการเรียนรู้ (Train data) เทคนิค Classification ข้อมูลทดสอบ](https://reader033.vdocuments.us/reader033/viewer/2022042003/5e6ea7b1ba5c475a9c171a54/html5/thumbnails/64.jpg)
EXAMPLE 3 : CUSTOMERS (2) เปด Weka > เลอก Explorer > กดปม Open file…> เลอกไฟล customers_wmissing.arff
![Page 65: CLASSIFICATION STEPS (1) · 2013-08-11 · CLASSIFICATION STEPS (1) ข้อมูลการเรียนรู้ (Train data) เทคนิค Classification ข้อมูลทดสอบ](https://reader033.vdocuments.us/reader033/viewer/2022042003/5e6ea7b1ba5c475a9c171a54/html5/thumbnails/65.jpg)
EXAMPLE 3 : CUSTOMERS (3) กดปม Choose > เลอก filters > เลอก unsupervised > เลอก attribute > เลอก
ReplaceMissingValues กดปม Apply ดขอมลทแกไขโดยการกดปม Edit…
![Page 66: CLASSIFICATION STEPS (1) · 2013-08-11 · CLASSIFICATION STEPS (1) ข้อมูลการเรียนรู้ (Train data) เทคนิค Classification ข้อมูลทดสอบ](https://reader033.vdocuments.us/reader033/viewer/2022042003/5e6ea7b1ba5c475a9c171a54/html5/thumbnails/66.jpg)
EXAMPLE 3 : CUSTOMERS (4) น าขอมลทไดมการแกไขดวย วธ
Replace missing value แลวสราง Decision tree Remove แอตทรบวตทไมจ าเปน
เชน member_id ทง คลกทชองหนาชอแอตทรบวต กดปม Remove
![Page 67: CLASSIFICATION STEPS (1) · 2013-08-11 · CLASSIFICATION STEPS (1) ข้อมูลการเรียนรู้ (Train data) เทคนิค Classification ข้อมูลทดสอบ](https://reader033.vdocuments.us/reader033/viewer/2022042003/5e6ea7b1ba5c475a9c171a54/html5/thumbnails/67.jpg)
EXAMPLE 3 : CUSTOMERS (5) คลกท tab Classify กดปม Choose
เลอก Classifiers เลอก trees เลอก J48 เลอก Folds เปน 2
กดปม Start
![Page 68: CLASSIFICATION STEPS (1) · 2013-08-11 · CLASSIFICATION STEPS (1) ข้อมูลการเรียนรู้ (Train data) เทคนิค Classification ข้อมูลทดสอบ](https://reader033.vdocuments.us/reader033/viewer/2022042003/5e6ea7b1ba5c475a9c171a54/html5/thumbnails/68.jpg)
EXAMPLE 3 : CUSTOMERS (6) ผลทได
![Page 69: CLASSIFICATION STEPS (1) · 2013-08-11 · CLASSIFICATION STEPS (1) ข้อมูลการเรียนรู้ (Train data) เทคนิค Classification ข้อมูลทดสอบ](https://reader033.vdocuments.us/reader033/viewer/2022042003/5e6ea7b1ba5c475a9c171a54/html5/thumbnails/69.jpg)
EXAMPLE 3 : CUSTOMERS (7) คลกขวาทโมเดลในชอง Result list เลอก Visualize tree
![Page 70: CLASSIFICATION STEPS (1) · 2013-08-11 · CLASSIFICATION STEPS (1) ข้อมูลการเรียนรู้ (Train data) เทคนิค Classification ข้อมูลทดสอบ](https://reader033.vdocuments.us/reader033/viewer/2022042003/5e6ea7b1ba5c475a9c171a54/html5/thumbnails/70.jpg)
LAB 5-2 : GERMAN CREDIT CARD
Business Understanding การอนมตบตรเครดตของธนาคารตาง ๆ จ าเปนจะตองพจารณาปจจยหลายๆ ดานของลกคาผ
ขออนมตทงนเพราะความเลยงทอาจจะเกดขนจากการใชบตรเครดตของลกคาอาจจะท าใหธนาคารสญเสยเงนเปนจ านวนมาก
การสรางระบบชวยการตดสนใจ (decision support system) ในการอนมตบตรเครดตแบบอตโนมตจะชวยใหธนาคารสามารถท างานไดเรวขน
Data Understanding ธนาคารไดเกบรวบรวมขอมลการขออนมตบตรเครดตจากลกคาเกาจ านวน 600 คน โดยธนาคารจะเกบคณลกษณาของลกคาแตละคนไว เชน จ านวนเงนในบญช เปนตน รวบรวมเกบไวในไฟล GermanCreditBalance.arff ซงอยในแผน CD โฟลเดอร
dataset/GermanCredit รายละเอยดของแอตทรบวตตาง ๆ ดไดจากไฟล GermanCredit.pdf
![Page 71: CLASSIFICATION STEPS (1) · 2013-08-11 · CLASSIFICATION STEPS (1) ข้อมูลการเรียนรู้ (Train data) เทคนิค Classification ข้อมูลทดสอบ](https://reader033.vdocuments.us/reader033/viewer/2022042003/5e6ea7b1ba5c475a9c171a54/html5/thumbnails/71.jpg)
LAB 5-2 : GERMAN CREDIT CARD
Data Understanding ตวอยางของบางแอตทรบวต
ล าดบ แอตทรบวต ชอยอ ประเภท
1 Observation No. OBS# Categorical
2 Checking Account Status
CHK_ACCT Categorical
3 Duration on credit in months
DURATION Numerical
4 Credit history HISTORY Categorical
5 Purpose of credit NEW_CAR Binary
6 Purpose of credit USED_CAR Binary
7 Purpose of credit FURNITURE Binary
……….
32 Credit rating is good RESPONSE Binary
![Page 72: CLASSIFICATION STEPS (1) · 2013-08-11 · CLASSIFICATION STEPS (1) ข้อมูลการเรียนรู้ (Train data) เทคนิค Classification ข้อมูลทดสอบ](https://reader033.vdocuments.us/reader033/viewer/2022042003/5e6ea7b1ba5c475a9c171a54/html5/thumbnails/72.jpg)
LAB 5-2 : GERMAN CREDIT CARD
Data Preparation …………………………………………………………………………………………….
Modeling ใชเทคนคการสราง Decision Tree เพอชวยในการอนมต/ไมอนมตเครดตแบบอตโนมต
Evaluation ทดสอบประสทธภาพของโมเดลดวยวธ 10 ‟ folds cross ‟ validation ทดสอบดวยขอมลของลกคาคนใหมโดยใชไฟล
![Page 73: CLASSIFICATION STEPS (1) · 2013-08-11 · CLASSIFICATION STEPS (1) ข้อมูลการเรียนรู้ (Train data) เทคนิค Classification ข้อมูลทดสอบ](https://reader033.vdocuments.us/reader033/viewer/2022042003/5e6ea7b1ba5c475a9c171a54/html5/thumbnails/73.jpg)
LAB 5-3 : CHURN
Business understanding การยกเลกการใชบรการโทรศพทเคลอนท (Churn ) เปนปญหาส าคญส าหรบบรษทผใหบรการ
เครอขายโทรคมนาคมในประเทศตาง ๆ การทสามารถคาดการณไดวาลกคาคนใดมแนวโนมทจะยกเลกบรการและทราบถงปญหาทท า
ใหลกคาไมพอใจไดกอนทจะเสยลกคาคนนนไปจะชวยใหบรษทไมตองสญเสยรายได
Data Understanding บรษทโทรคมนาคมแหงหนงในประเทศสหรฐอเมรกาไดเกบขอมลการใชบรการ
โทรศพทเคลอนทของลกคาจ านวน 3,333 คน ขอมลของลกคานแบงออกเปน 2 กลม
กลมทยกเลกการใชบรการ (Churn) จ านวน 483 คน กลมทไมยกเลกการใชบรการ (No Churn) จ านวน 2,850 คน
![Page 74: CLASSIFICATION STEPS (1) · 2013-08-11 · CLASSIFICATION STEPS (1) ข้อมูลการเรียนรู้ (Train data) เทคนิค Classification ข้อมูลทดสอบ](https://reader033.vdocuments.us/reader033/viewer/2022042003/5e6ea7b1ba5c475a9c171a54/html5/thumbnails/74.jpg)
LAB 5-3 : CHURN (2) Data Understanding
มแอตทรบวตทงหมด .... แอตทรบวต ............................................................................................................................. .. ............................................................................................................................. .. ............................................................................................................................. .. ............................................................................................................................. .. ขอมลรวบรวมไวในไฟล churn.csv ในแผน CD โฟลเดอร dataset/churn
Data Preparation ............................................................................................................................. ..
![Page 75: CLASSIFICATION STEPS (1) · 2013-08-11 · CLASSIFICATION STEPS (1) ข้อมูลการเรียนรู้ (Train data) เทคนิค Classification ข้อมูลทดสอบ](https://reader033.vdocuments.us/reader033/viewer/2022042003/5e6ea7b1ba5c475a9c171a54/html5/thumbnails/75.jpg)
LAB 5-3 : CHURN (3) Modeling
ใชเทคนคการสราง Decision Tree เพอชวยในการหาคาดการณวาลกคาคนไหนมโอกาสยกเลการใชบรการและเพราะเหตใด
Evaluation ทดสอบประสทธภาพของโมเดลดวยวธ 10 ‟ folds cross - validation
![Page 76: CLASSIFICATION STEPS (1) · 2013-08-11 · CLASSIFICATION STEPS (1) ข้อมูลการเรียนรู้ (Train data) เทคนิค Classification ข้อมูลทดสอบ](https://reader033.vdocuments.us/reader033/viewer/2022042003/5e6ea7b1ba5c475a9c171a54/html5/thumbnails/76.jpg)
COST SENSITIVE
เปนคา Cost ทเกดขน ส าหรบแตละคลาสค าตอบ ตวอยาง ปญหาการยกเลกบรการการใชโทรศพทมอถอของลกคา (Churn) พบวา คลาสท
ตองการพจารณาม 2 class คอ ยกเลกบรการ (churn) ไมยกเลกบรการ (no churn)
การพจารณา Cost Sensitivity ใหพจารณาดงน กรณยกเลกบรการ (churn)-Cost ของการทลกคายกเลกบรการ คอการพจารณาวาบรษทจะ
สญเสยรายไดเทาไรหากลกคา 1 คนท าการยกเลกบรการ กรณไมยกเลกบรการ(No churn) ‟ Cost ในกรณนจะเกดขนกตอเมอระบบท านายวาลกคาจะม
การยกเลกแตความเปนจรงแลวลกคาไมตองการยกเลกบรการ ดงนนจะเสยคาใชจายสวนหนงในการท า Campaign กบลกคาคนน
![Page 77: CLASSIFICATION STEPS (1) · 2013-08-11 · CLASSIFICATION STEPS (1) ข้อมูลการเรียนรู้ (Train data) เทคนิค Classification ข้อมูลทดสอบ](https://reader033.vdocuments.us/reader033/viewer/2022042003/5e6ea7b1ba5c475a9c171a54/html5/thumbnails/77.jpg)
LAB 5-3 : CHURN WITH COST SENSITIVE
ใชขอมล Churn จาก LAB 5-3 ส าหรบคา cost นน สมมตบรษทไดมการค านวณแลวดงน
คา cost ทเกดจากการทลกคา 1 คนยกเลกบรการมคาเทากบ 180 บาท คา cost ทบรษทตองใชในการจด Campaign ใหกบกลมลกคาทถกท านายวาจะยกเลกบรการ คด
เปน 18 บาทตอคน
ใหท าการสราง Model โดยใชเทคนค Decision tree ตามขนตอนดงน Tab Classify> คลก Choose เลอก weka > classifiers > meta > CostSensitiveClassifier คลกท
![Page 78: CLASSIFICATION STEPS (1) · 2013-08-11 · CLASSIFICATION STEPS (1) ข้อมูลการเรียนรู้ (Train data) เทคนิค Classification ข้อมูลทดสอบ](https://reader033.vdocuments.us/reader033/viewer/2022042003/5e6ea7b1ba5c475a9c171a54/html5/thumbnails/78.jpg)
LAB 5-4 : CHURN WITH COST SENSITIVE(2) Classifier เลอก J48 CostMatrix
classes = 2 คา Cost ของการท านายผดวา
ลกคาจะยกเลกบรการแตความจรงลกคาไมตองการยกเลก = 1
คา Cost ของการท านายผดวาลกคาจะไมยกเลกบรการแตความจรงลกคาตองการยกเลก = 10
![Page 79: CLASSIFICATION STEPS (1) · 2013-08-11 · CLASSIFICATION STEPS (1) ข้อมูลการเรียนรู้ (Train data) เทคนิค Classification ข้อมูลทดสอบ](https://reader033.vdocuments.us/reader033/viewer/2022042003/5e6ea7b1ba5c475a9c171a54/html5/thumbnails/79.jpg)
EXAMPLE 4 : K-NEAREST NEIGHTBORS
เปด Weka > เลอก Explorer > กดปม Open file… > เลอกไฟล data\weather.arff
![Page 80: CLASSIFICATION STEPS (1) · 2013-08-11 · CLASSIFICATION STEPS (1) ข้อมูลการเรียนรู้ (Train data) เทคนิค Classification ข้อมูลทดสอบ](https://reader033.vdocuments.us/reader033/viewer/2022042003/5e6ea7b1ba5c475a9c171a54/html5/thumbnails/80.jpg)
EXAMPLE 4 : K-NEAREST NEIGHTBORS(2) คลกท tab classify กดปม choose
เลอก classifiers เลอก lazy เลอก ibk
กดปม Start
![Page 81: CLASSIFICATION STEPS (1) · 2013-08-11 · CLASSIFICATION STEPS (1) ข้อมูลการเรียนรู้ (Train data) เทคนิค Classification ข้อมูลทดสอบ](https://reader033.vdocuments.us/reader033/viewer/2022042003/5e6ea7b1ba5c475a9c171a54/html5/thumbnails/81.jpg)
EXAMPLE 4 : K-NEAREST NEIGHTBORS(3) ผลทได
![Page 82: CLASSIFICATION STEPS (1) · 2013-08-11 · CLASSIFICATION STEPS (1) ข้อมูลการเรียนรู้ (Train data) เทคนิค Classification ข้อมูลทดสอบ](https://reader033.vdocuments.us/reader033/viewer/2022042003/5e6ea7b1ba5c475a9c171a54/html5/thumbnails/82.jpg)
LAB 5-5 : BMW PROMOTION CAMPAIGN
Business Understanding ตวแทนจ าหนายรถยนต BMW ไดจะท าการออกโปรโมชนเพอขายประกนเพม
อก 2 ป ใหกบลกคาทเคยซอรถ BMW จงอยากรวาควรจะน าเสนอโปรโมชนนใหกบลกคาแบบใด
Data Understanding ตวแทนจ าหนายรถยนต BMW ไดเคยใชโปรโมชนนมากอนหนาแลวท าใหม
ลกคาเกาอย จ านวน 4,500 คน มจ านวนแอตทรบวตทงหมด 4 แอตทรบวต ขอมลรวบรวมเกบไวในไฟล bmw-training.arff ในแผน CD โฟลเดอร
dataset/BMW
![Page 83: CLASSIFICATION STEPS (1) · 2013-08-11 · CLASSIFICATION STEPS (1) ข้อมูลการเรียนรู้ (Train data) เทคนิค Classification ข้อมูลทดสอบ](https://reader033.vdocuments.us/reader033/viewer/2022042003/5e6ea7b1ba5c475a9c171a54/html5/thumbnails/83.jpg)
LAB 5-5 : BMW PROMOTION CAMPAIGN
Data Understanding ขอมลทเกบของแตละคนมแอตทรบวตดงน
ล าดบ แอตทรบวต ชอยอ ประเภท
1 Income Bracket(0=$0-$30k, 1=$31k-$40k,2=$41k-$60k,3=$61k-$75k,4=$76-$100k,5=$101k-$150k,6=$151-$500,7=$501k+)
IncomeBraket Categorical
2 Year/month first BMW Bought FirstPurchase Numeric
3 Year/month most recent BMW bought LastPurchase Numeric
4 Responding to the extended warranty Responded Categorical
![Page 84: CLASSIFICATION STEPS (1) · 2013-08-11 · CLASSIFICATION STEPS (1) ข้อมูลการเรียนรู้ (Train data) เทคนิค Classification ข้อมูลทดสอบ](https://reader033.vdocuments.us/reader033/viewer/2022042003/5e6ea7b1ba5c475a9c171a54/html5/thumbnails/84.jpg)
LAB 5-5 BMW PROMOTION CHAMPAIGN (3) Data Preparation
ไมมขอมลทขาดหายไป (missing Values)
Modeling ใชเทคนคการท า K-Nearest neighbors
Evaluation ทดสอบประสทธภาพของโมเดลดวยวธ Self Consistency Test ทดสอบประสทธภาพของโมเดลดวยวธ 10- folds cross-validation
![Page 85: CLASSIFICATION STEPS (1) · 2013-08-11 · CLASSIFICATION STEPS (1) ข้อมูลการเรียนรู้ (Train data) เทคนิค Classification ข้อมูลทดสอบ](https://reader033.vdocuments.us/reader033/viewer/2022042003/5e6ea7b1ba5c475a9c171a54/html5/thumbnails/85.jpg)
REFERENCE
Discovering Spatial Relationships Between Approximately Equivalent Patterns in contact Maps, BIOKDD04
![Page 86: CLASSIFICATION STEPS (1) · 2013-08-11 · CLASSIFICATION STEPS (1) ข้อมูลการเรียนรู้ (Train data) เทคนิค Classification ข้อมูลทดสอบ](https://reader033.vdocuments.us/reader033/viewer/2022042003/5e6ea7b1ba5c475a9c171a54/html5/thumbnails/86.jpg)
CLUSTERING AS PREPROCESSING STEP
ใชแบงขอมลกอนการวเคราะหขอมลดวยเทคนคอน ๆ Classification Association rule discovery
DBDB classification
Decision tree ของการตอบรบโปรโมชน
DBDB Clustering
classification
classification
Decision tree ของการตอบรบโปรโมชนของกลมคน
ชอบทองเทยว
Decision tree ของการตอบรบโปรโมชนของกลมคนรก
สขภาพ
กลมคนชอบทองเทยว
กลมคนรกสขภาพ
![Page 87: CLASSIFICATION STEPS (1) · 2013-08-11 · CLASSIFICATION STEPS (1) ข้อมูลการเรียนรู้ (Train data) เทคนิค Classification ข้อมูลทดสอบ](https://reader033.vdocuments.us/reader033/viewer/2022042003/5e6ea7b1ba5c475a9c171a54/html5/thumbnails/87.jpg)
CLUSTERING APPLICATIONS
เขาใจลกษณะของลกคาในแตละกลม สงโปรโมชนหรอโฆษณาใหตรงกบกลมเปาหมายมากขน วาง positioning ของสนคาในบรษทวาควรเจาะกลมเปาหมายใด ตวอยาง : รานเชา DVD Blockbuster
แบงกลมขอมลลกคาตามพฤตกรรมการเชา DVD เพอใชในการแนะน า DVD ใหตรงกบความตองการของลกคา
ตวอยาง : การแบงกลมเอกสาร มการสรางอภธานศพท พจารณาความคลายคลงของค าในเนอหาทตรงกบอภธานศพท สามารถแบงกลมเอกสาร หรอสบคนเอกสารทมเนอหาประเภทเดยวกน
![Page 88: CLASSIFICATION STEPS (1) · 2013-08-11 · CLASSIFICATION STEPS (1) ข้อมูลการเรียนรู้ (Train data) เทคนิค Classification ข้อมูลทดสอบ](https://reader033.vdocuments.us/reader033/viewer/2022042003/5e6ea7b1ba5c475a9c171a54/html5/thumbnails/88.jpg)
CLUSTERING IN WEKA
เปด Weka > เลอก Explorer > กดปม Open file… > เลอกไฟล data\weather.arff
![Page 89: CLASSIFICATION STEPS (1) · 2013-08-11 · CLASSIFICATION STEPS (1) ข้อมูลการเรียนรู้ (Train data) เทคนิค Classification ข้อมูลทดสอบ](https://reader033.vdocuments.us/reader033/viewer/2022042003/5e6ea7b1ba5c475a9c171a54/html5/thumbnails/89.jpg)
CLUSTERING IN WEKA (CONT’) คลกท tab Cluster
13
2
![Page 90: CLASSIFICATION STEPS (1) · 2013-08-11 · CLASSIFICATION STEPS (1) ข้อมูลการเรียนรู้ (Train data) เทคนิค Classification ข้อมูลทดสอบ](https://reader033.vdocuments.us/reader033/viewer/2022042003/5e6ea7b1ba5c475a9c171a54/html5/thumbnails/90.jpg)
CLUSTERER
สวนของการเลอกเทคนคในการคลสเตอร
สวนใหญจะใชเทคนค K-Means DistanceFunction ส าหรบเลอก
วธการวดระยะหางระหวางอนสแตนซ
numClusters ส าหรบเลอกจ านวนกลมทตองการ
![Page 91: CLASSIFICATION STEPS (1) · 2013-08-11 · CLASSIFICATION STEPS (1) ข้อมูลการเรียนรู้ (Train data) เทคนิค Classification ข้อมูลทดสอบ](https://reader033.vdocuments.us/reader033/viewer/2022042003/5e6ea7b1ba5c475a9c171a54/html5/thumbnails/91.jpg)
2: RUSULT LIST
แสดงผลการท างานครงกอน ๆ แสดงเวลา เทคนคทใช คลกขวาทผลจะแสดง option เพมเตม
Save result buffer : บนทกผลการท างานทแสดงในสวน Clusterer output
Visualize cluster assignment : แสดงกราฟความสมพนธของแอตทรบวตตาง ๆ กบ คลสเตอร บนทกผลการแบงคลสเตอร
![Page 92: CLASSIFICATION STEPS (1) · 2013-08-11 · CLASSIFICATION STEPS (1) ข้อมูลการเรียนรู้ (Train data) เทคนิค Classification ข้อมูลทดสอบ](https://reader033.vdocuments.us/reader033/viewer/2022042003/5e6ea7b1ba5c475a9c171a54/html5/thumbnails/92.jpg)
3 : CLUSTERER OUTPUT
แสดงผลการแบงกลมขอมล (clustering) Number of iterations :
จ านวนรอบการท างานของ K-Means
Within cluter sum of squared Errors : คา distance รวมเมอเทยบกบสดศนยกลางของแตละคลสเตอร
Cluster centroids : แสดงจดศนยกลางของแตละคลสเตอร
Cluster Instances : จ านวนขอมลในแตละคลสเตอร
![Page 93: CLASSIFICATION STEPS (1) · 2013-08-11 · CLASSIFICATION STEPS (1) ข้อมูลการเรียนรู้ (Train data) เทคนิค Classification ข้อมูลทดสอบ](https://reader033.vdocuments.us/reader033/viewer/2022042003/5e6ea7b1ba5c475a9c171a54/html5/thumbnails/93.jpg)
3 : CLUSTERER OUTPUT (CONT’) แสดงความสมพนธระหวางแอตทร
บวตแบบ 3 มต แกน X แกน Y ส
เลอกแกน X เปนคลสเตอร เลอกแกน Y เปน Instance number เลอกสเปนแอตทรบวตทตองการด
ความสมพนธ
![Page 94: CLASSIFICATION STEPS (1) · 2013-08-11 · CLASSIFICATION STEPS (1) ข้อมูลการเรียนรู้ (Train data) เทคนิค Classification ข้อมูลทดสอบ](https://reader033.vdocuments.us/reader033/viewer/2022042003/5e6ea7b1ba5c475a9c171a54/html5/thumbnails/94.jpg)
3 : CLUSTERER OUTPUT (CONT’)
• กดปม save• ในไฟล ARFF จะม ผลการแบงกลม (cluster)
![Page 95: CLASSIFICATION STEPS (1) · 2013-08-11 · CLASSIFICATION STEPS (1) ข้อมูลการเรียนรู้ (Train data) เทคนิค Classification ข้อมูลทดสอบ](https://reader033.vdocuments.us/reader033/viewer/2022042003/5e6ea7b1ba5c475a9c171a54/html5/thumbnails/95.jpg)
EXAMPLE 1 : CLUSTERING BANK DATA
ขอมลรายละเอยดลกคาของธนาคาร (bank)
![Page 96: CLASSIFICATION STEPS (1) · 2013-08-11 · CLASSIFICATION STEPS (1) ข้อมูลการเรียนรู้ (Train data) เทคนิค Classification ข้อมูลทดสอบ](https://reader033.vdocuments.us/reader033/viewer/2022042003/5e6ea7b1ba5c475a9c171a54/html5/thumbnails/96.jpg)
EXAMPLE 1 : CLUSTERING BANK DATA(CONT’) เปด weka > เลอก Explorer > กดปม Open file…>เลอกไฟล dataset\bank.arff
![Page 97: CLASSIFICATION STEPS (1) · 2013-08-11 · CLASSIFICATION STEPS (1) ข้อมูลการเรียนรู้ (Train data) เทคนิค Classification ข้อมูลทดสอบ](https://reader033.vdocuments.us/reader033/viewer/2022042003/5e6ea7b1ba5c475a9c171a54/html5/thumbnails/97.jpg)
EXAMPLE 1 : CLUSTERING BANK DATA(CONT’) คลกแทบ Cluster เลอกเทคนค
SimpleKMeans เปลยนคาพารามเตอร
N เปน 6 คลกปม Start
![Page 98: CLASSIFICATION STEPS (1) · 2013-08-11 · CLASSIFICATION STEPS (1) ข้อมูลการเรียนรู้ (Train data) เทคนิค Classification ข้อมูลทดสอบ](https://reader033.vdocuments.us/reader033/viewer/2022042003/5e6ea7b1ba5c475a9c171a54/html5/thumbnails/98.jpg)
EXAMPLE 1 : CLUSTERING BANK DATA(CONT’) ผลการแบงกลม (cluster)
![Page 99: CLASSIFICATION STEPS (1) · 2013-08-11 · CLASSIFICATION STEPS (1) ข้อมูลการเรียนรู้ (Train data) เทคนิค Classification ข้อมูลทดสอบ](https://reader033.vdocuments.us/reader033/viewer/2022042003/5e6ea7b1ba5c475a9c171a54/html5/thumbnails/99.jpg)
EXAMPLE 1 : CLUSTERING BANK DATA(CONT’) ผลของคลสเตอรท 2
ลกคาสวนใหญในคลสเตอรน อายเฉลยประมาณ 39 ป เพศหญง อาศยอยในเมอง รายไดเฉลยประมาณ 25,148 บาท แตงงานแลวแตยงไมมบตร มบญชเงนฝากกบธนาคารเรยบรอยแลว
Age Sex Region Income Married Children Car Save_act Current_act Mortgage Pep
39.2569 FEMALE INNER_CITY
25,148.6273 YES 0 YES YES YES NO NO
![Page 100: CLASSIFICATION STEPS (1) · 2013-08-11 · CLASSIFICATION STEPS (1) ข้อมูลการเรียนรู้ (Train data) เทคนิค Classification ข้อมูลทดสอบ](https://reader033.vdocuments.us/reader033/viewer/2022042003/5e6ea7b1ba5c475a9c171a54/html5/thumbnails/100.jpg)
EXAMPLE 1 : CLUSTERING BANK DATA(CONT’) คลกขวาทผลใน Result list
เลอก Visualize cluster assignments
คลกขวา
![Page 101: CLASSIFICATION STEPS (1) · 2013-08-11 · CLASSIFICATION STEPS (1) ข้อมูลการเรียนรู้ (Train data) เทคนิค Classification ข้อมูลทดสอบ](https://reader033.vdocuments.us/reader033/viewer/2022042003/5e6ea7b1ba5c475a9c171a54/html5/thumbnails/101.jpg)
EXAMPLE 1 : CLUSTERING BANK DATA(CONT’) แสดงกราฟแบบ 3 มต
แกน X แกน Y ส
![Page 102: CLASSIFICATION STEPS (1) · 2013-08-11 · CLASSIFICATION STEPS (1) ข้อมูลการเรียนรู้ (Train data) เทคนิค Classification ข้อมูลทดสอบ](https://reader033.vdocuments.us/reader033/viewer/2022042003/5e6ea7b1ba5c475a9c171a54/html5/thumbnails/102.jpg)
EXAMPLE 1 : CLUSTERING BANK DATA(CONT’) เลอกใหแกน X เปน Cluster และแกน Y เปน Instance_number เลอก Colour เปน sex
Hint!!! คลสเตอร 3 ลกคาสวน
ใหญจะเปนเพศหญง(พบวาสน าเงนมากกวา)
Cluster 2 ลกคาสวนใหญจะเปนเพศชาย (พบวาสแดงมากกวา)
![Page 103: CLASSIFICATION STEPS (1) · 2013-08-11 · CLASSIFICATION STEPS (1) ข้อมูลการเรียนรู้ (Train data) เทคนิค Classification ข้อมูลทดสอบ](https://reader033.vdocuments.us/reader033/viewer/2022042003/5e6ea7b1ba5c475a9c171a54/html5/thumbnails/103.jpg)
EXAMPLE 1 : CLUSTERING BANK DATA(CONT’) กดปม Save ในหนาตาง Weka Clusterer Visualize Save ในชอ bank_result.arff
มคาคลสเตอร(cluster)เพมขนมา
![Page 104: CLASSIFICATION STEPS (1) · 2013-08-11 · CLASSIFICATION STEPS (1) ข้อมูลการเรียนรู้ (Train data) เทคนิค Classification ข้อมูลทดสอบ](https://reader033.vdocuments.us/reader033/viewer/2022042003/5e6ea7b1ba5c475a9c171a54/html5/thumbnails/104.jpg)
LAB 6-1 : CUSTOMER BEHAVIORS
Business Understanding ตวแทนจ าหนายรถยนต BMW ไดท าการตดตามดพฤตกรรมของลกคาทเขามาเยยมชมรถ
ภายในโชวรมวาลกคาดรถยนตรนไหนและท าการสงซอรถหรอไม
Data Understanding ตวแทนจ าหนายรถยนตรายนไดท าการตดตามดพฤตกรรมของลกคาทงหมดจ านวน 100 คน ลกคาแตละรายจะมจ านวนแอตทรบวตทงหมด 8 แอตทรบวต ขอมลเหลานไดถกรวบรวมเกบไวในไฟล bmw_browsers.arff ในแผน CD โฟลเดอร
dataset/bmw
![Page 105: CLASSIFICATION STEPS (1) · 2013-08-11 · CLASSIFICATION STEPS (1) ข้อมูลการเรียนรู้ (Train data) เทคนิค Classification ข้อมูลทดสอบ](https://reader033.vdocuments.us/reader033/viewer/2022042003/5e6ea7b1ba5c475a9c171a54/html5/thumbnails/105.jpg)
LAB 6-1 : CUSTOMER BEHAVIORS (CONT’) Data Understanding
ขอมลทเกบของแตละคนมแอตทรบวตดงนล าดบ แอตทรบวต ประเภท
1 Numeric
2 Dealership …………….
3 Showroom Numeric
4 Computer Search …………….
5 M5 Numeric
6 3Series Numeric
7 Z4 …………….
8 Financing
9 Puchase Numeric
![Page 106: CLASSIFICATION STEPS (1) · 2013-08-11 · CLASSIFICATION STEPS (1) ข้อมูลการเรียนรู้ (Train data) เทคนิค Classification ข้อมูลทดสอบ](https://reader033.vdocuments.us/reader033/viewer/2022042003/5e6ea7b1ba5c475a9c171a54/html5/thumbnails/106.jpg)
LAB 6-1 : CUSTOMER BEHAVIORS (CONT’) Data Preparation
……………………………………………………………………………………………
Modeling ใชเทคนคการแบงกลมดวย K-means Clustering แบงกลมออกเปน 5 กลม
![Page 107: CLASSIFICATION STEPS (1) · 2013-08-11 · CLASSIFICATION STEPS (1) ข้อมูลการเรียนรู้ (Train data) เทคนิค Classification ข้อมูลทดสอบ](https://reader033.vdocuments.us/reader033/viewer/2022042003/5e6ea7b1ba5c475a9c171a54/html5/thumbnails/107.jpg)
![Page 108: CLASSIFICATION STEPS (1) · 2013-08-11 · CLASSIFICATION STEPS (1) ข้อมูลการเรียนรู้ (Train data) เทคนิค Classification ข้อมูลทดสอบ](https://reader033.vdocuments.us/reader033/viewer/2022042003/5e6ea7b1ba5c475a9c171a54/html5/thumbnails/108.jpg)
AN INTRODUCTION TO
DATA MINING WITH WEKA
Association Rules
![Page 109: CLASSIFICATION STEPS (1) · 2013-08-11 · CLASSIFICATION STEPS (1) ข้อมูลการเรียนรู้ (Train data) เทคนิค Classification ข้อมูลทดสอบ](https://reader033.vdocuments.us/reader033/viewer/2022042003/5e6ea7b1ba5c475a9c171a54/html5/thumbnails/109.jpg)
ASSOCIATION RULES IN WEKA
เปด weka > เลอก Explorer > กดปม Open file…>เลอกไฟล dataset\Example1.arff
![Page 110: CLASSIFICATION STEPS (1) · 2013-08-11 · CLASSIFICATION STEPS (1) ข้อมูลการเรียนรู้ (Train data) เทคนิค Classification ข้อมูลทดสอบ](https://reader033.vdocuments.us/reader033/viewer/2022042003/5e6ea7b1ba5c475a9c171a54/html5/thumbnails/110.jpg)
ASSOCIATION RULES IN WEKA
กดปม Edit QID Items
1 Apple, Ceral, Diapers
2 Beer, Cereal, Eggs
3 Apple, Beer, Cereal, Eggs
4 Beer, Eggs
![Page 111: CLASSIFICATION STEPS (1) · 2013-08-11 · CLASSIFICATION STEPS (1) ข้อมูลการเรียนรู้ (Train data) เทคนิค Classification ข้อมูลทดสอบ](https://reader033.vdocuments.us/reader033/viewer/2022042003/5e6ea7b1ba5c475a9c171a54/html5/thumbnails/111.jpg)
ASSOCIATION RULES IN WEKA(CONT’) คลกท tab Associate
3
1
2
![Page 112: CLASSIFICATION STEPS (1) · 2013-08-11 · CLASSIFICATION STEPS (1) ข้อมูลการเรียนรู้ (Train data) เทคนิค Classification ข้อมูลทดสอบ](https://reader033.vdocuments.us/reader033/viewer/2022042003/5e6ea7b1ba5c475a9c171a54/html5/thumbnails/112.jpg)
1 : ASSOCIATOR
เลอกเทคนคการหากฎความสมพนธ(association rules) สวนใหญใชเทคนค Apriori
เซตคาพารามเตอรตาง ๆ Delta : คาทใชในการลดคา support lowerBoundMinSupport : คา minimum
support(0.5 = 50%)
![Page 113: CLASSIFICATION STEPS (1) · 2013-08-11 · CLASSIFICATION STEPS (1) ข้อมูลการเรียนรู้ (Train data) เทคนิค Classification ข้อมูลทดสอบ](https://reader033.vdocuments.us/reader033/viewer/2022042003/5e6ea7b1ba5c475a9c171a54/html5/thumbnails/113.jpg)
1 : ASSOCIATOR (CONT’) เซตคาพารามเตอรตาง ๆ
MetricType:score ทใชในการเรยน (rank) กฎความสมพนธ
minMetric : คา Score ทเลอกกนใน Metric Type กฎทสนใจจะตองมคามากกวาทก าหนด
numRules:จ านวนกฎความสมพนธทตองการ
outputitemSets:แสดงความถของสนคาทมการซอพรอมกน
![Page 114: CLASSIFICATION STEPS (1) · 2013-08-11 · CLASSIFICATION STEPS (1) ข้อมูลการเรียนรู้ (Train data) เทคนิค Classification ข้อมูลทดสอบ](https://reader033.vdocuments.us/reader033/viewer/2022042003/5e6ea7b1ba5c475a9c171a54/html5/thumbnails/114.jpg)
2 : RESULT LIST
แสดงผลการท างานครงกอน ๆ แสดงเวลา เทคนคทใช คลกขวาทผลจะแสดง option เพมเตม
Save result buffer : ใชบนทกผลการท างาน
![Page 115: CLASSIFICATION STEPS (1) · 2013-08-11 · CLASSIFICATION STEPS (1) ข้อมูลการเรียนรู้ (Train data) เทคนิค Classification ข้อมูลทดสอบ](https://reader033.vdocuments.us/reader033/viewer/2022042003/5e6ea7b1ba5c475a9c171a54/html5/thumbnails/115.jpg)
3 : ASSOCIATOR OUTPUT
แสดงผลการหากฎความสมพนธ Eggs=y==>Beer=y conf:1
“ทกครงทลกคาซอไขไกแลวจะซอเบยรดวย”
Apple Beer=y ==> Egg=y conf:1“ทกครงทลกคาซอแอปเปลและเบยรแลวจะซอไขไกดวย”
QID Items
1 Apple, Ceral, Diapers
2 Beer, Cereal, Eggs
3 Apple, Beer, Cereal, Eggs
4 Beer, Eggs
![Page 116: CLASSIFICATION STEPS (1) · 2013-08-11 · CLASSIFICATION STEPS (1) ข้อมูลการเรียนรู้ (Train data) เทคนิค Classification ข้อมูลทดสอบ](https://reader033.vdocuments.us/reader033/viewer/2022042003/5e6ea7b1ba5c475a9c171a54/html5/thumbnails/116.jpg)
EXAMPLE : ASSOCIATION RULES
เปด weka > เลอก Explorer > กดปม Open file…>เลอกไฟล dataset\Example1.arff
![Page 117: CLASSIFICATION STEPS (1) · 2013-08-11 · CLASSIFICATION STEPS (1) ข้อมูลการเรียนรู้ (Train data) เทคนิค Classification ข้อมูลทดสอบ](https://reader033.vdocuments.us/reader033/viewer/2022042003/5e6ea7b1ba5c475a9c171a54/html5/thumbnails/117.jpg)
EXAMPLE : ASSOCIATION RULES
Remove แอตทรบวตทไมส าคญออก คลกท order_id คลกท Remove
![Page 118: CLASSIFICATION STEPS (1) · 2013-08-11 · CLASSIFICATION STEPS (1) ข้อมูลการเรียนรู้ (Train data) เทคนิค Classification ข้อมูลทดสอบ](https://reader033.vdocuments.us/reader033/viewer/2022042003/5e6ea7b1ba5c475a9c171a54/html5/thumbnails/118.jpg)
EXAMPLE : ASSOCIATION RULES
เปลยนคา lowerBoundMinSupport เปน 0.5
เปลยนคา minMetric เปน 0.5 เปลยนคา numRules เปน 30 เลอก OutputItemSets เปน True กดปม OK กดปม Start
![Page 119: CLASSIFICATION STEPS (1) · 2013-08-11 · CLASSIFICATION STEPS (1) ข้อมูลการเรียนรู้ (Train data) เทคนิค Classification ข้อมูลทดสอบ](https://reader033.vdocuments.us/reader033/viewer/2022042003/5e6ea7b1ba5c475a9c171a54/html5/thumbnails/119.jpg)
EXAMPLE : ASSOCIATION RULES
![Page 120: CLASSIFICATION STEPS (1) · 2013-08-11 · CLASSIFICATION STEPS (1) ข้อมูลการเรียนรู้ (Train data) เทคนิค Classification ข้อมูลทดสอบ](https://reader033.vdocuments.us/reader033/viewer/2022042003/5e6ea7b1ba5c475a9c171a54/html5/thumbnails/120.jpg)
LAB 7-1 : MARKET BASKET
Business Understanding ซปเปอรมารเกตแหงหนงตองการท าระบบ CRM กบลกคาทเขามาซอสนคาโดยตองการหาวาม
สนคาชนดใดบางทลกคามกจะซอพรอมกนบอย ๆ เพอน าไปจดโปรโมชน
Data Understanding ซปเปอรมารเกตแหงนไดท าการเกบประวตการซอสนคาของลกคาจ านวน 1,000 คน โดยขอมลของลกคาแตละรายจะแบงเปน 2 สวนใหญ ๆ คอ
ขอมลรายละเอยดเกยวกบลกคาแตละรายมจ านวน......แอตทรบวต ขอมลสนคาทลกคาซอแตละครงมจ านวน ......แอตทรบวต
ขอมลเหลานไดถกรวบรวมเกบไวในไฟล supermarket_basket_transactions_2005.arff ในแผน CD โฟลเดอร dataset/supermarket