data mining and knowledge discovery in databases ein · pdf filedata-mining und knowledge...
TRANSCRIPT
![Page 1: Data Mining and Knowledge Discovery in Databases Ein · PDF fileData-Mining und Knowledge Discovery in Databases (KDD) Ein Überblick Dresden, 15.01.2009 Fakultätsname XYZFachrichtung](https://reader033.vdocuments.us/reader033/viewer/2022051507/5a7906867f8b9adb5a8cb663/html5/thumbnails/1.jpg)
Data-Mining und Knowledge Discovery in Databases
(KDD) Ein Überblick
Dresden, 15.01.2009
Fakultätsname XYZ Fachrichtung XYZ Institutsname XYZ, Professur XYZ
Pham Tien Hung
Institut für Angewandte InformatikProfessur für Technische Informationssysteme
![Page 2: Data Mining and Knowledge Discovery in Databases Ein · PDF fileData-Mining und Knowledge Discovery in Databases (KDD) Ein Überblick Dresden, 15.01.2009 Fakultätsname XYZFachrichtung](https://reader033.vdocuments.us/reader033/viewer/2022051507/5a7906867f8b9adb5a8cb663/html5/thumbnails/2.jpg)
TU Dresden, 16.01.2009 Data-Mining und KDD – ein Überblick Folie 2 von 31
1.Eigenschaften von KDD und Data-Mining2.Modelle eines KDD-Prozesses3.Schritte eines KDD-Prozesses4.Anwendungsbeispiel: Fehlerdiagnose an
einem Stellventil5.Zusammenfassung
Gliederung
![Page 3: Data Mining and Knowledge Discovery in Databases Ein · PDF fileData-Mining und Knowledge Discovery in Databases (KDD) Ein Überblick Dresden, 15.01.2009 Fakultätsname XYZFachrichtung](https://reader033.vdocuments.us/reader033/viewer/2022051507/5a7906867f8b9adb5a8cb663/html5/thumbnails/3.jpg)
TU Dresden, 16.01.2009 Data-Mining und KDD – ein Überblick Folie 3 von 31
Definition
• Knowledge Discovery in Databases (KDD) ist ein nichttrivialer mehrstufiger Prozess der Wissensfindung aus vorhandenen Informationen.
• KDD-Prozess umfasst alle Schritte, von woher die Daten abgeholt werden, über Vorverarbeitung und eigentliche Verarbeitung zur Informationsgewinnung (Data-Mining-Schritt), bis hin wie die Endinformation interpretiert und dargestellt wird.
• Data-Mining ist nur ein Schritt im KDD-Prozess, oft aber als Synonym verwendet.
Eigenschaften von KDD und Data-Mining
![Page 4: Data Mining and Knowledge Discovery in Databases Ein · PDF fileData-Mining und Knowledge Discovery in Databases (KDD) Ein Überblick Dresden, 15.01.2009 Fakultätsname XYZFachrichtung](https://reader033.vdocuments.us/reader033/viewer/2022051507/5a7906867f8b9adb5a8cb663/html5/thumbnails/4.jpg)
TU Dresden, 16.01.2009 Data-Mining und KDD – ein Überblick Folie 4 von 31
Die Entwicklung
• KDD ist Ergebnis von verschiedenen Forschungsgebieten aus Informatik und Mathematik wie Datenbanken, Maschinellem Lernen, Soft Computing, Statistik, Datenvisualisierung und High-Performance-Computing.
• Durch technologischen Fortschritt Möglichkeit zur Speicherung großer Datenmengen, historische sowie gegenwärtig vorhandene.
• Interessen, aus diesen Daten nützliche, kompakte Informationen oder Erkenntnisse zu gewinnen.
• 1989: KDD erstmals erwähnt.• 1996: mit Fayyad-Modell erstmals die einzelnen
Schritte konkretisiert.
Eigenschaften von KDD und Data-Mining
![Page 5: Data Mining and Knowledge Discovery in Databases Ein · PDF fileData-Mining und Knowledge Discovery in Databases (KDD) Ein Überblick Dresden, 15.01.2009 Fakultätsname XYZFachrichtung](https://reader033.vdocuments.us/reader033/viewer/2022051507/5a7906867f8b9adb5a8cb663/html5/thumbnails/5.jpg)
TU Dresden, 16.01.2009 Data-Mining und KDD – ein Überblick Folie 5 von 31
Herausforderung für KDD-Algorithmen
• Gigantische Datenbanken.• Komplexe Beziehungen zwischen Feldern/Attributen.• Fehlende Daten, falsche Daten und Rauschen.• Über- oder Unteranpassung.• Verständlichkeit der gewonnenen Muster/Wissen.• Integration in andere Systeme.
Eigenschaften von KDD und Data-Mining
![Page 6: Data Mining and Knowledge Discovery in Databases Ein · PDF fileData-Mining und Knowledge Discovery in Databases (KDD) Ein Überblick Dresden, 15.01.2009 Fakultätsname XYZFachrichtung](https://reader033.vdocuments.us/reader033/viewer/2022051507/5a7906867f8b9adb5a8cb663/html5/thumbnails/6.jpg)
TU Dresden, 16.01.2009 Data-Mining und KDD – ein Überblick Folie 6 von 31
• In Wissenschaft: Erkentnisgewinnung als Basis zum Theorieaufbau:- Medizin: Patienten-Gesundheitsverlauf, und Diagnose.- Biologie: DNA- und Protein-Sequenzierung.
• In Wirtschaft: zum Vorhersagen, Entscheidungshilfe wie:- Marketing: Verhalten verschiedener Benutzergruppen.- Betrugsentdeckung: Kreditkartenbetrug, Geldwäsche...
• In Produktion: zur Diagnose und Vorhersage von Produktdefekten.
Einige Beispiele für Anwendungen
Eigenschaften von KDD und Data-Mining
![Page 7: Data Mining and Knowledge Discovery in Databases Ein · PDF fileData-Mining und Knowledge Discovery in Databases (KDD) Ein Überblick Dresden, 15.01.2009 Fakultätsname XYZFachrichtung](https://reader033.vdocuments.us/reader033/viewer/2022051507/5a7906867f8b9adb5a8cb663/html5/thumbnails/7.jpg)
TU Dresden, 16.01.2009 Data-Mining und KDD – ein Überblick Folie 7 von 31
1.Eigenschaften von KDD und Data-Mining2.Modelle eines KDD-Prozesses3.Schritte eines KDD-Prozesses4.Anwendungsbeispiel: Fehlerdiagnose an
einem Stellventil5.Zusammenfassung
Gliederung
![Page 8: Data Mining and Knowledge Discovery in Databases Ein · PDF fileData-Mining und Knowledge Discovery in Databases (KDD) Ein Überblick Dresden, 15.01.2009 Fakultätsname XYZFachrichtung](https://reader033.vdocuments.us/reader033/viewer/2022051507/5a7906867f8b9adb5a8cb663/html5/thumbnails/8.jpg)
TU Dresden, 16.01.2009 Data-Mining und KDD – ein Überblick Folie 8 von 31
Modelle eines KDD-Prozesses
Fayyad Modell (Quelle: [1])
![Page 9: Data Mining and Knowledge Discovery in Databases Ein · PDF fileData-Mining und Knowledge Discovery in Databases (KDD) Ein Überblick Dresden, 15.01.2009 Fakultätsname XYZFachrichtung](https://reader033.vdocuments.us/reader033/viewer/2022051507/5a7906867f8b9adb5a8cb663/html5/thumbnails/9.jpg)
TU Dresden, 16.01.2009 Data-Mining und KDD – ein Überblick Folie 9 von 31
Erstes akademisches Modell (Fayyad et al.)
1. Anwendungsdomäne verstehen.2. Daten für formulierte Ziele auswählen. 3. Daten bereinigen und vorverarbeiten.4. Daten reduzieren und transformieren.5. Geeignete Data-Mining-Methode auswählen.6. Data-Mining-Schritt.7. Gefundene Ergebnisse interpretieren.8. Gefundenes Wissen anwenden.
Der Prozess ist iterativ und es können beliebige Sprünge zwischen den Schritten erfolgen.
Modelle eines KDD-Prozesses
![Page 10: Data Mining and Knowledge Discovery in Databases Ein · PDF fileData-Mining und Knowledge Discovery in Databases (KDD) Ein Überblick Dresden, 15.01.2009 Fakultätsname XYZFachrichtung](https://reader033.vdocuments.us/reader033/viewer/2022051507/5a7906867f8b9adb5a8cb663/html5/thumbnails/10.jpg)
TU Dresden, 16.01.2009 Data-Mining und KDD – ein Überblick Folie 10 von 31
Modelle eines KDD-Prozesses
CRISP-DM Modell (Quelle: [2])
![Page 11: Data Mining and Knowledge Discovery in Databases Ein · PDF fileData-Mining und Knowledge Discovery in Databases (KDD) Ein Überblick Dresden, 15.01.2009 Fakultätsname XYZFachrichtung](https://reader033.vdocuments.us/reader033/viewer/2022051507/5a7906867f8b9adb5a8cb663/html5/thumbnails/11.jpg)
TU Dresden, 16.01.2009 Data-Mining und KDD – ein Überblick Folie 11 von 31
CRISP-DM Modell (Cross Industry Standard Process
for Data Mining)
Modelle eines KDD-Prozesses
1. Anwendungsdomäne verstehen.2. Daten verstehen.3. Daten vorbereiten.4. Data-Mining.5. Modelle evaluieren.6. Ergebnisse anwenden.
Schritte 3 und 4 umfassen die Schritte 3, 4 bzw. 5, 6 im Fayyad-Modell
![Page 12: Data Mining and Knowledge Discovery in Databases Ein · PDF fileData-Mining und Knowledge Discovery in Databases (KDD) Ein Überblick Dresden, 15.01.2009 Fakultätsname XYZFachrichtung](https://reader033.vdocuments.us/reader033/viewer/2022051507/5a7906867f8b9adb5a8cb663/html5/thumbnails/12.jpg)
TU Dresden, 16.01.2009 Data-Mining und KDD – ein Überblick Folie 12 von 31
Modelle eines KDD-Prozesses
Relativer Aufwand für Schritte eines KDD-Prozesses (Quelle: [2])
![Page 13: Data Mining and Knowledge Discovery in Databases Ein · PDF fileData-Mining und Knowledge Discovery in Databases (KDD) Ein Überblick Dresden, 15.01.2009 Fakultätsname XYZFachrichtung](https://reader033.vdocuments.us/reader033/viewer/2022051507/5a7906867f8b9adb5a8cb663/html5/thumbnails/13.jpg)
TU Dresden, 16.01.2009 Data-Mining und KDD – ein Überblick Folie 13 von 31
1.Eigenschaften von KDD und Data-Mining2.Modelle eines KDD-Prozesses3.Schritte eines KDD-Prozesses4.Anwendungsbeispiel: Fehlerdiagnose an
einem Stellventil5.Zusammenfassung
Gliederung
![Page 14: Data Mining and Knowledge Discovery in Databases Ein · PDF fileData-Mining und Knowledge Discovery in Databases (KDD) Ein Überblick Dresden, 15.01.2009 Fakultätsname XYZFachrichtung](https://reader033.vdocuments.us/reader033/viewer/2022051507/5a7906867f8b9adb5a8cb663/html5/thumbnails/14.jpg)
TU Dresden, 16.01.2009 Data-Mining und KDD – ein Überblick Folie 14 von 31
Schritte eines KDD-Prozesses
A. Daten verstehen
• Datentyp
+ Statisch: nominal, ordinal, Set, Objekt.
+ Dynamisch: (unendliche) Stream-Daten, Zeitreihen...
• DatenquellenDatenbanken, Data Warehouse, WWW, Sensoren...
![Page 15: Data Mining and Knowledge Discovery in Databases Ein · PDF fileData-Mining und Knowledge Discovery in Databases (KDD) Ein Überblick Dresden, 15.01.2009 Fakultätsname XYZFachrichtung](https://reader033.vdocuments.us/reader033/viewer/2022051507/5a7906867f8b9adb5a8cb663/html5/thumbnails/15.jpg)
TU Dresden, 16.01.2009 Data-Mining und KDD – ein Überblick Folie 15 von 31
• Datenmenge- Anzahl der Datensätze, Anzahl der Attribute, Anzahl der zulässigen Werte eines Attributs.
• Datenqualität- Nichtvollständige, nicht exakte, überflüssige, verrauschte Daten.
• Methoden zum Datenverstehen, z.B.- Statistische Auswertung der Daten (Minimum, Maximum, Mittelwert, Varianz, Ausreißerdetektion.- Verschiedene Visualisierungen für Daten, Zusammenhänge (Scatter-, Verteilungs-, Korrelationsgraph...).
A. Daten verstehen
Schritte eines KDD-Prozesses
![Page 16: Data Mining and Knowledge Discovery in Databases Ein · PDF fileData-Mining und Knowledge Discovery in Databases (KDD) Ein Überblick Dresden, 15.01.2009 Fakultätsname XYZFachrichtung](https://reader033.vdocuments.us/reader033/viewer/2022051507/5a7906867f8b9adb5a8cb663/html5/thumbnails/16.jpg)
TU Dresden, 16.01.2009 Data-Mining und KDD – ein Überblick Folie 16 von 31
B. Daten vorbereiten
• Formatanpassung und Datensätze zusammenführen. • Behandlung der fehlenden Daten, Extremwerte: weglassen, durch Mittelwert, alle möglichen, häufigsten Wert ersetzen...• Daten normalisieren.• Kontinuierliche Daten diskretisieren und/oder neu gruppieren, Histogramm, Clustering.• Sampling-Methoden für Stichproben aus den Daten.• Merkmalsextraktion und -selektion.
Schritte eines KDD-Prozesses
![Page 17: Data Mining and Knowledge Discovery in Databases Ein · PDF fileData-Mining und Knowledge Discovery in Databases (KDD) Ein Überblick Dresden, 15.01.2009 Fakultätsname XYZFachrichtung](https://reader033.vdocuments.us/reader033/viewer/2022051507/5a7906867f8b9adb5a8cb663/html5/thumbnails/17.jpg)
TU Dresden, 16.01.2009 Data-Mining und KDD – ein Überblick Folie 17 von 31
• Verifikationsorientierte Methoden• Entdeckungsorientierte Methoden (nach O. Maimon und L. Rokach)
Klassifikation der Data-Mining-Methoden (Quelle: [5])
Schritte eines KDD-Prozesses
![Page 18: Data Mining and Knowledge Discovery in Databases Ein · PDF fileData-Mining und Knowledge Discovery in Databases (KDD) Ein Überblick Dresden, 15.01.2009 Fakultätsname XYZFachrichtung](https://reader033.vdocuments.us/reader033/viewer/2022051507/5a7906867f8b9adb5a8cb663/html5/thumbnails/18.jpg)
TU Dresden, 16.01.2009 Data-Mining und KDD – ein Überblick Folie 18 von 31
C. Data-Mining
ClusteringGruppierung ähnlicher Datenpunkte, z.B.:• Hierarchisch: Bottom-Up und Top-Down.• Partitionierung: K-Means, K-Medoids.
Statistische Methoden• Bayessche Methoden:- Naive Bayessche Klassifikation.- Bayessche Glaubensnetzwerke.• Regression: findet beste Anpassungskurven zu Datenpunkten z.B. Einfache, mehrfache lineare, nichtlineare Regression, logistische Regression...
Schritte eines KDD-Prozesses
![Page 19: Data Mining and Knowledge Discovery in Databases Ein · PDF fileData-Mining und Knowledge Discovery in Databases (KDD) Ein Überblick Dresden, 15.01.2009 Fakultätsname XYZFachrichtung](https://reader033.vdocuments.us/reader033/viewer/2022051507/5a7906867f8b9adb5a8cb663/html5/thumbnails/19.jpg)
TU Dresden, 16.01.2009 Data-Mining und KDD – ein Überblick Folie 19 von 31
C. Data-Mining
Neuronale NetzwerkeNachbildung der Funktionsweise des menschl. Gehirns.Typische Anwendungen z.B.:- Klassifikation.- Funktionsapproximation.- Clustering.
Weitere Methoden- Assoziationsregel.- Entscheidungsbaum.- Support Vector Machine.- Lazy Learners.- Text Mining.
Schritte eines KDD-Prozesses
![Page 20: Data Mining and Knowledge Discovery in Databases Ein · PDF fileData-Mining und Knowledge Discovery in Databases (KDD) Ein Überblick Dresden, 15.01.2009 Fakultätsname XYZFachrichtung](https://reader033.vdocuments.us/reader033/viewer/2022051507/5a7906867f8b9adb5a8cb663/html5/thumbnails/20.jpg)
TU Dresden, 16.01.2009 Data-Mining und KDD – ein Überblick Folie 20 von 31
• Klassifikation• Clustering• Regression (nach Fayyad et al. Quelle: [1])
Schritte eines KDD-Prozesses
![Page 21: Data Mining and Knowledge Discovery in Databases Ein · PDF fileData-Mining und Knowledge Discovery in Databases (KDD) Ein Überblick Dresden, 15.01.2009 Fakultätsname XYZFachrichtung](https://reader033.vdocuments.us/reader033/viewer/2022051507/5a7906867f8b9adb5a8cb663/html5/thumbnails/21.jpg)
TU Dresden, 16.01.2009 Data-Mining und KDD – ein Überblick Folie 21 von 31
D. Datenmodell evaluieren
Methoden
• Resampling-Methoden: einfache Zweiteilung, Kreuzvalidierung, Bootstrap für überwachte Methoden.• Sensitivität, Spezifität und ROC-Analyse (True Positiv/False Positiv).• Kriterien für Interessantheits- und Abstandsmaße [2].• Einfachste Modelle auswählen.
Schritte eines KDD-Prozesses
![Page 22: Data Mining and Knowledge Discovery in Databases Ein · PDF fileData-Mining und Knowledge Discovery in Databases (KDD) Ein Überblick Dresden, 15.01.2009 Fakultätsname XYZFachrichtung](https://reader033.vdocuments.us/reader033/viewer/2022051507/5a7906867f8b9adb5a8cb663/html5/thumbnails/22.jpg)
TU Dresden, 16.01.2009 Data-Mining und KDD – ein Überblick Folie 22 von 31
E. Unterstützende MethodenData-Mining-AbfragesprachenStandardisiert DM-Schritte, unterstützt High-Level-Interaktion mit Endbenutzer, vereinfacht Integration mit anderen Systemen, z.B. CRISP-DM, OLE DB for DM, DMX.
Meta-Lernen zur automat. ModellevaluierungKonzentriert auf Beziehung zwischen Aufgabe und Lernstrategien.Struktur: 2 Modi- Lernmodus: Datencharakteristik, Lernstrategien und Modellbewertung als Metawissen.- Arbeitsmodus: Anwendung von Metawissen zur Auswahl der besten Modelle.
Schritte eines KDD-Prozesses
![Page 23: Data Mining and Knowledge Discovery in Databases Ein · PDF fileData-Mining und Knowledge Discovery in Databases (KDD) Ein Überblick Dresden, 15.01.2009 Fakultätsname XYZFachrichtung](https://reader033.vdocuments.us/reader033/viewer/2022051507/5a7906867f8b9adb5a8cb663/html5/thumbnails/23.jpg)
TU Dresden, 16.01.2009 Data-Mining und KDD – ein Überblick Folie 23 von 31
1.Eigenschaften von KDD und Data-Mining2.Modelle eines KDD-Prozesses3.Schritte eines KDD-Prozesses4.Anwendungsbeispiel: Fehlerdiagnose an
einem Stellventil5.Zusammenfassung
Gliederung
![Page 24: Data Mining and Knowledge Discovery in Databases Ein · PDF fileData-Mining und Knowledge Discovery in Databases (KDD) Ein Überblick Dresden, 15.01.2009 Fakultätsname XYZFachrichtung](https://reader033.vdocuments.us/reader033/viewer/2022051507/5a7906867f8b9adb5a8cb663/html5/thumbnails/24.jpg)
TU Dresden, 16.01.2009 Data-Mining und KDD – ein Überblick Folie 24 von 31
1. Messsignalbestimmung und Klassifikation der Systemzustände
Art der Messwerterfassung:• Mit zusätzlichem sprungförmigen Anregungssignal s. • Gemessen: aktuelle Position x, Druck des Stellantriebes p,
Regeldifferenz dx, Abtastrate r.
Die Dimension des Merkmalsvektors ist 23.
Fehlerdiagnose an einem Stellventil [6]
Anwendungsbeispiel
![Page 25: Data Mining and Knowledge Discovery in Databases Ein · PDF fileData-Mining und Knowledge Discovery in Databases (KDD) Ein Überblick Dresden, 15.01.2009 Fakultätsname XYZFachrichtung](https://reader033.vdocuments.us/reader033/viewer/2022051507/5a7906867f8b9adb5a8cb663/html5/thumbnails/25.jpg)
TU Dresden, 16.01.2009 Data-Mining und KDD – ein Überblick Folie 25 von 31
Bestimmung aller möglichen Zustände (Zustand = Klasse):
• Normalzustand 1.• Fehlerzustand 2: Verstopfung der Stellluftzufuhr.• Fehlerzustand 3: erhöhte Reibung.• Fehlerzustand 4: reduzierter Zuluftdruck.• Fehlerzustand 5: pneumatische Leckage.• Fehlerzustand 6: Bruch einer Feder.
Anwendungsbeispiel
![Page 26: Data Mining and Knowledge Discovery in Databases Ein · PDF fileData-Mining und Knowledge Discovery in Databases (KDD) Ein Überblick Dresden, 15.01.2009 Fakultätsname XYZFachrichtung](https://reader033.vdocuments.us/reader033/viewer/2022051507/5a7906867f8b9adb5a8cb663/html5/thumbnails/26.jpg)
TU Dresden, 16.01.2009 Data-Mining und KDD – ein Überblick Folie 26 von 31
2. Bereitstellung eines Trainings-Datensatzes
Für jede Klasse wird ein Trainingsdatensatz von 8 Merkmalsvektoren zusammengestellt. Insgesamt 6x8 = 48 Merkmalsvektoren.
Anwendungsbeispiel
![Page 27: Data Mining and Knowledge Discovery in Databases Ein · PDF fileData-Mining und Knowledge Discovery in Databases (KDD) Ein Überblick Dresden, 15.01.2009 Fakultätsname XYZFachrichtung](https://reader033.vdocuments.us/reader033/viewer/2022051507/5a7906867f8b9adb5a8cb663/html5/thumbnails/27.jpg)
TU Dresden, 16.01.2009 Data-Mining und KDD – ein Überblick Folie 27 von 31
3. Auswahl der Klassifikatoren
4 Klassifikatoren werden hinsichtlich der Klassifikationsrate (größer oder 100%) und Umfang der Parameterdatei verglichen (je kleiner desto besser): - SVM- HSVM- Bayes- Entscheidungsbaum.
Die besten werden ausgewählt.
Anwendungsbeispiel
![Page 28: Data Mining and Knowledge Discovery in Databases Ein · PDF fileData-Mining und Knowledge Discovery in Databases (KDD) Ein Überblick Dresden, 15.01.2009 Fakultätsname XYZFachrichtung](https://reader033.vdocuments.us/reader033/viewer/2022051507/5a7906867f8b9adb5a8cb663/html5/thumbnails/28.jpg)
TU Dresden, 16.01.2009 Data-Mining und KDD – ein Überblick Folie 28 von 31
E. Merkmalsselektion
• Merkmalszahl sollen reduziert werden, so dass die Parameterzahl der Klassifikatoren kleiner wird, unter der Bedingung: die Klassifikationsrate konstant zu halten.
• Unter Verwendung des Quotientenkriteriums wird die Zahl der Merkmale von 23 auf 10 reduziert.
• Mit der reduzierten Merkmalszahl werden die Klassifikatoren erneut trainiert und verglichen.
• Aus 10 Merkmalen werden 5 ausgewählt und alle Kombinationen getestet.
• Ergebnis: HSVM und Bayes sind die besten Klassifikatoren mit Klassifikationsrate von 83,3 %.
Anwendungsbeispiel
![Page 29: Data Mining and Knowledge Discovery in Databases Ein · PDF fileData-Mining und Knowledge Discovery in Databases (KDD) Ein Überblick Dresden, 15.01.2009 Fakultätsname XYZFachrichtung](https://reader033.vdocuments.us/reader033/viewer/2022051507/5a7906867f8b9adb5a8cb663/html5/thumbnails/29.jpg)
TU Dresden, 16.01.2009 Data-Mining und KDD – ein Überblick Folie 29 von 31
1.Eigenschaften von KDD und Data-Mining2.Modelle eines KDD-Prozesses3.Schritte eines KDD-Prozesses4.Anwendungsbeispiel: Fehlerdiagnose an
einem Stellventil5.Zusammenfassung
Gliederung
![Page 30: Data Mining and Knowledge Discovery in Databases Ein · PDF fileData-Mining und Knowledge Discovery in Databases (KDD) Ein Überblick Dresden, 15.01.2009 Fakultätsname XYZFachrichtung](https://reader033.vdocuments.us/reader033/viewer/2022051507/5a7906867f8b9adb5a8cb663/html5/thumbnails/30.jpg)
TU Dresden, 16.01.2009 Data-Mining und KDD – ein Überblick Folie 30 von 31
Zusammenfassung
• Knowledge Discovery in Databases (KDD) ist ein nichttrivialer Prozess der Wissensfindung aus Daten.• Die Schritte des KDDs wurden in Modellen wie Fayyad, CRISP-DM... konkretisiert.• Es gibt für KDD Software-Systeme wie KNIME, Rapid Miner, SPSS Clementine...• Auswahl geeigneter Data-Mining-Methoden ist abhängig von Eigenschaften der Daten und Aufgabe.
![Page 31: Data Mining and Knowledge Discovery in Databases Ein · PDF fileData-Mining und Knowledge Discovery in Databases (KDD) Ein Überblick Dresden, 15.01.2009 Fakultätsname XYZFachrichtung](https://reader033.vdocuments.us/reader033/viewer/2022051507/5a7906867f8b9adb5a8cb663/html5/thumbnails/31.jpg)
TU Dresden, 16.01.2009 Data-Mining und KDD – ein Überblick Folie 31 von 31
Literatur1. U. Fayyad, G. Piatetsky-Shapiro, P. Smyth. From Data-Mining
to Knowledge Discovery in Databases. AI Magazine Volume 1, Number 3 (1996).
2. K. Cios, W. Pedrycz, R. Swiniarski, L. Kurgan. Data-Mining: A Knowledge Discovery Approach. Springer Verlag 2007.
3. Jiawei Han, M. Kamber. Data-Mining, Concepts and Techniques. Elsevier Inc. 2006.
4. D. Olson, D. Delen. Advanced Data-Mining Techniques. Springer Verlag 2008.
5. O. Maimon, L. Rokach. Data-Mining and Knowledge Discovery Handbuch. Springer Verlag 2005.
6. M. Feid, M. Pandit. Systematischer Entwurf eines signalbasierten Fehlerdiagnosesystems, Teil 1 und 2. at Automatisierungstechnik 54 (2006). Oldenburg Wissenschaftsverlag.
7. Dokumentationen von Knime, Rapid Miner, SPSS Clementine.