Skip to main content

Data Mining – Einführung in Data Mining

Winter

(engl. Data Mining for Bachelor Students - An Introduction )

Modulnummer: FIN-INF-110302
Link zum LSF: LSF
Verantwortung: Myra Spiliopoulou
Dozent:in: Myra Spiliopoulou
Lehrveranstaltungen:
  • Vorlesung DM4BA
  • Übung DM4BA
Verwendbarkeit: - B.Sc. INF: Informatik - Wahlpflicht
- B.Sc. INF: Studienprofil: Künstliche Intelligenz
- B.Sc. CV: Informatik - Wahlpflicht
- B.Sc. INGINF: Informatik - Wahlpflicht
- B.Sc. WIF: Verstehen und Gestalten - Wahlpflicht
- B.Sc. WIF: Gestalten und Anwenden - Wahlpflicht
- B.Sc. INF (bilingual): Informatik - Wahlpflicht

Kürzel

DM4BA

CP

5

Semester

Winter

Fachsem.

ab 4.

Dauer

1 Semester

Sprache

deutsch

Niveau

Bachelor

Angestrebte Lernergebnisse:
Die Studierenden:

  • verstehen, wozu Data Mining gut ist
  • verstehen, wie eine Klassifikationsaufgabe aussieht und wie eine Clustering-Aufgabe aussieht, und können zwischen den zwei Typen von Aufgaben unterscheiden
  • verstehen, wie einfache Klassifikationsmethoden funktionieren und können diese für Probleme anwenden
  • verstehen, wie einfache Clustering-Methoden funktionieren und können diese für Probleme anwenden
  • verstehen die Herausforderungen der Evaluation von Modellen
  • können Evaluationsvorgänge gestalten und durchführen
  • verstehen, warum Data Engineering vor dem Aufruf von Lernverfahren nötig ist
  • können einfache Instrumente der Datenaufbereitung anwenden und ihre Ergebnisse evaluieren
und haben damit notwendige Grundlagen erworben, um einen einfachen Vorgang zum Ableiten eines Modells und zu dessen Evaluation zu gestalten.

Inhalt:

  • Klassifikation: Lernverfahren und Evaluationsvorgänge
  • Clustering: Lernverfahren und Evaluationsvorgänge
  • mehr zu Methoden für die Evaluation von Modellen
  • Data Engineering: Datenaufbereitungsaufgaben, -methoden und -evaluationsvorgänge

Arbeitsaufwand:
56 h Präsenz + 94 h selbstständige Arbeit

Prüfungsvorleistungen: Studien-/Prüfungsleistungen: Lehrform / SWS:

  • Klausur 120 Minuten
  • Prüfungszulassungsvoraussetzung: Erreichen einer minimalen Anzahl von Punkten durch Votierung auf Übungsaufgaben

  • Vorlesung (2 SWS)
  • Übung (2 SWS)

Voraussetzungen nach Prüfungsordnung: Empfohlene Voraussetzungen:

keine

Datenbanken

Medienformen: Literatur:


  • Zu Data Mining Methoden und zu Evaluationsansätzen:
    • Pan-Ning Tan, Michael Steinbach, Anuj Karpatne, Vipin Kumar (2019). Introduction to Data Mining, 2nd edition. Pearson – Ausschnitte aus Kpt 3, 5, 7
    • Ian Witten & Eibe Frank (2005). Data Mining – Practical machine learning tools and techniques. 2nd edition.
      Elsevier – Ausschnitte aus Kpt 4 zu Naive Bayes
    Zu Data Engineering:
    • Salvador Garcia, Julian Luengo, Francisco Herrera (2015). Data Preprocessing for Data Mining.
      Springer – Ausschnitte aus Kpt 3, 4, 7, evtl auch aus Kpt 2
    • und eventuell für Zeitreihen:
      • Parmezan, A. R. S., Souza, V. M. A., and Batista, G. E. A. P. A. (2019). Evaluation of statistical and machine learning models for time series prediction: Identifying the state-of-the-art and the best conditions for the use of each model. Information Sciences, DOI: 10.1016/j.ins.2019.01.076
      • Cismondi, F. C., Fialho, A., Vieira, S., Reti, S., Sousa, J., and Finkelstein, S. (2013). Missing data in medical databases: Impute, delete or classify? Artificial Intelligence in Medicine, DOI: 10.1016/j.artmed.2013.01.003
    Weitere Literatur wird in den einzelnen Sessions aufgelistet.

Hinweise: