Feature Engineering

Einer der wichtigsten Aspekte in Data Science Projekten und im maschinellen Lernen ist das Handling und Umwandeln von unterschiedlichen Variablentypen (sog. Feature Engineering).

Dabei werden verschiedene Methoden verwendet um die Prognosequalität von Modellen und ganzen Pipelines zu verbessern und komplexe Problemstellungen zu vereinfachen. Dies geschieht über voll- oder semi-automatische Methoden sowie durch problemspezifisches Domänenwissen.


Der Kurs behandelt folgende Themen:

Der Kurs behandelt eine generelle Einführung und Einordnung des Themas Feature Engineering. 

Detailliert behandelt werden:

  • Variablen Transformationen

  • Handhaben von kategorialen Variablen - mit Fokus auf Variablen mit einer großen Anzahl möglicher Ausprägungen

  • Zeitabhängige Variablen - wie z.B. Sensor Daten

  • Fehlende Werte und Imputation

  • Ausreißererkennung in den Daten

  • Unbalancierte Klassen in Klassifikationsmodellen

Im weiteren wird auf die korrekte Evaluation von Machine Learning Pipelines durch genestete Kreuzvalidierung eingegangen sowie der Verwendung von Pipelines in realen Anwendungen und der Skalierung von Pipelines auf viele Nutzer.

Es werden zwei ausführliche Use-Cases vorgestellt die verschiedene Aspekte des Feature Engineerings praktisch zeigen.

Benötigte Vorkenntnisse:

  • Grundkenntnisse in überwachten Lernverfahren, zu erwerben auch im Kurs "Machine Learning in R" 

  • Kenntnisse in R (Im Umfang des R Basiskurs)


Wenn Sie Interesse an diesem Kurs haben, könnten Ihnen noch folgende weitere Kurse gefallen:

Data Science Methodenkurs
Machine Learning & Data Mining mit R
 

Nächste Kurstermine