Machine Learning in R

In diesem Kurs werden Verfahren des maschinellen Lernens zur Analyse komplexer Klassifikations- und Regressionsprobleme vorgestellt, die besonders für die Modellierung überwachter, nicht-linearer Zusammenhänge geeignet sind. Die grundlegenden Prinzipien der Verfahren werden für Anfänger verständlich eingeführt und illustriert, sowie Besonderheiten herausgehoben. Alle eingeführten Methoden werden anhand praktischer Beispiele, Anwendungsfälle und Übungsaufgaben veranschaulicht. Hier kommt insbesondere die Anwendung der Software R zum Einsatz.


Der Kurs behandelt folgende Themen:

  • Einführung in allgemeine Machine Learning Konzepte. Begriffserklärung und Erläuterung der Fachterminologie.

  • Erläuterung der Funktionsweise von elementaren Klassifikations- und Regressionsmodellen, einschließlich Klassifikations- und Regressionsbäume (CART), Random Forests und Gradient Boosting.

  • Modellevaluation und Resampling (z.B. Kreuzvalidierung, Bootstrap).

  • Gütemaße zur Evaluation der Performance von Machine Learning Modellen.

  • Einführung in die ROC Analyse für Klassifikationsmodelle.

  • Modellselektion, Hyperparameter-Tuning und Nested Resampling.

  • Variablenselektion

  • Parallelisierung mit mlr

Folgende R-Pakete werden behandelt:

  • mlr (Machine Learning in R)

  • rpart, randomForest, gbm, xgboost

Der Kurs ist als Einsteigerkurs konzipiert. Sollte Bedarf zu fortgeschrittenen Themen im Bereich Machine Learning bestehen, nehmen Sie bitte direkt Kontakt mit dem Dozenten auf. 

Voraussetzungen:

Grundkenntnisse in R (im Umfang des Anfängerkurses), Grundkenntnisse in Statistik und Datenanalyse.


Wenn Sie Interesse an diesem Kurs haben, könnten Ihnen noch vor allem folgende Kurse gefallen:

  • R Basiskurs

  • Data Science Methodenkurs

  • Deep Learning in R


Termine und Anmeldung