Machine Learning in R

In diesem Kurs werden Methoden und Konzepte des maschinellen Lernens zur Analyse komplexer Klassifikations- und Regressionsprobleme vorgestellt, die besonders für die Modellierung überwachter (supervised), nicht-linearer Zusammenhänge geeignet sind.
Die grundlegenden Prinzipien der vorgestellten Methoden und Konzepte werden für Anfänger verständlich erläutert, deren Funktionsweise illustriert und die Vor- und Nachteile sowie Besonderheiten diskutiert. Alle eingeführten Themen werden anhand praktischer Beispiele und Anwendungsfälle veranschaulicht und mit Übungsaufgaben von Teilnehmern eingeübt.
Im Kurs kommt die Anwendung der Software R und insbesondere das R package mlr: Machine Learning in R zum Einsatz, welches auch vom Team der Essential Data Science Training GmbH seit Jahren mitentwickelt wird.

logo_navbar.png

Der Kurs behandelt folgende Themen:

  • Einführung in allgemeine Machine Learning Konzepte. Begriffserklärung und Erläuterung der Fachterminologie.

  • Erläuterung der Funktionsweise von elementaren Klassifikations- und Regressionsmodellen, einschließlich Klassifikations- und Regressionsbäume (CART), Random Forests und Gradient Boosting.

  • Modellevaluation und Resampling (z.B. Kreuzvalidierung, Bootstrap).

  • Vergleich verschiedener Gütemaße zur Evaluation der Performance von Machine Learning Modellen.

  • Einführung in die ROC Analyse für Klassifikationsmodelle.

  • Modellselektion, Hyperparameter-Tuning und Nested Resampling.

  • Methoden zur Variablenselektion (z.B. Feature filtering, Feature selection)

  • Parallelisierung mit mlr

Folgende R-Pakete werden behandelt:

  • mlr (Machine Learning in R)

  • rpart, randomForest, gbm, xgboost

Der Kurs ist als Einsteigerkurs konzipiert. Sollte Bedarf zu fortgeschrittenen Themen im Bereich Machine Learning bestehen, nehmen Sie bitte direkt Kontakt mit dem Dozenten auf. 

Voraussetzungen:

  • Kenntnisse in R (Im Umfang des 2-tägigen R Basiskurs bzw. 1-tägigen R Crashkurses)

  • Allgemeines Grundverständnis in der Datenanalyse / Statistik.


Wenn Sie Interesse an diesem Kurs haben, könnten Ihnen noch vor allem folgende Kurse gefallen:

  • R Basiskurs

  • Data Science Methodenkurs

  • Deep Learning in R


Nächste Kurstermine