Zurück zu allen Events

Data Science Bootcamp mit R


  • Sirius Business Park München Obersendling 44 Rupert-Mayer-Straße München, BY, 81379 Deutschland (Karte)

Kursbeschreibung

Unser 8-tägiger Data Science Bootcamp vermittelt Grundwissen aus dem Bereich der Datenanalyse, Statistik und Machine Learning. Für die Anwendungsbeispiele und praktische Übungsaufgaben kommt die statistische Software R zum Einsatz. Ziel des Bootcamps ist es, theoretisches und praktisches Wissen über wichtige Data Science Methoden zu vermitteln. Dies soll es den Teilnehmern erleichtern, in ihrem Arbeitsalltag eigene Analysen und Projekte zielgerichteter und effizienter bearbeiten zu können, ohne sich tagelang selber in bestimmte Data Science Themen einarbeiten zu müssen. Zudem werden in den einzelnen Themenblöcken hilfreiche Zusatzpakete in R empfohlen, deren Nutzung oft unnötige Programmierarbeit, zusätzliche Recherchen und Anfängerfehler ersparen können.

Die einzelnen Themenblöcke können auch separat als eigenständige Kurse gebucht werden.

Tag 1 (optional): R Crashkurs: Erste Schritte der Datenanalyse

An diesem Kurstag erlernen Teilnehmer den Umgang mit der statistischen Software R und erste Schritte um mit R einfache Analysen durchführen. Die hier vermittelten R Grundlagen helfen dabei die Anwendungsbeispiele und praktische Übungsaufgaben der nachfolgenden Kurstage besser zu verstehen. Der Kurstag ist sowohl für R Anfänger als auch für Teilnehmer gedacht, die R Kenntnisse in einer strukturierten Einführung erlernen oder auffrischen möchten. Wer bereits ausreichende R Kenntnisse besitzt, kann auf diesen Tag bei der Buchung des Data Science Bootcamps verzichten.

Tag 2 - 3: Statistische Modellierung und Inferenz

Eine detailliertere Kursbeschreibung erhalten Sie über den obigen Link im Titel des jeweiligen Themenblocks, über dem Sie die Inhalte auch als separaten Kurs buchen können. Folgende Themengebiete werden in diesen zwei Tagen behandelt:

  • Grundlagen der Datenanalyse und Statistik

    • Deskriptive Statistik

    • Stochastik: Zufallsvariablen, Wahrscheinlichkeitsverteilungen und -dichten

    • Einführung in die Statistische Inferenz:
      Punkt- und Intervallschätzung, statistische Tests, statistische Modellierung

  • Statistische Modellierung:

    • Das lineare Regressionsmodell 

    • Nicht-lineare Effekte

    • Modelldiagnose

    • Logistische Regression und Poisson Regression

Tag 4 - 5: Multivariate Verfahren mit Fokus auf Unsupervised Machine Learning

Eine detailliertere Kursbeschreibung erhalten Sie über den obigen Link im Titel des jeweiligen Themenblocks, über dem Sie die Inhalte auch als separaten Kurs buchen können. Folgende Themengebiete werden in diesen zwei Tagen behandelt:

  • Diskriminanzanalyse

  • Auffinden von Gruppen bzw. Ähnlichkeitsstrukturen in Daten mit Hilfe der Clusteranalyse

  • Dimensionsreduktion mittels Hauptkomponentenanalyse (PCA)

Tag 6 - 8: Supervised Machine Learning

Eine detailliertere Kursbeschreibung erhalten Sie über den obigen Link im Titel des jeweiligen Themenblocks, über dem Sie die Inhalte auch als separaten Kurs buchen können. Folgende Themengebiete werden in diesen drei Tagen behandelt:

  • Einführung in allgemeine Machine Learning Konzepte 

  • Beliebte Machine Learning Algorithmen wie Klassifikations- und Regressionsbäume (CART), Random Forests und das Gradient Boosting Verfahren

  • Modellevaluation und Resampling (z.B. Kreuzvalidierung, Bootstrap)

  • Vergleich verschiedener Gütemaße zur Modellevaluation 

  • Einführung in die ROC Analyse für Klassifikationsmodelle

  • Modellselektion, Hyperparameter-Tuning und Nested Resampling

  • Methoden zur Variablenselektion (z.B. Feature filtering, Feature selection)

Anmeldung

Frühere Events: 2. Dezember
R Crashkurs
Späteres Event: 3. Dezember
Statistische Modellierung und Inferenz in R