Willkommen!

Willkommen zu diesem R-Kurs! In diesem Kurs zeige ich dir den Workflow von Rohdaten bis zu deinen ersten eigenen Analysen in R. Als ich selbst Anfänger war, habe ich viele Kurse dieser Art ausprobiert. Dabei sind mir zwei Punkte aufgefallen, die meinen Lernprozess verlangsamt haben – und die ich in diesem Kurs bewusst anders machen möchte:

  • In vielen Kursen wurde zu Beginn viel zu viel Unnötiges vermittelt. Es ist beispielsweise nicht entscheidend, mehrere Varianten eines Befehls zu kennen – viel wichtiger ist es, ein Verständnis und eine Intuition für die Funktionsweise zu entwickeln.

Dieser Kurs war ursprünglich ein Tutorial für meine jüngeren Studierenden an der Universität. Dabei habe ich mir folgende Frage gestellt: Was müssen sie wissen, um eigenständig Datenanalysen mit R durchführen zu können? Die Antwort lautet: Sie brauchen ein Verständnis für den Workflow. Deshalb habe ich mich entschieden, einen Kurs zu konzipieren, der nicht unnötige Varianten von Funktionen zeigt, sondern erklärt, wie man eine konkrete Fragestellung systematisch analysiert.

  • Viele Kurse waren nicht reproduzierbar! Das liegt nicht direkt an den Kursen selbst. Es gibt Werkzeuge, um R-Skripte reproduzierbar zu machen. Allerdings sind diese Werkzeuge nicht besonders anfängerfreundlich. Autorinnen und Autoren solcher Kurse stehen daher vor einem Zielkonflikt: Entweder sie vermitteln Einsteigerinnen und Einsteigern unnötig komplexe Inhalte oder sie verzichten darauf und nehmen in Kauf, dass der Kurs nicht reproduzierbar ist.

Dieser Kurs ist anders! Hier kannst du die R-Skripte herunterladen, sie direkt auf deinem eigenen Gerät ausführen und den Kurs aktiv nachvollziehen. So erhältst du eine authentische Erfahrung mit R zu arbeiten.

Über diesen Kurs

Voraussetzungen

  • R und RStudio. Du solltest die jeweils aktuellste Version von R und RStudio installieren. Wie das geht, wird hier erklärt.

Was sind R und RStudio?

R ist eine Programmiersprache, die speziell für statistische Analysen entwickelt wurde. RStudio ist die Standard-Entwicklungsumgebung (IDE), um mit R zu arbeiten.

Warum R?

  • Kostenlos und Open Source
  • Funktionalitäten für alle Schritte des Forschungsprozesses – von der Datenerhebung bis zur Datenanalyse
  • Speziell für statistische Analysen entwickelte Programmiersprache
  • Sehr aktive Community:
    1. B. die R-Community auf StackOverflow
    1. B. #rstats auf Twitter

Was dich erwartet – und was nicht

In diesem Kurs lernst du:

  • Dich mit R und seiner grundlegenden Syntax vertraut zu machen
  • Zentrale Befehle aus dem tidyverse-Paket
  • Data Manipulation
  • Einen effizienten Workflow
  • Eine kurze Einführung in grundlegende Datenanalyse und Explorative Datenanalyse (EDA)

Was du nicht lernen wirst:

  • Fortgeschrittene R-Anwendungen (z. B. Webscraping, quantitative Textanalyse etc.)

Überblick über die Kursstruktur

1. Die R-Umgebung

  • Grundlegende Funktionalitäten (Berechnungen, Vektoren, Matrizen, Listen)
  • Objektklassen
  • Zugriff auf, Filtern und Benennung von Objekten

2. Datenmanipulation

  • Pipelines bzw. Piping
  • Das tidyverse – dplyr
  • Laden und Speichern von Daten
  • Daten strukturieren: Umbenennen, Neuordnen, Filtern und Selektieren
  • Variablen transformieren
  • Daten zusammenführen (Merging)
  • Fehlende Werte

3. Explorative Datenanalyse / Deskriptive Statistik

  • Standardkennzahlen (Mittelwert, Median, Standardabweichung usw.)
  • Kontingenztafeln
  • Korrelationen
  • Arbeiten mit EDA-Paketen

4. Datenvisualisierung

  • Das tidyverse – ggplot2
  • Erstellung von Plots
  • Visualisierung beliebiger Datenstrukturen

5. Datenanalyse

  • Lineare Regression
  • Modellgüte
  • Hypothesentests mit R
  • Multiple Regression
  • Kategoriale Variablen

6. R-Programmierung

  • For-Schleifen
  • Die apply-Familie
  • Eigene Funktionen

7. Weitere Erläuterungen zu Datenanalyse

  • Wahrscheinlichkeitstheorie
  • Regressionsdiagnostik

Über mich

Mein Name ist Okan Sarioglu und ich bin studierter Politikwissenschaftler. Aktuell arbeite ich als Berater für Daten und KI. Mein Job ist es, meine Kunden zu befähigen, Daten zu nutzen und ihr Leben einfacher und somit besser zu machen. Wie bereits erwähnt, startete dieser Kurs als eine Einführung in R für Masterstudierende und ich hoffe, dass dieser Kurs R jeder und jedem beibringt, die genauso enthusiastisch bezüglich Daten sind wie meine Studierenden damals!

Werde Teil dieses Kurses! Bitte melde Fehler, Bugs oder Probleme im Code. Wenn du Ideen hast, wie sich dieser Kurs verbessern lässt, kontaktiere mich gerne über GitHub oder per E-Mail. Lass uns generell in Kontakt bleiben – folge mir auf GitHub und LinkedIn. Wenn dir der Kurs gefällt, teile deine Erfahrungen und empfehle ihn weiter!