Unterschiede
Mittelwertunterschiede
Bevor eine Auswahl des richtigen Tests auf Mittelwertunterschiede erfolgen kann, sollte die zu testende Hypothese klar und eindeutig formuliert sein. Denn die gewählte Hypothese bestimmt, welches Testverfahren geeignet ist. Hypothesen können entweder ungerichtet (=/≠; „Das Gehalt von Frauen und Männern unterscheidet sich.“) oder gerichtet (>/<; „Das Gehalt von Frauen ist geringer als das von Männern.“) formuliert werden.
Für die Auswahl des richtigen Analyseverfahrens sind folgende Entscheidungskriterien relevant:
- Sind die gemessenen Stichproben unabhängig oder verbunden?
- Wie viele Variablen wurden untersucht?
- Sind die untersuchten Variablen normalverteilt?
Unabhängige Stichproben
Stichproben sind unabhängig, wenn die Mittelwerte zweier unabhängiger Gruppen miteinander verglichen werden (Gruppierungsvariable; zum Beispiel Schulklasse A und B, Frauen und Männer).
Nachfolgend werden die Tests für Mittelwertunterschiede bei unabhängigen Stichproben vorgestellt.
Die Tests werden nach der Anzahl der Variablen und der Notwendigkeit einer Normalverteilung der abhängigen Variablen unterschieden. Die Kriterien sind jeweils fett hervorgehoben, da sie entscheidend für die Wahl des richtigen Testverfahrens sind.
Der Einstichproben t-Test testet anhand des Mittelwerts einer Stichprobe, ob sich der Mittelwert einer Grundgesamtheit von einem vorgegebenen Wert unterscheidet. Der Einstichproben t-Tests ist ein (para-)metrisches Testverfahren.
Voraussetzung: Die abhängige Variable ist normalverteilt und hat mindestens ein metrisches Skalenniveau.
Beispiel: Die Angaben des Herstellers zum durchschnittlichen Zuckergehalt (metrisches Skalenniveau) auf der Verpackung eines Fruchtsaftes werden geprüft.
Hypothese (ungerichtet): Der Zuckergehalt unterscheidet sich von den Angaben auf der Verpackung.
Nachfolgende Tests vergleichen die Mittelwerte eines gemessenen Merkmals (abhängige Variable; etwa Lernleistung oder Schulnoten) von zwei unabhängigen Stichproben (unabhängige Variable mit 2 Stufen; zum Beispiel Schulklasse A und B, Frauen und Männer).
t-Test für unabhängige Stichproben
Der t-Test für unabhängige Stichproben testet auf Mittelwertunterschiede einer normalverteilten, mindestens intervallskalierten Variable zwischen zwei unabhängigen Stichproben. Der t-Test für unabhängige Stichproben ist die Erweiterung des Einstichproben t-Tests und ebenfalls ein (para-)metrisches Testverfahren.
Voraussetzung: Die abhängige Variable ist normalverteilt und hat mindestens ein metrisches Skalenniveau. Die unabhängigen Stichproben kommen aus Grundgesamtheiten mit annähernd identischer Varianz der abhängigen Variablen, das heißt die Varianzhomogenität sollte geprüft werden.
Beispiel: Die Lernleistung von zwei verschiedenen Klassen (Schulklasse A und B) wird mit Hilfe eines Reaktionszeittests (metrisches Skalenniveau) ermittelt.
Hypothese (ungerichtet): Die Lernleistungen von Schulklasse A und B sind unterschiedlich.
Mann-Whitney U-Test (auch: WILCOXON Rangsummentest)
Der Mann-Whitney U-Test untersucht Mittelwertunterschiede einer mindestens ordinal skalierten Variable zwischen zwei unabhängigen Stichproben. Normalverteilung ist keine Voraussetzung. Der Mann-Whitney U-Test ist ein nicht-parametrisches Testverfahren.
Voraussetzung: Die abhängige Variable hat mindestens ein ordinales Skalenniveau.
Beispiel: Die Schulnoten (ordinales Skalenniveau) von zwei verschiedenen Klassen (Schulklasse A und B) werden verglichen.
Hypothese (ungerichtet): Die Schulnoten von Schulklasse A und B unterscheiden sich.
In nachfolgenden Testverfahren werden mehr als 2 unabhängige Stichproben (unabhängige Variable mit mehr als 2 Stufen; zum Beispiel Patientengruppe A, B und C) untersucht auf Mittelwertunterschiede eines gemessenen Merkmals (abhängige Variable; etwa Lernleistung, Schulnoten).
Einfaktorielle Varianzanalyse
Eine einfaktorielle Varianzanalyse untersucht Mittelwertunterschiede einer normalverteilten, mindestens intervallskalierten Variable zwischen mehr als zwei unabhängigen Stichproben. Die einfaktorielle Varianzanalyse ist ein (para-)metrisches Testverfahren.
Voraussetzung: Die abhängige Variable ist normalverteilt und hat mindestens ein metrisches Skalenniveau. Die unabhängigen Stichproben kommen aus Grundgesamtheiten mit annähernd identischer Varianz der abhängigen Variablen, Varianzhomogenität sollte also geprüft werden.
Beispiel: Die Lernleistung von drei verschiedenen Patientengruppen (A, B und C) wird mit Hilfe eines Reaktionszeittests (metrisches Skalenniveau) ermittelt.
Hypothese (ungerichtet): Die Lernleistungen der Patientengruppen A, B und C sind unterschiedlich.
Kruskal-Wallis-Test
Der Kruskal-Wallis-Test untersucht Mittelwertunterschiede einer mindestens ordinal skalierten Variable zwischen mehr als zwei unabhängigen Stichproben. Die Normalverteilung ist keine Voraussetzung. Der Kruskal-Wallis-Test ist ein nicht-parametrisches Testverfahren.
Voraussetzung: Die abhängige Variable ist mindestens ein ordinales Skalenniveau.
Beispiel: Die Schulnoten (ordinales Skalenniveau) von drei verschiedenen Klassen (Schulklasse A, B und C) werden verglichen.
Hypothese (ungerichtet): Die Schulnoten von Schulklasse A, B und C unterscheiden sich.
Mehrfaktorielle Varianzanalyse
Die mehrfaktorielle Varianzanalyse testet Mittelwertunterschiede einer normalverteilten, mindestens intervallskalierten Variable (z. B. Lernleistung) hinsichtlich mehrerer unabhängiger Variablen (etwa Schulklasse A und B sowie Geschlecht). Die mehrfaktorielle Varianzanalyse ist ein (para-)metrisches Testverfahren.
Voraussetzung: Die abhängige Variable ist normalverteilt und hat mindestens ein metrisches Skalenniveau. Die unabhängigen Stichproben kommen aus Grundgesamtheiten mit annähernd identischer Varianz der abhängigen Variablen, Varianzhomogenität sollte also geprüft werden.
Beispiel: Es soll der Einfluss von Geschlecht und Zugehörigkeit zu Schulklasse A oder B auf die Lernleistung (Reaktionszeittests, metrisches Skalenniveau) ermittelt werden.
Hypothese (ungerichtet): Die Lernleistung der Geschlechter unterscheidet sich zwischen den Klassen.
Abhängige Stichproben
Stichproben sind abhängig, wenn die gleiche Variable zweimal bei derselben Stichprobe gemessen wird (etwa vor und nach einer Intervention). Man spricht ebenfalls von abhängigen Stichproben, wenn die Mittelwerte zweier abhängiger Gruppen miteinander verglichen werden (Gruppierungsvariable; zum Beispiel Ehemann/Ehefrau, Zwilling A/Zwilling B, Patient/Kontrollperson oder auch Mutter/Vater/Kind).
Nachfolgend werden Tests für Mittelwertunterschiede bei abhängigen Stichproben vorgestellt.
Die Tests werden nach Anzahl der Variablen und der Notwendigkeit einer Normalverteilung der abhängigen Variablen unterschieden. Die Kriterien sind jeweils fett hervorgehoben, da sie entscheidend für die Wahl des richtigen Testverfahrens sind.
Nachfolgende Tests vergleichen die Mittelwerte eines gemessenen Merkmals (abhängige Variable; also z. B. Lernleistung, Schulnoten) von zwei abhängigen Stichproben (unabhängige Variable mit 2 Stufen; z. B. Schulklasse A wird vor und nach einer Unterrichtseinheit gemessen).
t-Test für verbundene Stichproben (auch: t-Test für abhängige Stichproben)
Der t-Test für verbundene Stichproben testet auf Mittelwertunterschiede einer normalverteilten, mindestens intervallskalierten Variable zwischen zwei abhängigen Stichproben. Der t-Test für verbundene Stichproben ist ein (para-)metrisches Testverfahren.
Voraussetzung: Die abhängige Variable ist normalverteilt und hat mindestens ein metrisches Skalenniveau.
Beispiel: Die Lernleistung von Schulklasse A wird mit Hilfe eines Reaktionszeittests (metrisches Skalenniveau) vor und nach einer Unterrichtseinheit gemessen.
Hypothese (gerichtet): Die Lernleistung von Schulklasse A hat nach der Unterrichtseinheit zugenommen.
WILCOXON-Test
Der WILCOXON-Test untersucht Mittelwertunterschiede einer mindestens ordinal skalierten Variable zwischen zwei abhängigen Stichproben. Normalverteilung ist keine Voraussetzung. Der WILCOXON-Test ist ein nicht-parametrisches Testverfahren.
Voraussetzung: Die abhängige Variable ist mindestens ein ordinales Skalenniveau.
Beispiel: Die Schulnoten (ordinales Skalenniveau) von Schulklasse A werden zwischen dem letzten und dem aktuellen Schuljahr verglichen.
Hypothese (gerichtet): Die Schulnoten von Schulklasse A haben sich in diesem Jahr verbessert.
Hinweis: Für dieses Beispiel kann auch der Vorzeichentest berechnet werden.
In nachfolgenden Testverfahren werden mehr als 2 abhängige Stichproben (unabhängige Variable mit mehr als 2 Stufen; z. B. Zeitpunkt der Messung (vorher, nachher und 6 Monate Follow-up)) auf Mittelwertunterschiede eines gemessenen Merkmals (abhängige Variable; z. B. Lernleistung, Schulnoten) untersucht.
Einfaktorielle Varianzanalyse mit Messwertwiederholung
Eine einfaktorielle Varianzanalyse mit Messwertwiederholung untersucht Mittelwertunterschiede einer normalverteilten, mindestens intervallskalierten Variable zwischen mehr als zwei abhängigen Stichproben (etwa mehrere Zeitpunkte der Messung). Die einfaktorielle Varianzanalyse mit Messwertwiederholung ist ein (para-)metrisches Testverfahren.
Voraussetzung: Die abhängige Variable ist normalverteilt und hat mindestens ein metrisches Skalenniveau. Sphärizität ist gegeben.
Beispiel: Die Lernleistung (Reaktionszeittest, metrisches Skalenniveau) von Patienten wird zu 3 verschiedenen Zeitpunkten gemessen (vorher, nachher, nach 6 Monaten).
Hypothese (gerichtet): Die Lernleistung ist zum Zeitpunkt nach 6 Monaten am höchsten.
Friedman-Test
Der Friedman-Test untersucht Mittelwertunterschiede einer mindestens ordinal skalierten Variable zwischen mehr als zwei abhängigen Stichproben (etwa mehrere Zeitpunkte der Messung). Normalverteilung ist keine Voraussetzung. Der Friedman-Test ist ein nicht-parametrisches Testverfahren.
Voraussetzung: Die abhängige Variable ist mindestens ein ordinales Skalenniveau.
Beispiel: Die Schulnoten (ordinales Skalenniveau) einer Schulklasse A werden über 3 Schuljahre hinweg verglichen.
Hypothese (gerichtet): Die Schulnoten von Schulklasse A werden im Verlauf der Schuljahre besser.
Mehrfaktorielle Varianzanalyse mit Messwertwiederholung
Die mehrfaktorielle Varianzanalyse mit Messwertwiederholung testet Mittelwertunterschiede einer normalverteilten, mindestens intervallskalierten Variable (etwa Lernleistung). Mindestens eine der unabhängigen Variablen beinhaltet eine Messwertwiederholung (vorher, nachher und nach 6 Monaten). Die mehrfaktorielle Varianzanalyse mit Messwertwiederholung ist ein (para-)metrisches Testverfahren.
Voraussetzung: Die abhängige Variable ist normalverteilt und hat mindestens ein metrisches Skalenniveau. Sphärizität ist gegeben.
Beispiel: Es wird der Einfluss von Geschlecht auf die Lernleistung (Reaktionszeittests, metrisches Skalenniveau) zu 3 verschiedenen Messzeitpunkten untersucht.
Hypothese (ungerichtet): Die Lernleistung der Geschlechter unterscheidet sich zu den verschiedenen Messzeitpunkten.
Varianzunterschiede
Die Verteilungen können sich auch anhand ihrer Streuung voneinander unterscheiden. Entscheidungskriterium für die Wahl des richtigen Testverfahrens ist auch hier das Skalenniveau der abhängigen Variablen.
Mit dem F-Test werden die Varianzen von Variablen, die normalverteilt und mindestens intervallskaliert sind, zwischen verschiedenen unabhängigen Stichproben verglichen. Der F-Test ist ein (para-)metrisches Testverfahren.
Voraussetzung: Die abhängige Variable ist normalverteilt und hat mindestens metrisches Skalenniveau.
Beispiel: Die Varianz der Lernleistung (Reaktionszeittests, metrisches Skalenniveau) von zwei Schulklassen wird verglichen.
Hypothese (ungerichtet): Die Varianz der Lernleistung unterscheidet zwischen den Schulklassen.
Mit dem Chi²-Test kann man die Varianz von abhängigen Variablen jeglichen Skalenniveaus zwischen einer Stichprobe und einer Grundgesamtheit untersuchen. Der Chi²-Test prüft nur ungerichtete Hypothesen. Der Chi²-Test ist ein nicht-parametrisches Testverfahren.
Voraussetzung: Die abhängige Variable ist normalverteilt. Die Varianz der Grundgesamtheit muss bekannt sein.
Beispiel: Die Varianz der Schulnoten (ordinales Skalenniveau) von hochbegabten Schulkindern wird mit der Varianz der Schulnoten aller Schulkinder verglichen.
Hypothese (ungerichtet): Hochbegabte Schulkinder unterscheiden sich in der Varianz der Schulnoten von allen Schulkindern.