Stichprobe/Sampling

Als Stichprobe oder Sampling wird die Auswahl einer Teilmenge verstanden, die untersucht werden soll, genauer: eine Untergruppe von Fällen. Das können Personen, Gruppen, Interaktionen oder Ereignisse sein, an bestimmten Orten zu bestimmten Zeiten. Sie stehen für eine Population, eine Grundgesamtheit oder einen Sachverhalt.

Das Sampling ist wichtig, weil es die möglichen Erkenntnisse beeinflusst. Wer etwa eine Untersuchung zu SportlerInnen machen will, jedoch nur BasketballerInnen und EiskunstläuferInnen einbezieht, wird kaum etwas zur Gruppe der SportlerInnen insgesamt sagen können.

Die Stichprobenziehung unterscheidet sich deutlich zwischen standardisierten oder hypothesenprüfenden (quantitativen) Verfahren und den rekonstruktiven oder theoriebildenden (qualitativen) Herangehensweisen (siehe qualitativ versus quantitativ).

Stichprobenziehung in standardisierten oder hypothesenprüfenden (quantitativen) Verfahren

In den seltensten Fällen ist es möglich, die Grundgesamtheit oder Population (z.B. die Matheleistung aller SchülerInnen aller 4. Klassen einer Region) zu untersuchen. Um dennoch allgemeingültige Aussagen über die Grundgesamtheit treffen zu können, nutzen standardisierte Verfahren repräsentative Zufallsstichproben, also eine ausgewählte Teilmenge der Grundgesamtheit.

Eine Stichprobe ist repräsentativ, wenn sie die wesentlichen Charakteristika der Grundgesamtheit abbildet. Zufällig ist die Auswahl, wenn alle Elemente der Grundgesamtheit (z.B. SchülerInnen der 4. Klasse) die gleiche Chance haben, in die Stichprobe zu kommen. Ziel ist eine Stichprobe, die ein verkleinertes, unverzerrtes Abbild der Grundgesamtheit darstellt.
Es werden zwei komplexere Verfahren der Zufallsauswahl unterschieden:

  1. Geschichtete (stratifizierte) Zufallsstichprobe (z.B. Befragung von Altersgruppen): Anhand einer Schichtungsvariable (z.B. Alter) werden zunächst überschneidungsfreie Gruppen oder Schichten gebildet. Diese Schichten sollen in sich homogen und untereinander möglichst unterschiedlich sein. Dann erfolgt eine Zufallsauswahl aus den Schichten, z.B. werden je 100 Personen aus allen Altersschichten befragt.
  2. Klumpenstichprobe (z.B. Befragung von Busfahrgästen): Als Stichprobe werden zufällige Gruppen oder „Klumpen“ (z.B. Busse) ausgewählt. Diese Klumpen sollen in sich heterogen, aber untereinander möglichst ähnlich sein. Aus den zufällig ausgewählten Klumpen werden alle Elemente befragt, also alle Busfahrgäste.

Die Zufallsauswahl und ihre Dokumentation ist wichtig, weil sie die Aussagekraft bedingt. Wer etwa bei einer Telefonbefragung nur Festnetztelefone anruft, sollte dies nicht aus Versehen tun und kann nur zu einer bestimmten Grundgesamtheit Aussagen treffen. Die Frage ist, wer überhaupt noch einen Festnetzanschluss hat.

Samplingstrategien für rekonstruktive oder theoriebildene (qualitative) Verfahren

Um zu einem aussagekräftigen Sampling zu gelangen, werden die ersten Fälle nur grob ausgewählt, jedoch noch nicht auf Grundlage einer spezifischen Theorie. Erst nach und nach werden theoretische Kategorien entwickelt, die die Auswahl der nächsten Fälle bestimmen. Man spricht vom Theoretical Sampling, das streng an der Theoriebildung orientiert ist (etwa Grounded Theory). Hier ist das Prinzip der Minimierung und Maximierung von Unterschieden (Konstrastierung) wichtig: Es werden sehr ähnliche und sehr unterschiedliche Fälle gesucht. Damit wird einerseits sichergestellt, dass das Gefundene kein Einzel- oder Sonderfall ist. Andererseits wird so die Breite des Untersuchungsfeldes ausgelotet:

  • Minimale Kontrastierung = prüft die Tauglichkeit der Hypothesen und Theorien
  • Maximale Kontrasierung = lotet die Varianz im Untersuchungsfeld aus, bis man keine neuen theoretisch relevanten Unterschiede oder Ähnlichkeiten mehr findet (das wäre eine theoretische Sättigung)
Kombinierte Samplingstrategien

Hypothesenprüfende und theoriebildende Verfahren können auch kombiniert werden, etwa als Sampling nach vorab festgelegten Kriterien (gezielte Fallauswahl). Möglich wäre, erst Daten mit standardisierten Methoden zu erheben, in denen Auffälligkeiten sichtbar wurden, die sich aber nicht interpretieren lassen, um anschließend rekonstruktiv nachzuhaken (Triangulation), womit ungewöhnliche Konstellationen oder unklare Zusammenhänge sichtbar werden (z.B. Lebensstil und Religiosität). Auch eine Clusteranalyse ist möglich. Dabei werden in sich homogene Gruppen anderen homogenen Gruppen gegenübergestellt, wobei sich beide Gruppen untereinander jedoch möglichst deutlich unterscheiden. So arbeitet mitunter die Marktforschung.

Schneeballsampling

Beim Snowball-Sampling empfehlen InterviewpartnerInnen andere Personen, die befragt werden können. Dies schafft einen Zugang zum Feld und identifiziert mögliche relevante Akteure. So zu arbeiten ist sinnvoll, um sich ein Feld zu erschließen. Je nach Forschungsfrage reicht diese Praxis jedoch nicht immer aus.

Wann hat man genügend Fälle?
Stichprobengröße bei standardisierten Methoden
Im Zusammenhang mit der Zufallsauswahl wird nicht selten das Thema Stichprobengröße diskutiert. Die Stichprobengröße muss zum Beispiel ausreichend groß sein, sodass mit einer gewissen Genauigkeit vorhandene Merkmalsunterschiede gemessen werden können. Die Variabilität (Streuung) des zu untersuchenden Merkmals ist dabei eine entscheidende Einflussgröße. Die Untersuchung eines eher stark streuenden Merkmals erfordert häufig eine größere Stichprobe.Welche Stichprobengröße im Einzelfall angemessen ist, kann meist durch ein umfassendes Literaturstudium beantwortet werden (z.B. die gewählte Stichprobengröße vergleichbarer Studien). Anhaltspunkt bieten zudem die Konventionen des eigenen Fachbereichs. Es ist auch möglich, die optimale Stichprobengröße zu berechnen. Dafür bieten sich Programme wie G*Power an.
Stichprobengröße bei rekonstruktiven Methoden

Für rekonstruktive Verfahren besteht ein leidiges Problem: Oft wird ihnen vorgeworfen, nicht aussagekräftig sein zu können, da sie – anders als standadisierte Studien – deutlich weniger Fälle untersuchen. Da die Erhebungs- und Auswertungsprozesse andere sind, kann man beide jedoch nicht so einfach gegeneinander ausspielen. Beim Theoretical Sampling sind es genügend Fälle, wenn eine Sättigung der zu untersuchenden Merkmale erreicht ist, wenn sich Dinge oder Aussagen wiederholen und Muster erkennbar werden. Ob die relevanten Differenzen im Feld tatsächlich im erhobenen Material abgebildet werden, lässt sich oft nur schwer vorhersagen, vor allem, da unerwartete Kontrastdimensionen oder andere Überraschungen auftauchen können. Dem kann man mit der systematischen Suche nach Fällen entgegenwirken. Für die Kontrastierung braucht es mindestens zwei Fälle. Grundsätzlich gilt: Je nach Feld und Möglichkeiten muss unterschieden werden; und wer vorsichtig formuliert (also nicht einfach so Dinge für prinzipiell möglich oder unmöglich erklärt oder Tatsachen behauptet), muss nicht alles gesichtet haben.

Für Abschlussarbeiten (sechs Monate Bearbeitungszeit) sind wenige Fälle meist ausreichend. Je mehr Kontraste (Dimensionen) untersucht werden sollen, desto mehr Fälle sind nötig. Schließlich lassen sich die Ergebnisse kleinerer Untersuchungen auch argumentativ oder stilistisch einordnen. Es heißt dann nicht: „Die Daten zeigen X“, sondern eher: „Die Auswertung der Daten lässt die Vermutung zu, dass X sein könnte. Eine größer angelegte Untersuchung müsste diese These prüfen“ oder so ähnlich. Gerade kürzere Untersuchungen können der explorativen Forschung erste Vermutungen erlauben. Viel mehr ist in studentischen Arbeiten meist nicht realistisch.

 

Literatur
Fragestellung|Design
Die Fragestellung ist das Herz jeder wissenschaftlichen Arbeit. Sie bedingt methodische Entscheidungen und weist den weiteren Weg der Untersuchung.