Grundgesamtheit, Stichprobe und Fallzahl

In diesem Gastartikel will ich Ihnen einen Überblick über die Themen Stichprobe und Fallzahl geben.

Von der Grundgesamtheit zur Stichprobe

Wenn Sie eine quantitative Studie durchführen, haben Sie Ihre Daten an einer Stichprobe erhoben. Die Stichprobe ist eine Menge von Objekten, z.B. Personen, Patienten, Haushalte, Zähne, Zellen usw., die Teil Ihrer Grundgesamtheit ist. Sie wollen am Ende basierend auf dieser Stichprobe (über statistische Methoden) Aussagen über die Grundgesamtheit treffen. Sie wollen die Ergebnisse Ihrer Stichprobe also auf die Grundgesamtheit verallgemeinern.

Was genau Ihre Grundgesamtheit ist definieren Sie selbst für Ihre Forschungsfrage. Das können Patienten mit einer bestimmten Krankheit sein, Personen aus einer bestimmten Region und mit einem bestimmten Alter, Zellen einer bestimmten Art, Zähne mit einer bestimmten Krankheitsgeschichte usw. Die Definition Ihrer Grundgesamtheit ergibt sich aus Ihrer Fragestellung heraus: mit Ihrer Studie wollen Sie Aussagen über Ihre Grundgesamtheit treffen.

Die Idee ist, dass Ihre Stichprobe Ihre Grundgesamtheit abbildet, das heißt, dass sie die Grundgesamtheit repräsentiert, also repräsentativ ist.

Wie können Sie nun Repräsentativität erreichen?

Zum einen können Sie bei Ziehen der Stichprobe versuchen dafür zu sorgen, dass Ihre Stichprobe die Grundgesamtheit abbildet. Dazu würden Sie im Idealfall die Stichprobe zufällig aus Deiner Grundgesamtheit ziehen. Das heißt, jedes Objekt in Ihrer Grundgesamtheit hat die gleiche Wahrscheinlichkeit, in Ihrer Stichprobe zu landen. Damit wäre theoretisch gegeben, dass Ihre Stichprobe die Grundgesamtheit widerspiegelt.

Oft ist es nicht möglich, für eine komplett zufällige Stichprobenziehung zu sorgen, z.B. bei Umfragen. Deshalb haben sich aus praktikablen Gründen weitere Stichprobenverfahren wie zum Beispiel die geschichtete Stichprobe oder die Klumpenstichprobe etabliert. Oft wird auch – vor allem in der Marktforschung – mit Quotenstichproben gearbeitet, um gezielt die Repräsentativität zu gewährleisten. Dabei werden bestimmte Eigenschaften der Stichprobe vorgegeben, z.B. die Verteilung der Altersklassen und des Geschlechts, und dann die Objekte gezielt aus der Grundgesamtheit nach diesen Quoten ausgewählt.

Neben der Auswahl der geeigneten Ziehungsmethode können Sie dann, wenn die Daten vorliegen, anhand von wichtigen Parametern und mit statistischen Methoden beschreiben, inwieweit Ihre Stichprobe die Grundgesamtheit repräsentiert. Dazu ist es notwendig, dass Ihnen in diesen Parametern Informationen zur Grundgesamtheit vorliegen. Wenn Personen Ihre Untersuchungseinheiten sind kann das zum Beispiel die Altersverteilung, die Geschlechterverteilung und der sozioökonomische Status sein. Als statistische Methoden verwenden Sie hier deskriptive Methoden (z.B. Häufigkeiten, Mittelwert und Standardabweichung) und stellen so Grundgesamtheit und Stichprobe gegenüber und sehen hier idealerweise keine deutlichen Unterschiede. Signifikanztests – also schließende Methoden – sind hier nicht angebracht.

Stichprobengröße und Fallzahlplanung

Wenn Sie sich über Ihre Stichprobe Gedanken machen, kommt oft auch die Frage auf, wie groß die Stichprobe sein soll. Diese wichtige Frage klären Sie im Idealfall bereits vor Ihrer Datenerhebung, damit Sie nicht unnötig zu viele Daten erheben und damit Zeit und Geld verschwenden. Genauso vermeiden Sie damit, zu wenige Daten zu erheben und dann anhand Ihrer Daten Ihr gewünschtes Ergebnis nicht nachweisen zu können.

Manchmal macht es auch Sinn, sich erst nach der Datenanalyse noch einmal Gedanken zur benötigten Fallzahl zu machen. Insbesondere dann, wenn Ihre Analyse zu wenig Power (Teststärke) aufwies und Sie zeigen möchten, wie groß die Stichprobe hätte sein müssen, um den beobachteten Effekt als signifikant nachzuweisen.

In beiden Fällen führen Sie eine Fallzahlplanung durch. Hier berechnen Sie basierend auf der erwarteten oder beobachteten Effektstärke (und weiterer Parameter wie Signifikanzniveau und Teststärke) die benötigte Fallzahl. Umgekehrt können Sie auch von einer für Sie realistischen Fallzahl ausgehen – z.B. wenn Sie aus Zeit- und Kostengründen nur 20 Fälle realisieren können – und berechnen, welchen Effekt (klein, mittel, groß) Sie mit dieser Fallzahl als signifikant nachweisen können.

Wichtig ist, dass Sie hier immer Annahmen treffen (entweder die realisierbare Fallzahl, oder der erwartete Effekt) und auch bereits von einer bestimmten statistischen Methode (Signifikanztest) ausgehen. Ob genau diese Situation dann am Ende eintreffen wird, ob Sie einen anderen Effekt beobachten werden oder Ihre Analysen doch mit anderen Signifikanztests untersuchen werden, wissen Sie vorab nicht. Die Fallzahlplanung ist also immer nur eine Annäherung und eine Abschätzung.

Ein Tool (gratis) das sich gut für Fallzahlplanungen eignet ist G*Power. Wenn Sie mehr über die Grundlagen der statistischen Datenanalyse lernen möchten, so holen Sie sich mein gratis E-Book. Sie bekommen zusätzlich zum E-Book weiteren wertvollen Statistik-Input in Form von Videos und E-Mails, mit denen ich Ihnen die Grundlagen der Statistik verständlich näherbringen werde.

Hier kommen Sie zum gratis E-Book.

Daniela Keller

Zur Autorin

Daniela Keller berät als Statistik-Expertin Doktoranden, Forschungsgruppen, Studenten und Unternehmen zu allen Statistikthemen zu allen Statistikthemen – von der Planung der Studie über die Auswertung mit geeigneter Software bis zur Darstellung und Präsentation der Ergebnisse. Zudem gibt sie Online-Statistikworkshops und betreibt ein Blog zum Thema.
Es ist ihr wichtig, ihre Kunden unkompliziert und bedarfsgerecht zu beraten und somit zum Gelingen des Projekts beizutragen. Dabei fällt es ihr leicht, komplizierte Zusammenhänge mit einfachen Worten klar und verständlich zu formulieren, so dass die Statistik trotz komplexer Themen nachvollziehbar wird.

  • 11/02/2019

Leave a Reply 0 comments