
- Stichprobenverteilung der Mittelwerte - Alfred Dandyk
In der Statistik geht es oft darum, einen Zusammenhang zwischen einer Stichprobenverteilung und deren Grundgesamtheit herzustellen. Die dazugehörigen Problemstellungen sind vielfältig. Manchmal kennt man die Grundgesamtheit und möchte auf eine Stichprobenverteilung schließen, dann wieder geht man von einer bekannten Stichprobenverteilung aus und möchte etwas über die unbekannte Grundgesamtheit erfahren. Es ist jedoch immer wichtig, genaue Vorstellungen darüber zu haben, was eine Stichprobenverteilung einer Grundgesamtheit eigentlich ist. In diesem Artikel soll an einem theoretischen Beispiel - das zugegebenermaßen keine besondere praktische Relevanz hat - der Begriff der Stichprobenverteilung des Mittelwertes erläutert werden. Excel 2007 dient der Veranschaulichung der Sachverhalte. Die entsprechenden Tabellen und Diagramme finden Sie unter dem Link Stichprobenverteilung. Diese Dokumente sind schreibgeschützt und können nicht bearbeitet werden. Es ist aber möglich, bearbeitbare Kopien in Excel 2007 herzustellen.
Das Werfen eines Würfels entspricht einer unendlichen Grundgesamtheit
Es soll hier eine Grundgesamtheit betrachtet werden, deren Eigenschaften genau bekannt sind. Anschließend soll sie mit einer ihrer Stichprobenverteilungen verglichen werden. Gegeben ist also ein Würfel mit sechs Seiten, auf denen die Ziffern {1,2,3,4,5,6} zu sehen sind. Der Würfel wird geworfen, das Ergebnis des Wurfes ist dann eine der sechs Ziffern. Die Wahrscheinlichkeiten aller möglichen Ergebnisse sind gleich groß, nämlich 1/6 oder ungefähr 0,17. Da die Anzahl der möglichen Würfe unbegrenzt ist, handelt es sich um eine unendliche Grundgesamtheit. Der Mittelwert der Grundgesamtheit ist 3,5 und die Standardabweichung etwa 1,71. Die Sachverhalte können Sie unter dem Link Stichprobenverteilung in Tabelle1 noch einmal einsehen. Dort ist auch ein Diagramm abgebildet, an Hand dessen ebenfalls zu erkennen ist, dass es sich bei dieser Grundgesamtheit um eine Gleichverteilung der möglichen Ergebnisse handelt.
Wie man mit Excel 2007 Mittelwert und Standardabweichung bestimmt
Den Mittelwert des Datensatzes, der im Bereich A2:A7 steht, können Sie leicht bestimmen, indem Sie in eine Zelle folgenden Befehl eintragen: " =Mittelwert(A2:A7)" und dann in der Bearbeitungsleiste das Häkchen anklicken. Die Bereichsangabe muss natürlich jeweils angepasst werden. Die Standardabweichung desselben Datensatzes erhalten Sie folgendermaßen: "=STABWN(A2:A7)". Wie werden diese Größen berechnet? Zum Mittelwert: Nehmen Sie jedes einzelne Ergebnis und multiplizieren Sie dieses mit seiner Wahrscheinlichkeit. Summieren Sie anschließend alle Produkte. Das Ergebnis ist der Mittelwert. Zur Standardabweichung: Nehmen Sie jedes einzelne Ergebnis und bilden Sie die jeweilige Differenz zum Mittelwert. Diese Differenz wird jeweils quadriert und das Quadrat mit der Wahrscheinlichkeit des Ergebnisses multipliziert. Summieren Sie wieder alle Produkte. Anschließend wird die Wurzel gezogen. Das Ergebnis ist die Standardabweichung.
Die Stichprobenverteilung ist die Verteilung der Mittelwerte der Stichprobenergebnisse
Aus der obigen Grundgesamtheit soll nun eine Stichprobe vom Umfang 2 gezogen werden. Das heißt der Würfel wird zwei Mal nacheinander geworfen. Ein mögliches Ergebnis wäre {1,2}, das heißt der erste Wurf hat das Ergebnis 1 und der zweite Wurf das Ergebnis 2. Unter dem Link Stichprobenverteilung in Tabelle2 finden Sie alle möglichen Ergebnisse für diese Stichprobe angegeben. Offensichtlich hat jedes mögliche Stichprobenergebnis einen bestimmten Mittelwert. Das Ergebnis {1,2} zum Beispiel hat den Mittelwert 1,5 und das Ergebnis {5,2} hat den Mittelwert 3,5. Sie finden in Tabelle2 alle möglichen Mittelwerte mit den dazugehörigen Ergebnissen und Wahrscheinlichkeiten dargestellt. Darüber hinaus ist eine geordnete Liste der Mittelwerte mit Berücksichtigung der Häufigkeiten unter der Überschrift "Liste der Mittelwerte" dargestellt.
Man kann nun diese Mittelwerte als Realisierungen einer Zufallsvariablen betrachten, nämlich der Zufallsvariablen der Mittelwerte der Stichprobenergebnisse. Das bedeutet, dass man den Mittelwert dieser Mittelwerte bilden kann. Sie können diesen mit Excel 2007 bestimmen, indem Sie sich auf die "Liste der Mittelwerte" beziehen. Das Ergebnis finden Sie in Tabelle2. Man erkennt, dass der Mittelwert der Mittelwerte gleich der Zahl 3,5 ist. Mit anderen Worten: Der Mittelwert der Stichprobenverteilung ist gleich dem Mittelwert der Grundgesamtheit. Dieses Ergebnis gilt nicht nur für diesen Fall, sondern ist unter sehr allgemeinen Bedingungen immer richtig.
Die Mittelwerte einer Stichprobenverteilung sind in guter Näherung normalverteilt
Ein relativ überraschendes Ergebnis erkennt man sofort, wenn man sich das Diagramm der Stichprobenverteilung anschaut. In diesem sind die möglichen Stichprobenmittelwerte gegen ihre jeweilige Wahrscheinlichkeit aufgetragen. Während die Grundgesamtheit einer Gleichverteilung der Ergebnisse entsprach, ist das bei der Stichprobenverteilung der Mittelwerte nicht der Fall. Sie ähnelt vielmehr einer Dreiecksverteilung und erinnert entfernt an eine Normalverteilung. Und damit ist man bei dem fundamentalen Ergebnis der Stichprobentheorie: Unter ziemlich allgemeinen Bedingungen ähnelt die Stichprobenverteilung der Mittelwerte der Normalverteilung. Je größer der Stichprobenumfang ist, desto größer ist die Ähnlichkeit. Wenn der Stichprobenumfang gegen Unendlich strebt, dann geht die Stichprobenverteilung in die Normalverteilung über. Das alles gilt unter ziemlich allgemeinen Bedingungen unabhängig von der Art der Verteilung der Grundgesamtheit. In diesem mathematisch beweisbaren Satz liegt die große Bedeutung der Normalverteilung für die Statistik. Eine Faustregel für die Praxis lautet, dass ab einem Stichprobenumfang von n=30 davon ausgegangen werden kann, dass die Mittelwerte der Stichproben in guter Näherung normalverteilt sind.
Der Standardfehler wird mit zunehmendem Stichprobenumfang kleiner
Sie können mit Excel 2007 auch die Standardabweichung der Stichprobenmittelwerte bestimmen, indem Sie sich zum Beispiel auf die geordnete Liste der Mittelwerte beziehen. Das Ergebnis lautet hier etwa 1,21. Ein Vergleich mit der Grundgesamtheit ergibt, dass die Standardabweichung der Stichprobenverteilung kleiner ist als diejenige der Grundgesamtheit. Das Gesetz dafür lautet: Die Standardabweichung der Stichprobenverteilung ist gleich derjenigen der Grundgesamtheit geteilt durch die Wurzel des Stichprobenumfanges. Die Standardabweichung der Stichprobenverteilung wird auch "Standardfehler" genannt. Der Standardfehler ist also umso geringer, je größer der Stichprobenumfang ist. Das ist ebenfalls ein wichtiges Ergebnis der Stichprobentheorie. In einem separaten Artikel sollen praktische Konsequenzen dieser Ergebnisse erläutert werden.
Quellen: Monka, Schöneck, Voss: Statistik am PC, Hanser 2008
