
- Umfrage - Konstantin Gastmann/pixelio.de
Angenommen, es steht eine wichtige Wahl bevor und ein Institut erhält den Auftrag, den Ausgang der Wahl zu prognostizieren. Das Institut wird dazu wahrscheinlich eine Wählerbefragung durchführen. Da es nicht alle Wähler befragen will, wird das Institut eine Auswahl treffen, also eine sogenannte Stichprobe vornehmen. Diese soll möglichst repräsentativ sein, das heißt die Struktur der Grundgesamtheit an Wählern möglichst genau widerspiegeln. Das Ziel ist, von dem Ergebnis der Stichprobe begründet auf das Verhalten der Grundgesamtheit zu schließen. Wie kann eine solche repräsentative Stichprobe erstellt werden? Eine Möglichkeit ist die sogenannte "einfache Zufallsstichprobe".
Die einfache Zufallsstichprobe wird mit Hilfe der Wahrscheinlichkeitstheorie definiert
Eine Stichprobe vom Umfang n ist eine "einfache Zufallsstichprobe", wenn jede mögliche Stichprobe dieses Umfanges die gleiche Realisierungschance besitzt. Man macht sich den Sachverhalt am besten an einem Urnenmodell klar. In einer Urne befinden sich 100 Kugeln. Jede Kugel trägt eine Nummer von 1 bis 100. Die Kugeln werden gut durchmischt und dann werden zehn Kugeln nacheinander gezogen, und zwar ohne Zurücklegen. Wir haben also eine Stichprobe vom Umfang 10 aus einer Grundgesamtheit vom Umfang 100. Es ist nun so, dass jede mögliche Zehnerkombination von Kugeln dieselbe Wahrscheinlichkeit besitzt, tatsächlich gezogen zu werden. Diese Stichprobe ist also eine einfache Zufallsstichprobe.
Die einfache Zufallsstichprobe kann mit Hilfe von Pseudozufallszahlen realisiert werden
Die praktische Durchführung einer einfachen Zufallsstichprobe ist das eigentliche Problem. Zum Beispiel wird es in den meisten Fällen kaum machbar sein, ein entsprechendes Urnenmodell aufzubauen und die Ziehung der Kugeln wirklich durchzuführen. Eine andere Möglichkeit besteht darin, mit Hilfe des Computers Pseudozufallszahlen zu generieren und diese für die Erstellung einer einfachen Zufallsstichprobe zu benutzen. Excel 2007 stellt ein entsprechendes Programm zur Verfügung. Es soll nun gezeigt werden, wie man mit Excel 2007 mittels der Generierung von Pseudozufallszahlen eine einfache Zufallsstichprobe erstellen kann.
Mit Excel 2007 lassen sich Pseudozufallszahlen schnell realisieren
Die Aufgabe besteht darin, aus einer Grundgesamtheit vom Umfang 100 eine einfache Zufallsstichprobe vom Umfang 10 zu erstellen. Zu diesem Zweck werden mit Excel 2007 zuerst 10 Pseudozufallszahlen generiert. Unter dem Link Zufallszahlen finden Sie eine entsprechende Tabelle. Schreiben Sie zur Erstellung derselben in Zelle A1 die Zahl "1" und in Zelle A2 die Zahl "2". Markieren Sie den Bereich A1:A2. Gehen Sie mit der Maus in die rechte untere Ecke des Bereiches, bis sich der Cursor in ein Kreuz verwandelt. Ziehen Sie die gedrückte Maus nach unten bis Zelle A10. Nun markieren Sie die Zelle B1 und klicken auf Folgendes: "Formeln/Funktion einfügen/MATH.&TRIGONOM./Zufallszahl". In B1 müsste nun die erste Zufallszahl auftauchen. Ziehen Sie die gedrückte Maus wie beschrieben wieder nach unten. Nun müssten alle zehn Zufallszahlen erscheinen. Diese befinden sich alle in einem Wertebereich von 0 bis 1. Um einen Wertebereich von 1 bis 100 zu erreichen, schreiben Sie in C1 folgende Formel: "=Ganzzahl(B1*100+1). Ziehen Sie die Maus wieder nach unten. Sie haben nun 10 Zufallszahlen aus dem Bereich 1 bis 100 mit Excel 2007 erzeugt. Eine besonders einfache Methode, Zufallszahlen außerhalb von Excel zu generieren, finden Sie hier.
Die Missachtung der Repräsentativität kann zu einem Umfrage-Desaster führen
Diese zehn Zufallszahlen können als Äquivalent einer Ziehung von 10 Kugeln aus einer Urne mit 100 Kugeln betrachtet werden, also auch als Äquivalent einer einfachen Zufallsstichprobe. Ein kleines Problem entsteht, wenn zwei Zufallszahlen gleich sein sollten. Für den Fall nehmen Sie einfach die nächst größere Zahl aus der Grundgesamtheit. Es gibt außer der einfachen Zufallsstichprobe noch andere Stichprobenarten, deren Ziel es ist, Repräsentativität herzustellen. Auf jeden Fall ist es wichtig, das Problem der Repräsentativität der Stichprobe hinreichend zu beachten, da andernfalls ein Umfrage-Desaster droht. Das musste im Jahre 1936 die amerikanische Zeitschrift "Literary Digest" schmerzlich erfahren. Es ging um die Wahl des amerikanischen Präsidenten. Kandidaten waren der Demokrat Franklin D. Roosevelt und der Republikaner Alfred Landon. Die Zeitschrift hatte schon Erfahrung mit solchen Umfragen und war bis dahin auch recht erfolgreich damit gewesen. Nun wollte sie es ganz besonders gut machen und startete deswegen eine Wählerumfrage mit einem ziemlich großen Stichprobenumfang. Sie ging dabei von der durchaus richtigen These aus, dass ein größerer Stichprobenumfang die Verlässlichkeit der Umfrage verbessert. Sie hatte allerdings nicht hinreichend beachtet, dass Verzerrungseffekte die Repräsentativität vollkommen zerstören können, woran auch der große Stichprobenumfang nichts ändert.
Selbstselektion und mangelhafte Gewichtung sind wichtige Verzerrungseffekte
Die Zeitschrift sagte einen deutlichen Sieg für Alfred Landon voraus. Tatsächlich gab es aber einen deutlichen Sieg für Franklin D. Roosevelt. Dieser Misserfolg war so gravierend, dass die Zeitschrift ihre Reputation vollkommen verlor und später eingestellt werden musste. Der Fehler lag in der mangelhaften Repräsentativität der Stichprobe. Sie hatte unter anderem eine Telefonbefragung durchgeführt. Zu der Zeit war das Telefon aber noch nicht gleichmäßig in der Bevölkerung verteilt, sondern sehr einseitig bei den Reichen zu finden. Diese bevorzugten eindeutig den Republikaner. Diese Stichprobe aus einem Teil der Bevölkerung hätte also unbedingt hinsichtlich des Wahlverhaltens gewichtet werden müssen. Bei der Anfrage per Post war es den Befragten freigestellt zu antworten oder nicht zu antworten. Mit anderen Worten: Bei dieser Teilgruppe spielte die Motivation eine wichtige Rolle. Motivation ist eine Form der Selbstselektivität, das heißt, die Befragten wählen sich selbst aus. In diesem Fall führte die Selbstselektivität zu einer erneuten Bevorzugung des Republikaners. Insgesamt spiegelte die Stichprobe die Struktur der Grundgesamtheit also nicht hinreichend gut wider. Das Ergebnis war eine vollkommen falsche Vorhersage.
Quellen:
- Monka, Schöneck, Voss: Statistik am PC. Hanser 2008
- Umfrage-Desaster
