
- Test eines Würfels - Clam/pixelio.de
Gezinkte Karten und manipulierte Würfel machen aus einem Glücksspiel einen gemeinen Betrug. Wenn es um viel Geld geht, sollte man vorher sicherstellen, dass die Geräte in Ordnung sind. Wie stellt man aber fest, dass ein Würfel nicht gefälscht wurde? Das Kennzeichen des korrekten Würfels ist die Gleichberechtigung aller sechs Seiten. Mit anderen Worten: Die sechs möglichen Ergebnisse müssen alle dieselbe Wahrscheinlichkeit haben, geworfen zu werden. Man sagt auch, die Ereignisse {1,2,3,4,5,6} müssen gleichverteilt sein. Um diese Gleichverteilung zu testen, müsste der Würfel sehr oft geworfen werden, zum Beispiel 60.000 Mal. Wenn jedes Ereignis ziemlich genau 10.000 Mal auftritt, dann kann man sicher sein, dass der Würfel korrekt ist. Aber wer hat schon Lust, einen Würfel 60.000 Mal zu werfen? Belässt man es bei 60 Würfen, wird die Arbeit zwar geringer, aber gleichzeitig steigt das Risiko, bei der Beurteilung des Würfels einen Fehler zu machen. Gesucht ist also eine Risikoabschätzung. Der Chi-Quadrat-Anpassungstest ist eine solche.
Der Unterschied zwischen Beobachtung und Theorie kann signifikant oder zufällig sein
Der Würfel wird also 60 Mal geworfen. Ein mögliches Resultat finden Sie als Tabelle und Diagramm unter dem Link Chi-Quadrat in Tabelle1. Dieses Dokument ist schreibgeschützt und kann daher nicht bearbeitet werden. Sie können aber eine bearbeitbare Kopie herstellen. Wie man sieht, stimmen die beobachteten Werte mit den theoretischen Werten einer Gleichverteilung nicht überein. Die Frage ist nun, ob diese Differenz zwischen der empirischen Häufigkeitsverteilung und der theoretischen Gleichverteilung zufällig oder signifikant ist. Wenn die Differenz signifikant ist, dann beruht sie auf einer Fehlerhaftigkeit des Würfels. Das Diagramm spricht eher für eine Zufälligkeit, aber dieser intuitive Eindruck muss natürlich präzisiert werden. Man benötigt also ein quantitatives Entscheidungskriterium für die Signifikanz oder Zufälligkeit der Abweichungen der Daten.
Beim Chi-Quadrat-Test wird zuerst eine Prüfgröße gebildet
Die Prüfgröße "Chi-Quadrat-Wert" entsteht folgendermaßen: Man bildet für jede mögliche Augenzahl die Differenz aus der beobachteten und der theoretischen Häufigkeit und quadriert jede einzelne dieser Differenzen. Dann wird jedes einzelne Quadrat durch den Erwartungswert dividiert und daraus die Summe gebildet. Das Ergebnis ist hier u = 2,8. Sie können die Genese dieses u-Wertes auch in der Tabelle verfolgen. Die Mathematiker können nun beweisen, dass unter bestimmten Bedingungen dieser u-Wert näherungsweise einer theoretischen Wahrscheinlichkeitsverteilung namens "Chi-Quadrat-Verteilung" folgt. Wenn die Abweichung also zufällig ist, dann sollte die Wahrscheinlichkeit für den u-Wert in etwa der Chi-Quadrat-Verteilung entsprechen. Mit anderen Worten: Für den Fall der Zufälligkeit kann die Chi-Quadrat-Verteilung zugrunde gelegt werden und die Basis der Argumentation bilden.
Grundlage des Anpassungstestes ist die Nullhypothese und das Signifikanzniveau
Die Nullhypothese lautet: Der Würfel ist korrekt und die Ergebnisse sind gleichverteilt. Das Signifikanzniveau sei hier 10%. Mit anderen Worten: Die Nullhypothese wird abgelehnt, wenn die Wahrscheinlichkeit dafür, dass die Abweichung zufällig ist, kleiner oder gleich 10% ist. Andernfalls wird die Hypothese angenommen. In der Argumentation geht man also von der Hypothese aus, dass der Würfel in Ordnung ist. Daraus folgt, dass die Ergebnisse gleichverteilt sind und die Abweichung zufällig ist. Konsequenterweise folgt der u-Wert der Chi-Quadrat-Verteilung und seine Wahrscheinlichkeit kann theoretisch berechnet werden.
Excel 2007 bietet die Funktion "CHIVERT" an
Zur Berechnung der Wahrscheinlichkeit des u-Wertes bietet Excel 2007 die Funktion "CHIVERT" an. Diese Funktion verlangt die Eingabe des u-Wertes und den Wert eines Parameters namens "Freiheitsgrad". In diesem Fall ist der Freiheitsgrad gleich der Anzahl der Summanden der Prüfgröße minus 1. Die Anzahl der Summanden der Prüfgröße ist gleich 6.Weiterhin gilt: 6-1=5. Demnach hat der Freiheitsgrad hier den Wert 5. Markieren Sie nun eine freie Zelle in dem Tabellenblatt. Klicken Sie dann auf "Formeln/Funktion einfügen/Statistik/CHIVERT". In dem nun geöffneten Fenster tragen Sie Folgendes ein: "Bei X: 2,8; Bei Freiheitsgrade: 5". Bestätigen Sie mit OK. In der markierten Zelle taucht nun die Wahrscheinlichkeit für den u-Wert auf. Sie beträgt etwa 0,73, also etwa 73%.
Die genaue Interpretation dieses Ergebnisses ist wichtig
Was besagt dieses von Excel 2007 gelieferte Ergebnis? Die Wahrscheinlichkeit dafür, dass der u-Wert größer oder gleich 2,8 ist, beträgt etwa 73%. Selbstverständlich gilt dieses Ergebnis nur unter der Voraussetzung, dass die Nullhypothese richtig ist. Unter dieser Voraussetzung ist also die Wahrscheinlichkeit, dass das Ergebnis "u = 2,8 oder größer" auf Zufall beruht, etwa 73%. Das Signifikanzniveau liegt bei 10%. Die Nullhypothese wird demnach abgelehnt, wenn die Wahrscheinlichkeit für den u-Wert kleiner oder gleich 10% ist. Andernfalls wird sie angenommen. Diese Wahrscheinlichkeit beträgt aber 73%, also wird die Hypothese angenommen. Der Würfel ist in Ordnung. Es ist jedoch zu bedenken, dass die Annahme der Nullhypothese ein Irrtum sein kann. Es gibt also durchaus eine Wahrscheinlichkeit dafür, dass die Hypothese angenommen wird, obwohl sie tatsächlich falsch ist. Einen solchen Fehler nennt man "Fehler 2. Art". Er müsste separat berechnet werden.
Interpretation des Verlaufs der Funktion "CHIVERT"
Unter dem Link Chi-Quadrat in Tabelle2 finden Sie eine Tabelle mit den u-Werten von 0 bis 15 und die dazugehörigen Wahrscheinlichkeiten gemäß der von Excel 2007 angebotenen Funktion "CHIVERT". Das dazugehörige Diagramm ist ebenfalls in Tabelle 2 abgebildet. Man erkennt, dass für u=0 die Wahrscheinlichkeit 1 gilt. Wie ist dieses Ergebnis zu deuten? Der Wert der Funktion ist die Wahrscheinlichkeit dafür, dass der u-Wert größer oder gleich 0 ist. Diese Wahrscheinlichkeit ist selbstverständlich gleich 1, denn der u-Wert ist eine Summe aus quadrierten Größen. Alle Summanden sind also positiv oder Null, so dass die Summe in jedem Fall größer oder gleich Null ist. Demgegenüber ist der Wert für u=15 etwa 0,01, also etwa 1%. Mit anderen Worten: Die Wahrscheinlichkeit dafür, dass der u-Wert größer oder gleich 15 ist, beträgt etwa 1%.
Quelle: Monka, Schöneck: Voss, Statistik am PC, Hanser 2008
