Statistik mit Excel - Die Poisson-Verteilung

Seltenes Ereignis - Richard von Lenzano/pixelio.de
Seltenes Ereignis - Richard von Lenzano/pixelio.de
In manchen Fällen ist die Poissonverteilung gegenüber der Binomialverteilung vorteilhaft. Excel 2007 bietet die Funktion "POISSON" an.

Es ist das Ziel der Wissenschaften, hinter der Vielfalt der Erscheinungen Gesetzmäßigkeiten zu entdecken. Manchmal gibt es überraschende Erfolge, das heißt man findet auch dort Regelmäßigkeiten, wo man auf den ersten Blick keine vermutet hätte. So untersuchte der polnisch-russische Statistiker L.v. Bortkiewicz die Daten über die Anzahl der Soldaten, die in 10 preußischen Kavallerieregimentern während eines Zeitraumes von 20 Jahren durch Pferdehufschlag zu Tode gekommen sind. Unter dem Link Poissonverteilung finden Sie die entsprechenden Daten. Sie können die Spalte A und die Spalte B kopieren und in einer neuen Tabelle darstellen. Mit dieser neuen Tabelle können Sie dann weiter arbeiten.

Wie Sie sehen, wurden die Daten für 10 Regimenter in 20 Jahren auf 200 Jahre umgerechnet. In 109 von diesen 200 Jahren wurden 0 Todesfälle gezählt, in 65 von 200 Jahren 1 Todesfall und so weiter. Bortkiewicz konnte zeigen, dass diese Daten einer theoretischen Wahrscheinlichkeitsverteilung folgen, welche unter dem Namen "Poisson-Verteilung" bekannt ist.

Excel 2007 bietet die Funktion "POISSON" an

Mit Excel 2007 können Sie die Poissonverteilung leicht darstellen. Dazu muss man wissen, dass die Poissonverteilung den Wert eines Parameters verlangt, und zwar den Mittelwert. Man kann aus den angegebenen Daten den Mittelwert berechnen. Er ergibt sich zu 0,61. Schreiben Sie nun in C2 den folgenden Befehl: "=POISSON(A2; 0,61; Falsch)" und klicken Sie auf das Häkchen in der Bearbeitungsleiste. In C2 müsste nun die Wahrscheinlichkeit dafür auftauchen, dass bei einem Mittelwert von 0,61 keine Todesfälle auftreten. Gehen Sie nun in die rechte untere Ecke der Zelle, bis sich der Cursor in ein Kreuz verwandelt und ziehen Sie dann die gedrückte Maus nach unten. In der Spalte C müssten nun die entsprechenden Wahrscheinlichkeiten für die anderen Anzahlen der Todesfälle erscheinen. Für den Vergleich mit den empirischen Daten werden diese Wahrscheinlichkeiten nun mit der Gesamtzahl der Versuche, hier 200, multipliziert. Schreiben Sie dazu in D2: " =C2*200" und ziehen Sie die gedrückte Maus wie beschrieben nach unten. Ein Vergleich der theoretischen mit den empirischen Werten zeigt eine sehr gute Übereinstimmung.

Das Bernoulli-Experiment ist theoretische Grundlage der Poissonverteilung

Es wäre schön, wenn man die obige Übereinstimmung zwischen Theorie und Erfahrung verstehen könnte. Eine Möglichkeit, sich der Lösung dieses Problems zu nähern, besteht darin, das Ereignis "Todesfall durch Pferdehufschlag" als Bernoulli-Experiment zu interpretieren. Der Todesfall wäre dann der Erfolg. Das ist gewiss eine makabere Definition, aber man weiß ja, was gemeint ist. Die Anzahl der Erfolge pro Zeiteinheit müsste dann einer Binomialverteilung folgen. Die Mathematiker können nun zeigen, dass für den Fall, dass die Anzahl n der Versuche immer größer wird und die Erfolgswahrscheinlichkeit p immer kleiner, und zwar so, dass das Produkt n*p=Mittelwert konstant bleibt, dass dann die Binomialverteilung durch die Poissonverteilung approximiert wird. Im obigen Beispiel ist n = 200 und p ungefähr gleich 0,00305. Mit anderen Worten: n ist so groß und p ist so klein, dass die Poissonverteilung in guter Näherung die empirischen Daten wiedergibt. Es gibt eine Faustregel, die sagt, ab wann die Anwendung der Poissonverteilung sinnvoll ist. Die Anzahl der Versuche sollte größer als 50 sein, die Erfolgswahrscheinlichkeit kleiner als 0,1 und der Mittelwert sollte kleiner als 5 sein. Man spricht dann auch von "seltenen Ereignissen".

Die Poissonverteilung ist unter Umständen günstiger als die Bionomialverteilung

Der Verdacht liegt nahe, dass die Einführung der Poissonverteilung überflüssig ist. Denn da sie eine Annäherung an die Binomialverteilung ist, könnte die bekannte und theoretisch gut beherrschbare Binomialverteilung gleich benutzt werden. Warum also auf die Poissonverteilung ausweichen? Die Antwort lautet, dass die Berechnungen mit der Poissonverteilung oft einfacher durchzuführen sind. Der Rechenaufwand ist geringer, was ein großer Vorteil ist. Darüber hinaus gibt es Probleme, die sich nicht mit der Binomialverteilung, aber sehr wohl mit der Poissonverteilung lösen lassen.

Manchmal lässt sich die Binomialverteilung nicht anwenden

Der Grund dafür liegt darin, dass die Binomialverteilung zwei Parameter als Eingabe verlangt, nämlich die Anzahl der Versuche und die Erfolgswahrscheinlichkeit, während die Poissonverteilung nur einen Parameter erwartet, nämlich den Mittelwert. In den Fällen, in denen zwar der Mittelwert bekannt ist, aber die Anzahl der Versuche und die Erfolgswahrscheinlichkeit unbekannt sind, muss die Poissonverteilung angewandt werden. Beispiel: Man beobachtet Gewitter und zählt die Anzahl der Blitze pro Zeiteinheit, zum Beispiel pro 10 Minuten. Für den Fall, dass man diese Ereignisse als Bernoulli-Experimente interpretieren kann, bedeutet Erfolg hier "Blitz", Nicht-Erfolg "Kein Blitz". Hier kennt man zwar den Mittelwert für die Anzahl der Erfolge, aber nicht die Anzahl der Versuche und auch nicht die Erfolgswahrscheinlichkeit. Dennoch lassen sich theoretische Fragen beantworten. Angenommen, es werden 5 Blitze durchschnittlich pro Zeiteinheit registriert. Die Frage:"Wie groß ist die Wahrscheinlichkeit, bei einem Gewitter 1 Blitz pro Zeiteinheit zu registrieren?", lässt sich dann mit Hilfe der Poissonverteilung mit dem Mittelwert 5 beantworten.

Quellen:

  • Erwin Kreyszig: Statistische Methoden und ihre Anwendungen, Vandenhoeck und Ruprecht 1968
  • Monka, Schöneck, Voss: Statistik am PC, Hanser 2008