Statistik mit Excel - Die Normalverteilung

Standard-Normalverteilung N(0,1) - Alfred Dandyk
Standard-Normalverteilung N(0,1) - Alfred Dandyk
Die Normalverteilung ist als mathematische Funktion von hervorragender Bedeutung für die angewandte Statistik. Excel 2007 bietet starke Tools.

Die Normalverteilung ist eine der bedeutendsten mathematischen Funktionen überhaupt. Ihre Wichtigkeit ist daran zu erkennen, dass sie auf dem alten Zehnmark-Schein zusammen mit einem ihrer Entdecker abgebildet war. Carl Friedrich Gauß ist der Name dieses Entdeckers. Deswegen wird die Normalverteilung auch Gauß-Verteilung genannt. "Glockenkurve" ist ebenfalls eine oft gebrauchte Bezeichnung. Wie Sie an Hand der Abbildung sehen können, ist der Graph der Funktion tatsächlich einer Glocke ähnlich. Die Glockenkurve ist zunächst nur eine mathematische Funktion, die als solche betrachtet und analysiert werden kann. Ihre große praktische Bedeutung erhält sie durch ihre herausragende Stellung als Wahrscheinlichkeitsverteilung in der Statistik. In diesem Artikel soll die Glockenkurve zunächst als mathematisches Objekt betrachtet und anschließend als theoretisches Instrument der Statistik vorgestellt werden. Die praktische Anwendung dieser Funktion im Rahmen von Excel 2007 wird ebenfalls erörtert.

Die Glockenkurve als mathematisches Objekt

Es gibt nicht die eine Normalverteilung, sondern unendlich viele. Genauer gesagt sind die Glockenkurven durch zwei Parameter gekennzeichnet, den Mittelwert und die Standardabweichung. Die Bedeutung dieser Parameter ist gut an der Abbildung der Glockenkurve zu erkennen. Der Mittelwert entspricht dem X-Wert des höchsten Punktes und die Standardabweichung dem jeweiligen Abstand der beiden roten seitlichen Punkte von der y-Achse, den sogenannten Wendepunkten dieser Kurve. Bei diesen Punkten ändert die Kurve ihre Krümmungsverhalten. Der Mittelwert gibt also die Lage des höchsten Punktes an und die Standardabweichung ist ein Maß für die Steilheit und die Breite der Kurve.

Die Standardnormalverteilung ist ein Stellvertreter für alle Normalverteilungen

Der Ausdruck N(100,15) symbolisiert zum Beispiel die Normalverteilung mit dem Mittelwert 100 und der Standardabweichung 15. Es ist allerdings möglich, eine sogenannte Standardnormalverteilung zu definieren, deren Mittelwert 0 und deren Standardabweichung 1 ist, also: N(0,1). Wenn man die mathematischen Eigenschaften von N(0,1) analysiert hat, dann kennt man im Grunde genommen auch die mathematischen Eigenschaften aller anderen Normalverteilungen, denn diese lassen sich auf relative einfache Weise aus den Eigenschaften von N(0,1) logisch erschließen. In diesem Artikel ist also in der Regel N(0,1) gemeint, wenn von Normalverteilung die Rede ist. Unter dem folgenden Link können Sie die Parameter der Normalverteilung manipulieren und dabei das Verhalten der Normalverteilung beobachten. Klicken Sie dazu hier. Allerdings ist dieses Programm nur auf der Basis eines Mathematica-CDF-Players ausführbar. Diesen können Sie im Internet kostenfrei herunterladen.

Mit Excel lässt sich die Fläche unter der Glockenkurve leicht berechnen

Die Glockenkurve ist so definiert, dass die Fläche zwischen dieser Kurve und der X-Achse immer den Wert 1 hat. In der Abbildung ist in dem Bereich von -1 bis +1 die Fläche unter der Glockenkurve farblich hervorgehoben. Dieser Bereich entspricht dem Intervall "Mittelwert minus Standardabweichung bis Mittelwert plus Standardabweichung". Die Mathematiker sind in der Lage, diese Fläche zu berechnen. Das Ergebnis lautet, dass die schattierte Fläche etwa 68% der Gesamtfläche unter der Kurve ausmacht. Es soll nun demonstriert werden, wie man mit Excel dieses Ergebnis berechnen kann.

Verfahren für die Berechnung der Fläche mit Excel

Zuerst bestimmt man die Fläche vom "linken Rand" der Kurve bis zum X-Wert 1. Dabei ist zu bemerken, dass der "linke Rand" der Kurve bei Minus Unendlich liegt. Markieren Sie dazu zuerst in Excel 2007 die Zelle A1 und klicken Sie anschließend folgende Registerkarten an: "Formeln/Funktion einfügen/Statistik/NORMVERT". In dem nun geöffneten Fenster tragen Sie ein: "Bei X: 1; bei Mittelwert: 0; bei Standabwn: 1; bei Kumuliert: wahr". Bestätigen Sie mit OK. In der Zelle A1 taucht nun der Wert für die gesuchte Fläche auf. Markieren Sie nun die Zelle A2 und wiederholen Sie den Vorgang mit dem einzigen Unterschied, dass für X der Wert -1 eingetragen wird. In A2 wird auch diese Fläche angegeben. Am Ende schreiben Sie in A3 die folgende Formel: "=A1-A2". Das Ergebnis lautet etwa 0,68. Mit anderen Worten 68%. Sie haben mit Hilfe von Excel das Maß für die schattierte Fläche berechnet.

Statistische Häufigkeiten entsprechen manchmal - aber nicht immer - einer Normalverteilung

Was hat das alles mit Statistik zu tun? Die Erfahrung zeigt, dass bei statistischen Stichproben sowohl in den Naturwissenschaften als auch in den Sozialwissenschaften die empirisch festgestellte Häufigkeit oft einer theoretischen Normalverteilung mehr oder weniger gut entspricht. Es gibt also immer wieder Fälle, bei denen man in guter Näherung annehmen kann, dass die entsprechenden Merkmale "normalverteilt" sind. Es muss allerdings hinzugefügt werden, dass die Normalverteilung in den Naturwissenschaften deutlich häufiger vorkommt als in den Sozialwissenschaften. Experten warnen auch immer wieder davor, die Normalverteilung in der Statistik ohne hinreichende Begründung zu benutzen.

Der Intelligenzquotient als normalverteiltes Merkmal der Menschen

Ein berühmtes Beispiel für ein normalverteiltes Merkmal ist der Intelligenzquotient der Menschen. Dieser wird in standardisierten Testverfahren von Psychologen ermittelt und es zeigt sich - so sagen jedenfalls die Psychologen -, dass die ermittelte Häufigkeitsverteilung der Normalverteilung N(100,15) in guter Näherung entspricht, wenn die Anzahl der untersuchten Testpersonen nur groß genug ist. Das heißt der Mittelwert aller Intelligenzquotienten liegt bei 100 und die Standardabweichung beträgt 15. Wenn man nun davon ausgeht, dass diese Zuordnung korrekt ist, dann lassen sich mittels der theoretischen Kenntnisse über die Normalverteilung Aussagen über die Grundgesamtheit der Stichprobe machen. Zum Beispiel folgende Aussage: Etwa 68% aller Menschen haben einen Intelligenzquotienten zwischen 85 und 115, weil das gerade der Bereich "Mittelwert minus Standardabweichung bis Mittelwert plus Standardabweichung" ist.

Die Normalverteilung als Beispiel für die rätselhafte Effektivität der Mathematik

Solange man im theoretischen Bereich der Strukturwissenschaft Mathematik bleibt, bereitet die Glockenkurve keine Kopfschmerzen. Wenn man aber anfängt, darüber nachzudenken, warum die Realität in vielen Fällen so gut mit der Normalverteilung beschrieben werden kann, fängt man doch an zu staunen. Erstaunlich ist zum Beispiel, dass die zufälligen Fehler der Messwerte für die Position eines Planeten ebenso einer Normalverteilung gehorchen wie die Größen der Soldaten eines Jahrgangs. Die Frage lautet: Was verbindet diese Merkmale? Und was haben diese Merkmale mit dem Intelligenzquotienten der Menschen zu tun? Eine Beantwortung dieser Frage verlangt tief gehende Untersuchungen über die Voraussetzungen der Normalverteilung.