
- Statistik - Gerd Altmann/pixelio.de
Die Statistik begegnet einem heutzutage auf Schritt und Tritt. Medien berichten über das Bruttosozialprodukt, die Inflationsrate, die Staatsquote und den Preisindex. Man hört von Zufallsstichproben, Hochrechnungen und Grundgesamtheiten. Psychologen sagen, der Intelligenzquotient der Menschen sei normalverteilt und Experten erläutern, warum ein statistisch signifikanter Unterschied dennoch zufällig sein kann. An den Schulen sind Statistik und Wahrscheinlichkeitsrechnung mittlerweile Teilgebiete des Faches Mathematik, wie die Algebra und die Geometrie. Hochschul-Studenten benötigen Statistik-Kenntnisse und so manche Diplom- oder Doktorarbeit ist mit statistischen Präsentationen und Schlussfolgerungen gespickt. Man kann mit Fug und Recht sagen, dass Grundkenntnisse der Statistik heute zur Allgemeinbildung zählen. Hinsichtlich der Lösung von praktischen Problemen bietet das Office-Programm Excel 2007 eine große Zahl von Funktionen, welche den Arbeits- und Zeitaufwand erheblich reduzieren können. Dieser Artikel soll eine Einleitung in diesen Themenkomplex sein.
Man unterscheidet zwischen beschreibender und schließender Statistik
Zunächst ein paar Worte zu der Frage, welche Zwecke mit der Statistik verfolgt werden. In der beschreibenden Statistik geht es darum, Daten zu erheben und angemessen zu präsentieren. In der schließenden Statistik versucht man, auf der Basis der erhobenen und präsentierten Daten begründete Aussagen über Sachverhalte zu machen, die durch die erhobenen und präsentierten Daten direkt nicht belegt werden können. Ein Beispiel: Man erhebt eine Zufallsstichprobe innerhalb einer Grundgesamtheit. Die Urliste der Stichprobe wird bearbeitet und präsentiert. Zum Beispiel ermittelt man einen Mittelwert für die Werte der Stichprobenliste. Bis hier ist man noch im Bereich der beschreibenden Statistik. Das eigentliche Ziel der Forschung ist aber nicht der Mittelwert der Stichprobe, sondern der Mittelwert der Grundgesamtheit. Ausgehend von den Daten der Stichprobe und mit Hilfe der Wahrscheinlichkeitsrechnung versucht man dann, Schlussfolgerungen hinsichtlich des Mittelwertes der Grundgesamtheit zu ziehen. Die mathematische Statistik hilft dabei, den Grad des Vertrauens in diese Schlussfolgerung begründet abzuschätzen. Damit befindet man sich im Bereich der schließenden Statistik. Selbstverständlich ist das nur ein Beispiel für die Verfahrensweisen der Statistik, deren Methoden und Zielsetzungen sehr vielfältig und teilweise auch sehr komplex sind. Excel bietet sowohl zur beschreibenden Statistik als auch zur schließenden Statistik eine große Zahl von komfortablen Werkzeugen, die in der Reihe "Statistik mit Excel" nach und nach besprochen werden sollen. In diesem Artikel soll nur ein Anfang gemacht werden.
Eingeben und Importieren von Daten in Excel
Hinsichtlich der beschreibenden Statistik ist zuerst einmal notwendig, die Daten in Excel einzugeben. Dazu existieren grundsätzlich zwei Möglichkeiten. Entweder man gibt die Daten direkt in Excel per Hand ein oder man benutzt entsprechende Funktionen, um Daten aus externen Quellen zu importieren. Die zu benutzende Import-Funktion hängt davon ab, um welche externe Quelle es sich handelt. Befinden Sie sich zum Beispiel in Tabelle 2 und möchten aus Tabelle 1 desselben Arbeitsblattes einen Zellenbereich in Tabelle 2 importieren, so können Sie die normale Kopieren-Einfügen-Methode über die Zwischenablage benutzen. Dasselbe gilt für den Fall, dass Sie eine Tabelle aus Word nach Excel transportieren möchten. Für Datenquellen, die nicht zum Office-Programm gehören, bietet Excel über "Daten/Externe Daten abrufen" eine Reihe von Optionen. Wenn Sie zum Beispiel über das Web eine Tabelle importieren möchten, klicken Sie auf "Aus dem Web " und geben bei dem sich öffnenden Fenster in das entsprechende Eingabefeld die Webadresse ein, bei der sich die Tabelle befindet. In dem Fenster wird auch beschrieben, wie Sie die Tabelle markieren und dann in Excel importieren können. Eine gute Adresse zum Üben des Imports aus dem Web in Excel ist die des Statistischen Bundesamtes (Office Excel 2007, Seite 1064).
Präsentieren und Auswerten der Daten in Excel
Nach Erhebung der Daten liegt die Urliste vor. In vielen Fällen ist dieses Datenmaterial unübersichtlich und wenig aussagekräftig. Die Daten müssen also bearbeitet werden. Dazu gehören das Sortieren, Gruppieren und Klassifizieren derselben. Wenn Sie die Daten sortieren möchten, dann bietet Excel folgende Funktion an: "Bearbeiten/Sortieren und Filtern". In dem sich öffnenden Fenster können Sie festlegen, wie die Daten des markierten Bereiches sortiert werden sollen. Eine weitere Bearbeitungsmöglichkeit ist das Bilden von Mittelwerten. Wenn das Datenmaterial zum Beispiel aus den Körpergrößen von 1000 Kindern besteht, dann ist alleine wegen der Masse an Zahlen damit wenig anzufangen. Ein Mittelwert dagegen liefert eine brauchbare Information. Zum Beispiel kann man die Mittelwerte der Körpergrößen von Kindern aus verschiedenen Generationen miteinander vergleichen und eventuell auf den Ernährungszustand der Kinder und somit auf den Wandel der Lebensbedingungen von Generation zu Generation schließen. Allerdings tauchen hier schon theoretische Probleme auf. Denn es gibt verschiedene Arten von Mittelwerten, zum Beispiel das Arithmetische Mittel und das Geometrische Mittel.
Mittelwerte und Streuungsmaße sind wichtige Parameter der Statistik
Man muss also wissen, welche Art des Mittelwertes angemessen ist. Bei der Körpergröße von Kindern ist das Arithmetische Mittel die richtige Wahl. Wenn es aber darum geht, eine jahresdurchschnittliche Wachstumsrate des Bruttosozialproduktes über einen Zeitraum von mehreren Jahren zu bestimmen, dann muss man das Geometrische Mittel wählen. (Statistik am PC, Seite 82) Mit Excel können Sie beide Arten von Mittelwerten bilden: "Formeln/Funktion einfügen/Statistik/MITTELWERT" für das Arithmetische Mittel und "Formeln/Funktion einfügen/Statistik/GEOMITTEL" für das Geometrische Mittel. Nach den Mittelwerten sind die Streuungsmaße wichtige Parameter zur Kennzeichnung der Daten. Es kann ja sein, dass zwei Datenmengen denselben Mittelwert haben, aber bei der einen Datenmenge sind die Werte zum großen Teil weit vom Mittelwert entfernt, während sie bei der anderen Menge zum großen Teil nahe beim Mittelwert liegen. Aus diesem Unterschied können eventuell Schlüsse gezogen werden. Handelt es sich um die Körpergröße von Kindern, dann weist eine große Streuung vielleicht auf große soziale Unterschiede in den Lebensbedingungen dieser Kinder hin. Ein häufig gebrauchtes Streuungsmaß ist die Standardabweichung. Excel liefert diese mittels der folgenden Funktionen: "Formeln/Funktion einfügen/Statistik/STABWN" und "Formeln/Funktion einfügen/Statistik/STABW". Die erste Variante wird gewählt, wenn die Rechnung sich auf eine Grundgesamtheit bezieht, die zweite bei einer Stichprobe.
Wie man mit Hilfe von Wolfram|Alpha Daten einer Analyse im Sinne der Beschreibenden Staitistik unterziehen kann, erfahren Sie hier.
Quellen:
- Microsoft, Das Handbuch, Office Excel 2007, Microsoft Press
- Monka, Schöneck, Voss, Statistik am PC, Hanser, 5. Auflage, München 2008
- Statistik
- Statistisches Bundesamt
