
- Daten bearbeiten mit Excel - Gerd Altmann/pixelio.de
Daten sind die empirische Basis jeder Statistik. Deshalb ist es angebracht, sich ein paar Gedanken über mögliche Datentypen zu machen. Von der Art der Daten hängt ab, welche Operationen durchgeführt und welche Schlussfolgerungen gezogen werden können. Zum Beispiel argumentiert man in Statistiken gerne mit dem Begriff des Arithmetischen Mittelwertes, aber nicht jeder Datentyp lässt einen solchen Mittelwert zu. Selbstverständlich gibt es viele verschiedene Möglichkeiten, Daten und deren Merkmale zu klassifizieren und es ist unmöglich, hier alle diese Varianten zu besprechen. Eine Klassifizierung ist aber besonders wichtig, nämlich die Unterscheidung von Nominal-, Ordinal- und Kardinaldaten. Typische Beispiele dafür sind der Familienstand, die Schulnoten und das Einkommen. In diesem Artikel sollen Daten dieser Art etwas genauer betrachtet werden. Darüber hinaus werden einige Funktionen vorgestellt, die Excel anbietet, um diese Datentypen zu bearbeiten. Grundlage dieses Artikels ist die Version Excel 2007.
Nominaldaten haben keine natürliche Ordnung und mit ihnen kann nicht gerechnet werden
Der Familienstand ist ein Beispiel für ein nominales Merkmal einer Datenmenge. Mögliche Werte sind {ledig, verheiratet, geschieden, verwitwet}. Man kann sich das Leben vereinfachen, indem man stattdessen die Codezahlen {1,2,3,4} definiert, also 1 für "ledig" und so weiter. Allerdings ist hier schon Vorsicht geboten. Denn die Zeichen {1,2,3,4} sehen zwar aus wie natürliche Zahlen, dürfen aber nicht als solche behandelt werden. Sie haben zum Beispiel keine natürliche Reihenfolge. Auch kann man mit diesen "Zahlen" nicht rechnen.Hier gilt zum Beispiel die Gleichung 1+2=3 nicht. Denn es gibt keinen Sinn zu sagen, dass "ledig plus verheiratet gleich geschieden" ist. Weil man mit diesen Zeichen nicht rechnen kann, ist selbstverständlich auch die Bildung eines Arithmetischen Mittelwertes unmöglich.
Mit Excel sortieren und Lagemaße bestimmen
Obwohl die Nominaldaten keine natürliche Ordnung besitzen, können Sie die Datenmenge selbstverständlich benutzerdefiniert ordnen. Angenommen, die Urliste der Datenerhebung hinsichtlich des Familienstandes sieht so aus: {1,1,2,4,1,2,3,4,2,1}. Sie möchten nun mit Excel die Liste folgendermaßen sortieren: {1,1,1,1,2,2,2,3,4,4}, was die Übersicht erleichtert. Markieren Sie dazu den Bereich der Urliste und klicken Sie auf "Start/Bearbeiten/Daten sortieren und filtern/Nach Größe sortieren (aufsteigend)." Sie erhalten das erwünschte Ergebnis. Dieser Operation liegt allerdings - streng genommen - ein Gedankenfehler zugrunde. Denn Sie haben die Symbole wie Zahlen behandelt, indem Sie diese "der Größe nach geordnet haben". Obwohl das Ergebnis brauchbar ist, sollte man sich die kleine gedankliche Unkorrektheit klar machen.
Darüber hinaus ist die Erstellung einer Häufigkeitsverteilung möglich. Die obige Liste kann zum Beispiel durch die folgende Häufigkeitsverteilung ersetzt werden: {(1,4), (2,3), (3,1), (4,2)}. Auch lassen sich sogenannte Lagemaße für Nominaldaten definieren, zum Beispiel "der häufigste Wert", auch Modus genannt. Excel stellt diesen folgendermaßen zur Verfügung: "Start/Formeln/Funktion einfügen/Statistik/Modalwert."
Ordinaldaten haben eine natürliche Anordnung
Etwas anders verhält es sich mit den Schulnoten. Die möglichen Werte sind: {1,2,3,4,5,6}. Hier existiert eine natürliche Ordnung. Man kann sagen, die 1 sei besser als die 2 und die 6 sei die schlechteste Note. Aber auch hier ist Vorsicht geboten, wenn es sich um Rechenoperationen handelt. Was soll zum Beispiel die Gleichung 5+6=11 bedeuten? Übersetzt hieße das: Mangelhaft plus Ungenügend = Elf. Obwohl diese Aussage offensichtlich unsinnig ist, wird genau diese Rechnung oft durchgeführt, um das Arithmetische Mittel von Schulnoten zu bilden. Dieses Vorgehen ist insofern in gewisser Weise berechtigt, weil das Ergebnis sinnvoll interpretierbar ist. (Fahrmeier, Statistik, Seite 18) Es bleibt aber dabei, dass die Rechnung selbst keinen Sinn ergibt. Es ist eben so, dass die "Zahlen" {1,2,3,4,5,6} nur Symbole für die Noten {Sehr gut, gut,...} sind. Deswegen ist die Rechnung "1+2=3" ebenso unsinnig wie "Sehr gut plus Gut = Befriedigend".
Mit Excel lassen sich Ordinaldaten filtern
Da die Ordinaldaten eine natürliche Ordnung haben, lassen sie sich mit Excel gemäß dieser Ordnung sortieren. Sie können mit Excel aber auch eine andere Ordnung benutzerdefiniert festlegen. Man kann die Daten sogar filtern. Angenommen Sie haben die folgende Urliste an Noten: {2,1,3,3,3,4,1,5,5,6,4,2,1}. Nun sollen alle Noten bestimmt werden, die schlechter als 3 sind. Markieren Sie dazu wieder den entsprechenden Bereich der Urliste und klicken sie Folgendes an: "Start/Bearbeiten/Sortieren und Filtern/Filtern." In dem markierten Bereich taucht ein Pfeil auf. Klicken Sie auf diesen Pfeil und dann auf: "Zahlenfilter/Größer als." Tragen Sie dann in dem auftauchenden Fenster in das entsprechende Eingabefeld die "3" ein. Bestätigen Sie mit OK. Darüber hinaus lassen sich für Ordinaldaten auch bestimmte Lagemaße festlegen, zum Beispiel der sogenannte Median, auch Zentralwert genannt. Excel bietet diese Option über den folgenden Weg an: "Formeln/Funktion einfügen/Statistik/Median".
Kardinaldaten haben eine natürliche Ordnung und es kann mit ihnen gerechnet werden
Ein Beispiel für Kardinaldaten ist das monatliche Einkommen einer Gruppe von Menschen. Zum Beispiel: {3000, 2000, 2700, 5000, 1860} gemessen in Euro. Diese Daten haben eine natürliche Anordnung und man kann mit ihnen rechnen, da es sich um reelle Zahlen handelt. Sie können mit diesen Zahlen also alle Grundrechenarten ausführen. Daraus folgt, dass man auch das Arithmetische Mittel dieser Zahlen bilden kann. Markieren Sie dazu den Bereich und klicken Sie dann auf: "Start/Bearbeiten/AutoSumme/Mittelwert". Unterhalb des markierten Bereiches wird zusätzlich das Arithmetische Mittel angegeben. Excel stellt viele Funktionen zur Verfügung, um Operationen mit Kardinaldaten ausführen zu können.
Quellen:
- Taschenbuch der Statistik, Verlag Harri Deutsch, Frankfurt am Main, 2008
- Fahrmeir, Künstler, Pigeot, Tutz: Statistik. Springer, 2004
- Statistik
- Häufigkeitsverteilung
