Datensicherung: Verfahren zur Komprimierung und Archivierung

Komprimierung spart Speicherplatz - Vera Kriebel
Komprimierung spart Speicherplatz - Vera Kriebel
Ein Überblick zu RAR, ZIP, TAR: Komprimierung spart Speicherplatz, verlangsamt aber das Backup. Der Komprimierungsgrad ist datenabhängig (auch 0% möglich).

Wer auf elektronischem Wege Dateien sichern möchte, für den stellt die Datenmenge häufig ein Problem dar. Aus diesem Grund wurden Komprimierungsverfahren entwickelt, die Dateien verkleinern und damit Speicherplatz sparen; allerdings verlangsamt sich hierdurch auch der Backup-Prozess. Der Grad (Prozentsatz) der Komprimierung ist zudem entscheidend von den zu sichernden Daten abhängig und kann auch null Prozent betragen. Für die Datenkompression wird die Datenorganisation geändert und muss bei der so gennanten Daten-Dekomprimierung reorganisiert werden. Man spricht dabei auch von Kodieren und Dekodieren. Die Datenmenge wird reduziert, weil eine günstigere Repräsentationsform bestimmt wird. Damit lassen sich die gleichen Informationen der Ursprungsdatei in kürzerer Form darstellen.

Jedes Backup-Programm bietet eigene Komprimierungsverfahren an. Hier soll deswegen ein Überblick über gängige Komprimierungsformate gegeben werden. Ob eine Datei komprimiert ist oder nicht, erkennt man fast immer am Dateinamen, genauer gesagt: der Endung des Namens. Anhand der Endung kann man auch feststellen, mit welchem Programm die Datei gepackt wurde, bzw. welches Programm man zum Entkomprimieren benötigt.

Programme: Komprimierung oder Archivierung

Grundlegend werden in diesem Bereich zwei Arten von Programmen unterschieden, die Komprimier-Programme und die Archivier-Programme. Komprimier-Programme wie gzip, compress und pack haben nur einen einzigen Zweck, nämlich eine Datei zu komprimieren. Sie können nicht mehrere Dateien zu einer zusammenfassen. Häufig werden diese Programme in Verbindung mit einem Archivier-Programm verwendet (z.B. gzip oder compress mit tar). Im Gegensatz zu den Komprimier-Programmen dienen Archivier-Programme hauptsächlich dazu, verschiedene Dateien zu einer zusammenzufassen. Mit Ausnahme der tar's können allerdings alle hier erwähnten Archivier-Programme diese auch gleich komprimieren.

  • ZIP und CAB zeichnen sich durch eine hohe Packgeschwindigkeit und eine sehr effektive Komprimierung aus, die nur von RAR und CAB übertroffen wird. ZIP-Clones basieren häufig auf Sourcecode, den die Info-Zip Group entwickelt und auf verschiedene Plattformen portiert hat. Dieser Sourcecode ist lizenzfrei.
  • TAR und GZIP haben ihren Ursprung in zwei Unix-Tools, die inzwischen auf DOS portiert wurden: TAR (Tape Archiver) ist kein Komprimierprogramm, es dient lediglich dem Zusammenfassen mehrerer Files zu einer einzigen Datei. Zum Komprimieren kommt dann in der Regel das Programm GZIP zum Einsatz, das anders als zum Beispiel die ZIP-Programme immer nur eine einzige Datei packen kann.
  • RAR ist ein Verfahren, das eine Reihe von Packern unter Mac, Windows und Unix einsetzen. Die Stärke von RAR ist der hohe Komprimierungsgrad, der sich mit den sogenannten Solid Archives erzielen läßt, die RAR anlegt.

Einfache Packprogramme wie Zip, RAR usw. scheiden übrigens als verlässliche Backup-Lösung aus, weil ihnen eben die Fähigkeit zum Vergleich mit den Orgininaldateien fehlt. Sie können zwar die Integrität des Archivs an Hand von CRC-Prüfsummen testen, jedoch sagt das nur aus, dass fehlerhafte Daten fehlerlos komprimiert wurden.

(Mitautor: Klaus Lohmann)

Vera Kriebel, Vera Kriebel

Vera Kriebel - Themen: u.a. Wirtschaft, Technik, Literatur, Reisen, IuK, Politik, Kultur, Geistes- und Sozialwissenschaften Texte, Recherchen, ...

rss