ZIP-Dateiformat


aus Wikipedia, der freien Enzyklopädie
Wechseln zu: Navigation, Suche
Vorlage:Infobox Dateiformat/Wartung/Website fehlt
ZIP
Dateiicon von WinZIP, einem verbreiteten ZIP-Programm
Dateiicon von WinZIP, einem verbreiteten ZIP-Programm

Vorlage:Infobox Dateiformat/Wartung/Screenshot Format

Dateiendung: .zip
MIME-Type: application/zip
Magische Zahl:

504B.0304 hex
PK\x03\x04 (ASCII-C-Notation)

Entwickelt von: Phil Katz
Art: Datenkompression
Container für: beliebige Dateien
Standard(s): PKWARE: .ZIP File Format Specification

Das ZIP-Dateiformat (von englisch zipperReißverschluss‘) ist ein Format für komprimierte Dateien, das einerseits den Platzbedarf bei der Archivierung reduziert und andererseits als Containerdatei fungiert, in der mehrere zusammengehörige Dateien oder auch ganze Verzeichnisbäume zusammengefasst werden können. Die Dateiendung für zip-archivierte Dateien ist .zip. Der MIME-Typ ist application/zip.<ref>http://www.iana.org/assignments/media-types/application/zip IANA</ref>

Geschichte

Das ZIP-Format wurde ursprünglich 1989 mit den Programmen PKZIP (komprimieren) und PKUNZIP (dekomprimieren) vom US-Amerikaner Phil Katz eingeführt und hat in der Zwischenzeit einige Erweiterungen erfahren. Katz hatte ursprünglich ein anderes Dateiformat (ARC) benutzt. Dieses Format war von Software Enhancements Associates (SEA) entwickelt worden und wurde als Shareware vertrieben. Katz schrieb eine eigene, deutlich schnellere Version dieser Software und verbreitete sie als PKARC. Als ihn daraufhin SEA verklagte, zog er PKARC zurück und entwickelte stattdessen PKZIP, das einen effizienteren Algorithmus benutzte. Durch die schnelle Verbreitung von PKZIP wurden SEA und ARC bedeutungslos.

Merkmale

Container

Hauptartikel: Containerdatei

Das ZIP-Format ist zunächst ein Datencontainer, in den mehrere Dateien komprimiert oder unkomprimiert gespeichert und auch einzeln entkomprimiert (extrahiert) werden können. Darüber hinaus ermöglicht das Format auch das Mitspeichern des dazugehörigen Speicherort-Pfads. Auch eine Verschlüsselung der ansonsten lediglich komprimierten Dateien mit einem Passwort ist möglich.

Keine progressive Kompression

Das ZIP-Format unterstützt keine progressive Kompression (auch engl. solid genannt), die Dateien werden einzeln komprimiert. Das ermöglicht einerseits eine flexible Handhabung (Löschen/Hinzufügen von Dateien aus dem Archiv, ohne alles neu komprimieren zu müssen; Extraktion einzelner Dateien ohne vorangehende Dateien dekomprimieren zu müssen), hat aber den Nachteil, dass Redundanzen zwischen den Dateien bei der Komprimierung nicht berücksichtigt werden können. Dieser Nachteil kann umgangen werden, indem die Dateien zunächst unkomprimiert archiviert werden und die so erzeugte Zip-Datei in eine weitere komprimiert gespeichert wird (meist nur bei extrem vielen gleichartigen Dateien sinnvoll).

Nicht-sequenzielles Format

Die Dateien sind als Dateieinträge (engl. file entries) in beliebiger Reihenfolge gespeichert. Die Dateieinträge beginnen alle mit einem lokalen Dateikopf (engl. local header), der den Dateieintrag beschreibt und den Datenabschnitt mit den effektiven Inhalten einleitet. Um die Handhabung dieser beliebig angeordneten Einträge zu gewährleisten, befindet sich am Ende der ZIP-Datei jeweils ein zentrales Verzeichnis (engl. central directory), welches sämtliche Dateieinträge anhand der lokalen Dateiköpfe referenziert. Die Reihenfolge der Dateieinträge und der entsprechenden Referenzen im zentralen Verzeichnis können sich voneinander unterscheiden. Es handelt sich also um eine nicht-sequenzielle Struktur, die am besten mit dem Konzept des wahlfreien Zugriffs (engl. random access) beschrieben werden kann.

Dieses nicht-sequenzielle Format bewirkt andererseits aber auch, dass im Gegensatz zum seit 1977 üblichen und seit 1988 standardisierten Tar-Format, unvollständige oder im hinteren Teil defekte Archive gar nicht entpackt werden können.

Datei:ZIPformat.jpg
Struktur einer ZIP-Datei

Multivolume

Es ist weiterhin möglich, das Archiv auf mehrere Dateien zu verteilen (zum Beispiel um große Dateien in Stücke zu teilen, die jeweils auf eine CD oder DVD passen).

Packalgorithmen

Neben der bis zur PKZip-Version 2.x am besten packenden Methode Deflate unterstützt ZIP noch eine Reihe weiterer Kompressionsalgorithmen<ref>PKWARE Inc: ZIP File Format Specification (englisch) Abgerufen am 20. Mai 2011.</ref>:

Methode Kurztext Kommentar
0 Store Die Datei wird ohne Kompression gespeichert.
1 UnShrinking Dynamischer Lempel-Ziv-Welch-Algorithmus
2 Expanding – Kompressionsstufe 1
3 Expanding – Kompressionsstufe 2
4 Expanding – Kompressionsstufe 3
5 Expanding – Kompressionsstufe 4
6 Imploding
7 Tokenization
8 Deflating LZSS und Huffman-Entropiekodierung
9 Enhanced Deflating(DEFLATE64)
10 PKWARE Data Compression Library Imploding (ehemals IBM TERSE)
11 reserviert
12 Bzip2
13 reserviert
14 LZMA<ref>http://pkware.com/documents/casestudies/APPNOTE.TXT</ref><ref>http://winzip.com/wz54.htm</ref> Lempel-Ziv-Markow-Algorithmus
15 reserviert
16 reserviert
17 reserviert
18 IBM TERSE (neu)
19 IBM LZ77 z Architecture (PFS)
95 Xz(LZMA2) 1.0.4 Erweiterung durch WinZIP 18.0 (November 2013)<ref>http://kb.winzip.com/kb/entry/294/#comp</ref><ref>http://winzip.com/comp_info.htm</ref>
96 JPEG Compression<ref>http://imagewz.winzip.com/static/wz_jpg_comp.pdf</ref> Erweiterung durch WinZIP 12.0 (September 2008)<ref>http://winzip.com/wz54.htm</ref>
97 WavPack Erweiterung durch WinZIP 11.0 Beta (Oktober 2006)<ref>http://winzip.com/comp_info.htm</ref>
98 PPMd Version 1, rev 1 Erweiterung durch WinZIP 10.0 Beta (August 2005)<ref>http://winzip.com/comp_info.htm</ref>
99 AES-verschlüsselt Erweiterung durch WinZIP <ref>http://winzip.com/wz54.htm</ref>

Erweiterungen

Es existieren mittlerweile nachträglich eingeführte Erweiterungen wie die Zip128-Erweiterung.

Verbreitung, Bedeutung

Das Dateiformat und das Kompressionsverfahren Deflate sind Public Domain und erlangten unter anderem dadurch eine weltweite Verbreitung und Bedeutung.

Die Deflate-Methode findet sich als Quasi-Standard in zahlreichen weiteren Formaten, wie den Bilddateiformaten Portable Network Graphics (PNG) und Tagged Image File Format (TIFF), dem OpenDocument- und dem Office Open XML-Format der ISO wieder.

Programme

Neben PKZIP existieren zahlreiche andere Programme, die dieses Dateiformat bearbeiten können. Dazu zählen kommerzielle Programme, wie WinZIP mit einer sehr großen Verbreitung, oder freie Programme wie Info-ZIP, PeaZip oder 7-Zip, dessen optimierter Deflate-Algorithmus obendrein geringfügig kleinere PKZIP-2.xx-kompatible Dateien erzeugen kann.

Datei:Winzip-logo2.svg
Logo von WinZIP, einem verbreiteten ZIP-Programm für Windows

Programm- und Klassenbibliotheken für den Zugriff auf ZIP-Dateien stehen für zahlreiche Programmiersprachen zur Verfügung. So enthält beispielsweise die Java Platform Standard Edition (Java SE) seit 1997 (Version 1.1) das Paket „java.util.zip“ mit entsprechenden Klassen für Komprimierung und Dekomprimierung. Weiter gibt es die Klassenbibliothek Zip64File, welche ZIP-Dateien als sogenannte Direktzugriffsdateien (engl. random access files) handhaben kann. Zip64File steht der Öffentlichkeit vollumfänglich, kostenfrei und inklusive Quellcode zur Verfügung.

Das im System Mac OS X integrierte Programm BOMArchiveHelper erzeugt und dekomprimiert ebenfalls im ZIP-Format.

Die freie Info-ZIP Implementierung des ZIP-Algorithmus, die unter Anderem auch sehr häufig unter Linux verwendet wird, kann nicht mit ZIP-Archiven, die Dateien mit einer Größe von mehr als 2 GB beziehungsweise 4 GB enthalten, umgehen.<ref>Limitierungen der Info-ZIP-Implementierung</ref> Um solche Dateien zu entpacken, kann man jedoch andere Programme, wie beispielsweise 7z verwenden.

Name, Namensverwirrung

Nach Auskunft der Firma PKWare bezieht sich der Name zip (engl. für Reißverschluss) auf das Verpacken von vielen Einzeldateien in einen größeren Container und nicht auf die Komprimierungsfunktion des Programms.

Nicht jedes Kompressionsprogramm, dessen Name die Zeichenkette „ZIP“ enthält, arbeitet mit dem ZIP-Dateiformat. Die wichtigsten Beispiele sind gzip vom GNU-Projekt und bzip2, die jeweils in einem eigenständigen Format nur eine einzelne Datei komprimieren. Zum Archivieren mehrerer Dateien muss in diesem Fall vor der Komprimierung ein anderes Programm verwendet werden (im Zusammenhang mit gzip und bzip2 meist tar). Auch bei 7-Zip wird zwar das ZIP-Dateiformat voll unterstützt, aber das eigene Archivformat 7z ist nicht mit ZIP-kompatibel.

WinZip führte mit Version 12.1 die Erweiterung zipx des ZIP-Formats ein, die die Verwendung neuerer Kompressionsmethoden als DEFLATE, insbesondere BZip, LZMA, PPMd, Jpeg and Wavpack, kennzeichnet.

Das Wort „zippen“ wird gelegentlich als Synonym für „komprimiert archivieren“ verwendet, jedoch muss dabei nicht zwangsläufig das Packen als ZIP-Datei gemeint sein.

Siehe auch

Weblinks

Einzelnachweise

<references />