Verstehen der verschiedenen Kompressions-, Verschlüsselungs- und Archivformate

Im Computerjargon ist ein Archiv eine einzelne Datei, die verschiedene Dateien und Ordner in sich speichert. Es gibt mehrere Archivformate, und jedes hat seine eigenen Vor- und Nachteile. Einige Archivformate unterstützen die Kompression (was die Dateigröße verkleinert), während andere die Verschlüsselung unterstützen. Ja, und Sie haben es erraten, einige Archivformate unterstützen beides, Kompression und Verschlüsselung. Lassen Sie uns mehr über die verwendeten Kompressions- und Verschlüsselungsalgorithmen und die verschiedenen Archivformate erfahren.

Kompressionsalgorithmus

Der Kompressionsalgorithmus ist die Methode, die vom Archiv verwendet wird, um die Dateien zu komprimieren und die gesamte Dateigröße zu verkleinern.

Kompressionsformat und -algorithmus

1. LZMA/LZMA2

Der Lempel-Ziv-Markov (LZMA) Kettenalgorithmus ist ein verlustfreier Datenkompressionsalgorithmus. LZMA verwendet einen Wörterbuchkompressionsalgorithmus, der komplexe Datenstrukturen nutzt, um ein Bit nach dem anderen zu kodieren.

LZMA2 ist ein Container, der sowohl die unkomprimierten als auch die LZMA-komprimierten Daten enthält. Es unterstützt die mehrfädige Kompression und Dekompression von Daten. Es kann auch Daten komprimieren, die mit anderen Kompressionsalgorithmen nicht komprimierbar sind.

2. Burrows-Wheeler-Transformationsalgorithmus (BWT)

BWT funktioniert, indem es eine Textzeichenfolge permutiert und sie dann komprimiert, indem es die sich wiederholenden Zeichen durch Symbole ersetzt.

3. PPM

Die Vorhersage durch partielle Übereinstimmung (PPM) ist eine statistische Datenkompressionsmethode, die funktioniert, indem sie eine Menge vorheriger Symbole im unkomprimierten Symbolstrom verwendet, um das nächste Symbol im Strom vorherzusagen.

4. Deflate

Deflate ist ein beliebter Datenkompressionsalgorithmus, der eine Kombination aus LZ77 und Huffman-Codierungsalgorithmen verwendet, um Daten zu komprimieren (Kombination von LZMA- und PPM-Algorithmen, um mehr Kompression zu erzeugen). Da Deflate keine durch Patente eingeschränkten Implementierungen enthält, ist es sehr beliebt geworden und wird häufig verwendet, insbesondere in Linux.

Verschlüsselungsalgorithmus

Lassen Sie uns nun einige der gängigen Verschlüsselungsmethoden durchgehen:

Verschlüsselungsformat-Algorithmus

1. DES

Der Data Encryption Standard verwendet private geheime Schlüssel zur Verschlüsselung und Entschlüsselung von Daten. Der geheime Schlüssel wird zufällig aus einem 56 bis 64-Bit-Adressraum ausgewählt.

2. AES

Der Advanced Encryption Standard ist ein Verschlüsselungsalgorithmus, der von den US-Behörden verwendet wird, um sensible Daten zu sichern. Sie können Daten mit 128, 192 und 256 Bit Verschlüsselung verschlüsseln. AES verwendet einen symmetrischen Schlüsselalgorithmus, was bedeutet, dass ein gemeinsamer Schlüssel zum Verschlüsseln und dann zum Entschlüsseln der Daten verwendet wird.

3. Blowfish

Der Blowfish-Verschlüsselungsalgorithmus verschlüsselt die Archive mit einer Blockgröße von 64 Bit und einer variablen Schlüssellänge von 32 bis 448 Bit.

Hinweis: Es gibt mehrere andere Verschlüsselungsalgorithmen, aber die oben genannten drei sind die am häufigsten verwendeten.

Archivformate

Es gibt verschiedene Archivformate. Im Folgenden werden wir jedes Archivformat anhand von drei Parametern bewerten – ob es Kompression und Verschlüsselung unterstützt, welches Betriebssystem und welche Software für seine Verwendung verfügbar ist.

1. Tar

Tape Archive (Tar) ist eines der ältesten Archivformate. Ursprünglich wurde es verwendet, um Daten auf sequenziellen Bandlaufwerken zu kombinieren und zu schreiben, wurde aber später als Kompressionsformat standardisiert. Tar wird hauptsächlich in Linux verwendet und unterstützt keine Kompression oder Verschlüsselung. Sie können es auch unter Windows mit der Installation zusätzlicher Software verwenden. Die meisten modernen Archivierungsprogramme unterstützen dieses Format. Die Ausnahmen sind Disk Archiver und KGB Archiver.

2. GZ

GZ oder GZip ist eines der beliebtesten Kompressionsformate, die sowohl in Windows als auch in Linux verwendet werden. GZip verwendet den Deflate-Kompressionsalgorithmus, um die archivierten Dateien zu komprimieren. GZip unterstützt auch mehrteilige Dateiübertragungen, was bedeutet, dass Sie kleinere Teile einer großen GZip-Datei für einfaches Teilen und Übertragen erstellen können. Da GZip recht beliebt ist, unterstützen die meisten modernen Archivierungsprogramme die Kompression und Dekompression von Dateien im GZip-Format, einschließlich 7-Zip, BetterZip, PKZip, WinZip und WinRAR.

3. BZ/BZ2

BZ ist GZ sehr ähnlich, verwendet jedoch den Burrows-Wheeler-Transformationsalgorithmus, was zu etwas mehr Kompression und einer kleineren Dateigröße führt. Obwohl die Kompression langsam ist, ist die Dekompression ziemlich schnell. Die meisten der Software, die GZ unterstützen, unterstützen auch BZ.

4. Zip

Kompression_winzip

Zip ist wahrscheinlich das bekannteste und am häufigsten verwendete Archivformat. Zip verwendet den Deflate-Algorithmus und unterstützt verlustfreie Kompression. Es unterstützt auch AES- und DES-Verschlüsselung. Die meisten modernen Betriebssysteme bieten eine integrierte Unterstützung für das Zip-Format, sodass Sie keine separate Software zum Archivieren und Entpacken von Zip-Dateien benötigen.

5. 7Z

Kompression_7zip

Das 7Z-Archivformat wurde mit einem kostenlosen und Open-Source-Dienstprogramm namens 7-Zip eingeführt. Es ist das fortschrittlichste allgemeine Kompressions- und Archivformat, das die meisten Datenkompressions- und Verschlüsselungsalgorithmen unterstützt, einschließlich der oben besprochenen. Das 7Z-Format komprimiert die Dateien mehr als jedes andere Format, ist jedoch relativ langsamer in der Verarbeitung. Eine weitere Einschränkung ist, dass die 7-Zip-Software nur für Windows verfügbar ist. Es gibt keine visuelle Unterstützung für Mac oder Linux. 7Z unterstützt auch mehrteilige Archivierung.

6. RAR

Kompression_winrar

RAR ist ein proprietäres Archivformat. Während es von anderen Dienstprogrammen wie 7-Zip und WinZip gelesen und extrahiert werden kann, kann es nur mit dem WinRAR-Dienstprogramm erstellt werden. RAR war das beliebteste Format für mehrteilige Archivierung, bevor 7Z veröffentlicht wurde. Jetzt kann 7Z die gleiche Aufgabe kostenlos erledigen, die RAR seinen Benutzern durch den Kauf der WinRAR-Software berechnet. RAR unterstützt AES-Verschlüsselung.

Andere Kompressions- und Archivformate

Hier sind einige der relativ weniger bekannten Formate:

XZ ist ein verlustfreies Datenkompressionsformat, das den LZMA2-Kompressionsalgorithmus verwendet. Es kann als eine abgespeckte Version von 7Z betrachtet werden.

LHA, früher bekannt als LHarc, wird hauptsächlich zum Komprimieren von Installationsdateien und Spielen verwendet (hauptsächlich in Japan verwendet). Interessanterweise kommt die japanische Version von Windows 7 mit integrierter Unterstützung für LHA-Archive.

ACE ist ein proprietäres Datenkompressions-Archivdateiformat, das in den frühen 2000er Jahren ein Konkurrent des RAR-Formats war.

StuffIt wurde ursprünglich für Mac veröffentlicht, aber später wurden Versionen für Windows, Linux und Solaris veröffentlicht. Dies ist ein proprietäres Kompressionsformat, das von StuffIt-Dienstprogrammen verwendet wird.

Fazit

In Linux ist das am häufigsten verwendete Format gz (oder tar.gz), gefolgt von bz, während in Windows oder Mac das am häufigsten verwendete Format Zip ist. Für plattformübergreifende Kompatibilität ist das Zip-Format die beste Wahl. Wenn Sie Funktionen wie Sicherheit, hohe Kompression und mehrteilige Archivierung wünschen, entscheiden Sie sich für das 7Z-Format. RAR ist ähnlich wie 7Z, kommt jedoch mit einem Preis. Vermeiden Sie es so weit wie möglich.

Welches Dateiformat und Dienstprogramm verwenden Sie zur Kompression?

Bildnachweis: Spring, M-94 Cipher Device Replica