Comprendre les différents formats de compression, de cryptage et d'archive

En termes informatiques, une archive est un fichier unique qui stocke en son sein différents fichiers et dossiers. Il existe plusieurs formats d’archive disponibles, chacun ayant ses propres avantages et inconvénients. Certains formats d’archive prennent en charge la compression (ce qui réduit la taille de votre fichier), tandis que d’autres prennent en charge le cryptage. Oui, et vous l’avez deviné, certains formats d’archive prennent en charge à la fois la compression et le cryptage. Découvrons-en plus sur les algorithmes de compression et de cryptage utilisés et les différents formats d’archive.

Algorithme de Compression

L’algorithme de compression est la méthode utilisée par l’archive pour compresser les fichiers et réduire la taille globale du fichier.

format et algorithme de compression

1. LZMA/LZMA2

L’algorithme de chaîne Lempel-Ziv-Markov (LZMA) est un algorithme de compression de données sans perte. LZMA utilise un algorithme de compression par dictionnaire qui utilise des structures de données complexes pour encoder un bit à la fois.

LZMA2 est un conteneur qui contient à la fois les données non compressées et les données compressées par LZMA. Il prend en charge la compression et la décompression multi-threadées des données. Il peut également compresser des données qui ne sont pas compressibles avec d’autres algorithmes de compression.

2. Algorithme de Transformation de Burrows-Wheeler (BWT)

BWT fonctionne en permutant une chaîne de texte dans l’ordre, puis en les compressant en remplaçant les caractères répétitifs par des symboles.

3. PPM

La prédiction par correspondance partielle (PPM) est une méthode de compression de données statistique qui fonctionne en utilisant un ensemble de symboles précédents dans le flux de symboles non compressés pour prédire le prochain symbole dans le flux.

4. Deflate

Deflate est un algorithme de compression de données populaire qui utilise une combinaison des algorithmes de compression LZ77 et de codage Huffman pour compresser les données (combinant les algorithmes LZMA et PPM pour produire plus de compression). Étant donné que Deflate ne contient pas d’implémentations restreintes par des brevets, il est devenu très populaire et est largement utilisé, en particulier sous Linux.

Algorithme de Cryptage

Passons maintenant en revue quelques-unes des méthodes de cryptage populaires :

format-algorithme-de-cryptage

1. DES

Le Standard de Cryptage des Données utilise des clés secrètes privées pour crypter et décrypter les données. La clé secrète est sélectionnée aléatoirement dans un espace d’adresses de 56 à 64 bits.

2. AES

Le Standard de Cryptage Avancé est un algorithme de cryptage utilisé par les agences américaines pour sécuriser les données sensibles. Vous pouvez crypter des données en utilisant 128, 192 et 256 bits de cryptage. AES utilise un algorithme de clé symétrique, ce qui signifie qu’une clé commune est utilisée pour crypter puis décrypter les données.

3. Blowfish

L’algorithme de cryptage Blowfish crypte les archives avec une taille de bloc de 64 bits et une longueur de clé variable de 32 à 448 bits.

Remarque : Il existe plusieurs autres algorithmes de cryptage, mais les trois mentionnés ci-dessus sont les plus utilisés.

Formats d’Archive

Il existe divers formats d’archive disponibles. Ci-dessous, nous allons évaluer chaque format d’archive en utilisant trois paramètres : s’il prend en charge la compression et le cryptage, quel système d’exploitation et quel logiciel sont disponibles pour son utilisation.

1. Tar

Tape Archive (Tar) est l’un des plus anciens formats d’archive. Au départ, il était utilisé pour combiner et écrire des données sur des bandes magnétiques séquentielles, mais a ensuite été standardisé en tant que format de compression. Tar est principalement utilisé sous Linux et ne prend pas en charge la compression ou le cryptage. Vous pouvez également l’utiliser sur Windows avec l’installation de logiciels supplémentaires. La plupart des utilitaires d’archivage modernes prennent en charge ce format. Les exceptions incluent Disk Archiver et KGB Archiver.

2. GZ

GZ ou GZip est l’un des formats de compression les plus populaires utilisés à la fois sous Windows et Linux. GZip utilise l’algorithme de compression Deflate pour compresser les fichiers archivés. GZip prend également en charge les transferts de fichiers multi-parties, ce qui signifie que vous pouvez créer des parties plus petites d’un grand fichier GZip pour un partage et un transfert faciles. Étant donné que GZip est assez populaire, la plupart des utilitaires d’archivage modernes prennent en charge la compression et la décompression de fichiers au format GZip, y compris 7-Zip, BetterZip, PKZip, WinZip et WinRAR.

3. BZ/BZ2

BZ est très similaire à GZ mais utilise l’algorithme de Transformation de Burrows-Wheeler, ce qui entraîne une compression légèrement plus importante et une taille de fichier plus petite. Bien que la compression soit lente, la décompression est assez rapide. La plupart des logiciels qui prennent en charge GZ prennent également en charge BZ.

4. Zip

compression_winzip

Zip est probablement le format d’archivage le plus connu et le plus utilisé. Zip utilise l’algorithme Deflate et prend en charge la compression sans perte. Il prend également en charge le cryptage AES et DES. La plupart des systèmes d’exploitation modernes sont livrés avec un support intégré pour le format Zip, vous n’avez donc pas besoin d’un logiciel séparé pour archiver et désarchiver des fichiers Zip.

5. 7Z

compression_7zip

Le format d’archivage 7Z a été introduit avec un utilitaire gratuit et open source appelé 7-Zip. C’est le format de compression et d’archivage général le plus avancé qui prend en charge la plupart des algorithmes de compression et de cryptage de données, y compris ceux que nous avons discutés ci-dessus. Le format 7Z compresse les fichiers plus que tout autre format mais est relativement plus lent dans le traitement. Une autre limitation est que le logiciel 7-Zip n’est disponible que pour Windows. Il n’y a pas de support visuel pour Mac ou Linux. 7Z prend également en charge l’archivage multi-parties.

6. RAR

compression_winrar

RAR est un format d’archivage propriétaire. Bien qu’il puisse être lu et extrait par d’autres utilitaires comme 7-Zip et WinZip, il ne peut être créé qu’à l’aide de l’utilitaire WinRAR. RAR était le format le plus populaire pour l’archivage multi-parties avant la sortie de 7Z. Maintenant, 7Z peut faire la même tâche gratuitement que RAR fait en faisant payer ses utilisateurs pour le logiciel WinRAR. RAR prend en charge le cryptage AES.

Autres formats de compression et d’archivage

Voici quelques-uns des formats relativement moins connus :

XZ est un format de compression de données sans perte qui utilise l’algorithme de compression LZMA2. Il peut être considéré comme une version simplifiée de 7Z.

LHA, anciennement connu sous le nom de LHarc, est principalement utilisé pour compresser des fichiers d’installation et des jeux (principalement utilisés au Japon). Fait intéressant, la version japonaise de Windows 7 est livrée avec le support intégré pour les archives LHA.

ACE est un format de fichier d’archive de compression de données propriétaire qui était un concurrent du format RAR dans les premières années 2000.

StuffIt a été principalement publié pour Mac, mais des versions pour Windows, Linux et Solaris ont été publiées par la suite. Il s’agit d’un format de compression propriétaire utilisé par les utilitaires StuffIt.

Conclusion

Sous Linux, le format le plus couramment utilisé est gz (ou tar.gz), suivi de bz, tandis que sous Windows ou Mac, le format le plus couramment utilisé est Zip. Pour une compatibilité multiplateforme, le format Zip est celui à privilégier. Si vous souhaitez des fonctionnalités telles que la sécurité, une compression élevée et l’archivage multi-parties, optez pour le format 7Z. RAR est similaire à 7Z sauf qu’il est payant. Évitez-le autant que possible.

Quel format de fichier et quel utilitaire utilisez-vous pour la compression ?

Crédit image : Spring, réplique du dispositif de chiffrement M-94