Comment fonctionne la compression de fichier?

Comment fonctionne la compression de fichier? / La technologie expliquée

Nous avons tous entendu parler de la compression de fichier. Toute personne qui télécharge régulièrement des fichiers sur le Web connaît des formats tels que ZIP et RAR. Quiconque édite des fichiers multimédias sait que la compression est nécessaire pour partager des images, de la musique et des vidéos sur le Web sans utiliser toute votre bande passante. On pourrait soutenir que la compression de fichiers est au cœur du fonctionnement du Web car elle nous permet de partager des fichiers dont le transfert prendrait trop de temps. Mais comment ça marche?

Ce n’est rien de magique, mais c’est le résultat du travail ardu de nombreuses personnes très intelligentes. Explorons le fonctionnement de la compression de fichier en examinant les deux principaux types de compression - sans perte et avec perte.

Juste un avertissement - je vais trop simplifier les choses ici pour essayer de rendre ceci lisible par les non-majors en maths. Consultez les articles liés à Wikipedia pour plus de détails et les sources de Wikipédia pour encore plus..

Compression sans perte

La compression sans perte fonctionne essentiellement en supprimant la redondance. Qu'est-ce que ça veut dire? Simplifions les choses. Cette pile de briques représentera nos données:

Comme vous pouvez le constater, nous avons deux briques rouges, cinq jaunes et trois bleues. Le moyen le plus simple de représenter ceci est comme vous le voyez ci-dessus: les briques elles-mêmes. Mais ce n'est pas la seule façon pour moi de représenter cela. Je pourrais aussi faire ça:

Dans l'image ci-dessus, vous pouvez voir exactement les mêmes informations - deux rouges, cinq jaunes et trois bleues - mais cela prend beaucoup moins de place. J'ai représenté des briques redondantes à l'aide de nombres, ce qui signifie que je n'ai besoin que de trois briques pour représenter dix.

Cela vous donne une idée approximative de la possibilité de compression sans perte. Les informations redondantes sont remplacées par des instructions indiquant à l'ordinateur le nombre de données identiques répétées. Un autre exemple simplifié:

fffffffuuuuuuuuuuuu

Peut être “comprimé” à:

f7u12

Ce n’est bien sûr qu’une méthode de compression sans perte, mais elle montre comment cela est possible. D'autres astuces mathématiques sont utilisées, mais l'essentiel à retenir sur la compression sans perte est que, même si de l'espace est économisé, il est possible de reconstruire le fichier d'origine entièrement à partir du fichier compressé. Si vous voyez trois briques avec des chiffres, vous savez exactement comment faire la pile. Aucune information n'est perdue, comme le nom l'indique sans perte.

Des programmes tels que WinZip sont basés sur la compression sans perte. Ils suppriment ces informations redondantes lorsque vous compressez (ou “Zip *: français”) le fichier et le restaurer lorsque vous décompressez (ou “décompresser”). Rien n'est perdu.

Dans le monde de l’image, les fichiers PNG utilisent également la compression sans perte. C'est pourquoi ils offrent une taille de fichier plus petite pour les images avec beaucoup d'espace uniforme: cette information redondante est représentée à l'aide d'instructions.

Bien sûr, il s’agit là d’une simplification excessive, mais c’est ce qui fait passer le message fondamental. En savoir plus sur la compression sans perte sur Wikipedia, si cela vous intéresse.

La compression avec perte

Bien sûr, vous ne pouvez accomplir que beaucoup de choses en utilisant uniquement des méthodes sans perte. Heureusement, ils ne sont pas la seule option: vous pouvez également simplement supprimer des informations. C'est ce qu'on appelle la compression avec perte, et ce n'est pas aussi fou que cela puisse paraître; en fait, vous avez probablement beaucoup de fichiers sur votre ordinateur en utilisant la compression avec perte.

Un MP3, par exemple. Si vous êtes comme la plupart des gens, votre ordinateur en stocke des milliers pour vous, mais saviez-vous qu'ils ne contiennent pas toutes les informations audio contenues dans l'enregistrement original? Certains sons, que les humains ne peuvent pas ou peuvent à peine entendre, sont supprimés dans le cadre de la compression. Plus vous compressez un fichier, plus les informations sont supprimées, ce qui explique pourquoi un fichier trop compressé commence à paraître boueux..

La compression avec perte a tendance à être principalement utilisée pour les fichiers multimédias - images, son et vidéo. L'utilisation de la compression avec perte pour un fichier texte poserait problème, car les informations résultantes seraient tronquées. Il n’est pas toujours nécessaire que les fichiers multimédias incluent toutes les informations..

L'image JPEG est un autre exemple de compression avec perte. En règle générale, les images vues sur le Web n'ont pas besoin d'être de la même qualité que celles destinées à l'impression. En tant que tel, vous pouvez supprimer beaucoup d’informations redondantes dans une image Web, même si cela vous donnerait une impression affreuse..

Bien sûr, la compression répétée d'un fichier à l'aide de méthodes avec pertes diminue la qualité - chaque fois que vous le faites, plus de données sont perdues. Ci-dessous, une photo que j'ai comprimée trois fois pour illustrer ceci:

Vous pouvez voir de gauche à droite comment la qualité diminue. Peu importe, en fonction de l'utilisation de l'image, la compression avec perte existe.

Il est important de se rappeler que les fichiers compressés à l'aide de méthodes avec perte perdent des données, ce qui signifie que vous ne pouvez pas recréer le fichier d'origine à partir d'un fichier compressé à l'aide de méthodes avec perte. C'est évident quand on y pense, mais de nombreux projets d'impression ont été ruinés faute de comprendre ce point clé..

En réalité, je n’ai fait que gratter la surface ici, donc, je vous en prie: lisez davantage sur la compression avec pertes sur Wikipedia. C'est un peu fascinant.

Conclusion

La compression a contribué à faire du Web ce qu’il est. À l’époque des images compressées par numérotation, les photos étaient affichées sur notre navigateur, du moins pas à une vitesse acceptable. La vidéo compressée rend des sites comme YouTube possibles, et quiconque utilise des réseaux de partage de fichiers est familiarisé avec les fichiers ZIP et RAR..

Avez-vous quelque chose à ajouter? Je suis sûr que j'ai manqué quelques points clés, alors informez-moi (et les autres lecteurs) dans les commentaires ci-dessous.

Crédit d'image: image de printemps via Shutterstock

En savoir plus sur: Compression de fichiers.