5 technologies pour garantir la pérennité de vos données

5 technologies pour garantir la pérennité de vos données / Future Tech

Ils disent que sur Internet, rien ne disparaît jamais Rien n'est supprimé d'Internet, jamais. Voici comment. Rien ne peut être supprimé d'Internet, jamais. Voici comment. Ces personnes essaient de tout sauvegarder sur le Web. C'est un gros travail, mais vous pouvez aider. Lire la suite .

Cela est vrai pour le contenu populaire qui est partagé et remixé à l'infini. Mais ce genre de bonbon viral n’est que la partie visible d’un énorme iceberg. Sous la surface de mèmes et de célébrités nues se cache d'innombrables pétaoctets de données trop ennuyeuses pour l'immortalité. Photos de mariage, essais collégiaux, vidéos maison 10 astuces simples pour créer des vidéos à domicile Look Professional 10 astuces simples pour créer des vidéos à domicile Apparence professionnelle Les caméras pour téléphones mobiles se sont progressivement améliorées et sont devenues des outils fiables pour l'enregistrement de vidéos en déplacement. Voici 10 astuces pour donner à vos vidéos un aspect professionnel. En savoir plus, anciens e-mails - la plupart de nos données appartiennent à cette catégorie et peuvent être extrêmement éphémères.

L'un des principaux enseignements de la physique est que la thermodynamique déteste vos tripes. Les données informatiques ne font pas exception. La mémoire flash perd sa charge en moins de dix ans. Même dans des conditions idéales, les disques durs magnétiques ne dureront pas plus de dix ans. Les CD, dans des conditions idéales, durent environ dix heures. La bande magnétique, la référence en matière de stockage de données à long terme pour l'industrie, cesse d'être lisible après trente à cinquante ans.

Comment les données numériques meurent

Cela pose un problème, car cela rend le stockage des données plus laborieux. Tout ce qui n'est pas assez intéressant pour être préservé activement d'un disque dur à l'autre, d'un service cloud à un autre, cesse tout simplement d'exister. 99% de nos données sont simplement jetées dans des sites d'enfouissement et des sociétés Internet défaillantes. Même pour les données dont nous nous soucions, le pronostic n'est pas bon.

Considérez les problèmes posés par la compression des données. Afin d'économiser de l'espace de stockage et de la bande passante, nous utilisons souvent des formats de fichier (tels que .jpg et .mp4) qui compressent leur contenu. Comment fonctionne la compression de fichier? Comment fonctionne la compression de fichier? On pourrait soutenir que la compression de fichiers est au cœur du fonctionnement du Web moderne, car elle nous permet de partager des fichiers dont le transfert prendrait trop de temps. Mais comment ça marche? Lire plus en quelque sorte. Les algorithmes de compression utilisés sont de deux types généraux: sans perte et avec perte.

  • Formats sans perte éliminer les redondances, en identifiant les morceaux du fichier qui se répètent et en les remplaçant par des descriptions plus courtes. Cela vous permet de reconstruire parfaitement le fichier original plus tard, mais ne peut que compresser autant les données (consultez le lien ci-dessus pour une métaphore visuelle du fonctionnement de ces algorithmes)..
  • Formats avec perte sont beaucoup plus puissants, mais viennent avec des compromis importants. Les formats avec perte fonctionnent en supprimant certaines informations sur le fichier d'origine, afin de pouvoir encoder le fichier dans moins d'espace. Ces algorithmes ne peuvent pas reconstruire avec précision le fichier d'origine, mais ils sont réglés de telle sorte que les informations supprimées tendent à être des informations que les utilisateurs ne remarquent pas. Ces algorithmes peuvent obtenir une réduction spectaculaire de la taille du fichier avec seulement une légère baisse de la qualité visuelle, et sont utilisés pour presque tous les fichiers audio, vidéo et les images..

C’est généralement une bonne chose: cela nous permet de télécharger du contenu de qualité supérieure beaucoup plus rapidement qu’il serait possible si nous étions bloqués dans des formats sans perte. Cependant, il existe un côté sombre pour les formats avec perte, et cela ressemble à ceci:

Lorsque vous ré-encodez un fichier dans un format avec perte, les données sont perdues. La conversion d'un format avec perte en un autre format avec perte double les dégâts. La vidéo ci-dessus a été générée en convertissant à plusieurs reprises entre deux formats avec perte plusieurs centaines de fois. À la fin, l’homme qui parle s’est dégradé en cauchemar de couleurs et de bruits. Ce processus s'appelle Déclin de la génération.

Lorsque les fichiers se déplacent sur Internet, sont copiés, sauvegardés, remixés et réencodés, cette perte de données s’additionne et les fichiers peuvent être fortement dégradés. Au fur et à mesure que nous améliorons les encodages avec perte et que les formats de fichiers moins efficaces ne sont plus pris en compte, les versions originales risquent d'être perdues.

Espérons que les studios de cinéma veilleront suffisamment à garder une version codée sans perte de Cool Hand Luke et Twelve Angry Men en sécurité quelque part, de sorte que nous aurons toujours des versions de haute qualité de ces fichiers. Cependant, ce n'est certainement pas le cas de la plupart des médias. Vos photos numériques pour bébé et vos vidéos personnelles se détérioreront lentement à mesure que vous les convertirez de formats obsolètes en nouveaux formats..

La même chose vaut deux fois pour le contenu en ligne. Les originaux de la plupart des vidéos YouTube n'existent probablement plus. Lorsque YouTube cesse d'exister et que ces vidéos sont migrées sur une nouvelle plate-forme, le processus de réencodage aura un impact positif sur la qualité. Quelques générations de plates-formes de partage de vidéos à venir, et même les vidéos qui restent assez populaires pour être copiées d'une plate-forme à l'autre seront dégradées de manière inacceptable..

Vint Cerf, le principal évangéliste de Google sur Internet, a longuement parlé des dangers qu'il y aurait à jeter toute cette information aussi cavalièrement que nous le faisons. Au cours d'une interview, Cerf a décrit comment, en 2005, l'historienne Doris Goodwin avait écrit un livre sur Abraham Lincoln et avait étudié ses habitudes en visitant des bibliothèques à travers le pays, en déterrant ses anciennes lettres et en reconstruisant les conversations qu'elles incarnaient. Cerf note qu'aujourd'hui, “ces lettres seraient des courriels et les chances de les retrouver seraient infimes 100 ans.”

Ce type de dégradation des données posera un problème énorme aux futurs historiens. Le XXIe siècle pourrait bien devenir un trou béant dans le record historique - un âge sombre numérique.

Pouvons-nous faire mieux?

Une solution à ce problème consiste à développer un stockage d'archives pouvant durer beaucoup plus longtemps avec moins de maintenance, afin de faciliter l'archivage des informations à très long terme. Un certain nombre de personnes intelligentes travaillent sur ce problème et nous avons rassemblé les meilleures données disponibles sur leurs technologies..

Alors disons que vous voulez sauvegarder un fichier pour un vraiment Longtemps. Comment devriez-vous le faire?

~ 50 ans

Solution: bande magnétique

Si vous n’avez besoin que de stocker vos données pendant quelques décennies à la fois, votre meilleur choix est probablement une bonne bande magnétique démodée (du type utilisé par les départements informatiques du monde entier). Stockée sous terre dans un environnement froid, sec et blindé magnétiquement, avec un bon degré de redondance, la bande magnétique est relativement stable par rapport aux CD ou disques durs classiques, et seulement environ trois fois plus chère que les disques durs bas de gamme gigaoctet).

~ 100 ans

Solution: disques optiques de qualité archive

Les CD classiques sont un moyen terrible de stocker des données: le support en aluminium ou en argent commence à s'oxyder dès que vous ouvrez l'emballage, et une qualité de fabrication médiocre peut entraîner d'autres problèmes. Ne vous attendez pas à ce qu'ils durent plus longtemps que quelques années, si vous les laissez accidentellement au soleil. Cependant, certains CD et DVD sont fabriqués avec un support en or et une qualité de fabrication bien supérieure. L'or ne s'oxyde pas, ce qui signifie que ces disques peuvent durer très longtemps. Il est difficile de savoir exactement combien de temps, car nous ne les avons pas depuis très longtemps, mais nous pouvons obtenir une bonne estimation en prenant les disques, en étant vraiment méchants avec eux, puis en essayant de récupérer les données: c'est ce qu'on appelle un traitement accéléré. test de vieillissement.

Sur la base de ces tests, les fabricants déclarent une durée de vie allant de 1 à 3 siècles. Pour une densité de données maximale, vous pouvez récupérer les rayons bleus archivés pour environ 2,5 gigaoctets par dollar, avec une durée de vie prévue de 200 ans. Les tests de vieillissement accéléré ne sont pas une chose sûre, mais vous pouvez sans doute compter dessus pendant un siècle environ. En prime, contrairement à la bande magnétique, ils ne nécessitent aucun équipement spécial pour lire et écrire, les coûts de démarrage sont donc minimes..

~ 1000 ans

Solution: M-Discs

Ok, oublie ça “siècle” non-sens, passons au sérieux. Pour vous donner une idée de l'échelle de temps, il y a mille ans, le comte Eric Haakonsson a interdit pour la première fois les berserkers en Norvège. Voilà ces types gravés sur une plaque de bronze découverte au 20ème siècle:

Jusqu'à récemment, il n'y avait pas beaucoup de bonnes options industrielles pour ce type d'échelle de temps. Cependant, récemment, une option excitante est apparue, appelée "M-disc". Ce sont des DVD d'archives constitués d'une épaisse couche d'un “comme une pierre” composite minéral conçu pour être gravé par des graveurs spéciaux (bien qu’ils puissent être lus par des lecteurs de DVD normaux). Celles-ci sont absurdement robustes et devraient survivre au moins mille ans. C’est une affirmation ambitieuse, mais la société a des recherches solides (y compris une étude du département de la Défense des États-Unis) à l’appui.

Ces disques sont même relativement bon marché, à 5,7 gigaoctets par dollar, bien que vous ayez également besoin d'un graveur spécial. Si vous êtes sérieusement intéressé à stocker un lot des données pendant longtemps, les disques M sont clairement gagnants.

~ 10 000 ans

Solution: Gravure de métaux extrêmement stables

C’est là que nous commençons à nous éloigner un peu des sentiers battus. À l'heure actuelle, aucun format lisible numériquement ne peut survivre près de dix mille ans. Cela signifie qu'il sera très difficile de récupérer toutes les données archivées pendant cette durée. Qu'est-ce que la récupération de données et comment cela fonctionne-t-il? Qu'est-ce que la récupération de données et comment ça marche? Si vous avez déjà subi une perte importante de données, vous vous êtes probablement déjà posé la question de la récupération de données - comment cela fonctionne-t-il? Lire la suite . À certains égards, ça va - ce n'est pas comme si les lecteurs de DVD seraient là dans dix mille ans.

Alors, comment stockez-vous les données pendant si longtemps? La réponse est que les seuls matériaux qui peuvent survivre à ce type d'échelles de temps sont des métaux et des pierres précieuses chimiquement stables. Cette technologie a déjà été utilisée dans la pratique pour les disques Voyager - disques dorés, gravés d'informations représentant l'audio et les images, qui ont été lancés à bord de la sonde Voyager. La sonde est en train de sortir du système solaire afin de fournir un record durable de l'humanité aux extraterrestres.

La nanolithographie est une approche moderne de la question. Une société appelée Norsam a adapté les techniques de lithographie développées à l'origine pour la gravure de semi-conducteurs et peut les utiliser pour graver des motifs fins sur des surfaces telles que le diamant ou le nickel. La résolution est correcte (environ 165 gigaoctets par disque de 12 centimer) et pratiquement indestructible. Stockés en toute sécurité, ces disques devraient durer des milliers d'années et survivre aux EMP, à la plupart des incendies et à l'effondrement de la civilisation humaine. Les informations sur les prix ne sont pas facilement disponibles, mais “coûteux” est une très bonne supposition.

Une des premières applications de cette technologie a été la création de technologies modernes. “pierre de Rosette” des plaques en titane, à stocker dans des endroits sûrs du monde entier, contenant environ des milliers de pages de texte, traduites dans de nombreuses langues, constituent une référence pour les futurs historiens en cas de perte de certaines langues modernes. Les disques ont également l’air incroyablement cool:

Plus de 100 000 ans

Soyons clairs: si vous magasinez pour un stockage sur ordinateur et que le titane nano-gravé a une durée de vie trop courte pour vous, votre horizon de planification me terrifie. Il y a cent mille ans, les premiers hommes ont commencé à s'aventurer du continent africain vers l'Europe. Si vous vous souciez vraiment de la survie de vos données numériques aussi loin dans l'avenir, alors vous avez quitté le ken de simples mortels, et probablement aussi la santé mentale et le bon sens.

Ce qui ne veut pas dire que vous n'avez pas d'options.

Solution: ADN Fossilisé

L'un des avantages de la révolution biotechnologique est qu'il existe de nombreuses sociétés qui créeront pour vous un ADN personnalisé à partir d'une série de paires de bases que vous fournissez, en ligne, moyennant un coût marginal. Chaque paire de base a quatre combinaisons possibles, qui peuvent stocker deux bits. Les données peuvent ensuite être lues en séquençant ces gènes à une date ultérieure, en utilisant diverses techniques. Cela permet à l'ADN de servir de type de stockage de données exotiques. Désormais, vos chaînes d'ADN personnalisées ont une durée de vie assez courte et se décomposent chimiquement à la température ambiante dans quelques années. Il y a plusieurs façons de prolonger sa durée de vie.

Vous pouvez fusionner vos données dans l'ADN d'un organisme ayant une longue vie, comme le pin Bristlecone du Grand Bassin (dont on sait qu'il vit plus de cinq mille ans). Parce que ces arbres peuvent se reproduire, votre préoccupation principale est alors de les protéger des nombreux incendies à grande échelle, impacts de météores et éruptions volcaniques qui se produiront dans le futur. Vous pourrez peut-être faire survivre vos données pendant quelques dizaines de milliers d'années en plantant plusieurs forêts d'arbres d'archives dans des endroits sûrs et éloignés; mais - bien sûr - vous n'êtes pas intéressé par ces petites pommes de terre.

Afin de vraiment tirer votre argent de votre stockage d'ADN, vous devez le réparer chimiquement afin de le protéger contre les modifications chimiques et les pannes radioactives. Les chercheurs ont trouvé un moyen d'intégrer l'ADN dans du verre en fusion afin de créer un “fossile synthétique” cela protégera l'ADN pendant de très longues périodes. Le processus est basé sur la fossilisation naturelle et a été développé après la révélation qu'il est souvent possible d'extraire l'ADN intact de fossiles datant de plusieurs millions d'années. Avec une utilisation appropriée des codes de correction d'erreur et de la redondance, il n'y a aucune raison pour que vous ne puissiez pas conserver plusieurs giga-octets d'informations pendant des millions d'années à un chiffre..

En termes de rapport coût-efficacité: si vous êtes préoccupé par le prix, cette méthode de stockage ne vous convient pas. Ce n'est pas un processus commercial, loin de là. Vous allez dépenser au moins des centaines de milliers de dollars pour la fabrication et la préservation de l'ADN. Ce n'est pas une entreprise pour les faibles de cœur. C'est quand même une option, et si vous voulez vraiment vous assurer que les données les plus importantes sur Internet sont encore disponibles longtemps après la disparition de l'humanité, il est en votre pouvoir de le faire..

Êtes-vous préoccupé par l'âge sombre du numérique? Quelles données voulez-vous conserver pour les générations futures? La discussion commence dans les commentaires!

Crédits image: clé usb brisée Via Shutterstock, “Berzerkers,” par Wikimedia, “En coupe,” par M-Disc, “Rosetta,” par la Long Now Foundation, “Rainbow CD,” par Wikimedia, “Bande magnetique,” par Wikimedia, “Capsule temporelle,” par Wikimedia, “Record de Voyager,” par Wikimedia, “Fossile,” par Wikimedia

En savoir plus sur: Stockage en nuage, sauvegarde de données, récupération de données, stockage.