En informatique, il existe souvent une option paresseuse qui consiste à éviter d’adresser des problèmes qu’on a aujourd’hui en espérant que la technologie de demain y apportera une solution. On appelle ça la fuite en avant. Les fabricants de logiciels en sont malheureusement de fervents adeptes: ils ont trop souvent tendance à utiliser dans leurs logiciels des composantes qui comportent des portions de code mal optimisées ou conçues pour d’autres fins, créant ainsi des goulots d’étranglement de performance. L’amélioration de la performance des unités centrales et la mémoire additionnelle règlent quelquefois les problèmes à moyen ou à long terme sans qu’on ait à intervenir. Microsoft s’est fait prendre à ce petit jeu avec la mise en marché de Windows Vista: force est de constater que les équipements n’étaient pas prêts et que la performance n’était pas au rendez-vous. On s’est remis à la tâche, on a ré-écrit le code et surprise! Windows 7 fait la même chose en beaucoup plus rapide!
Pourtant, ce qui semble la solution de la facilité devient parfois pleinement justifié. C’est à mon avis le cas en ce qui concerne l’archivage des données. En géomatique, notre réputation est faite et méritée comme étant de grands utilisateurs de stockage. Les développements récents et la multiplication de produits d’imagerie géospatiale contribuent à nous confirmer dans notre position de champions toutes catégories pour les besoins de stockage des organisations. Bon, le titre est peut-être éphémère: il y a tout le secteur du multimédia qui nous fait aujourd’hui concurrence et pourrait nous voler le titre éventuellement, mais sauf exception, les organisations n’ont pas encore tendance à conserver des filmothèques ou des vidéothèques numériques.
Nous parlons de téra-octets depuis quelques années et le péta-octet est sur le point de faire son apparition. Avec très peu de recul, on peut facilement se remémorer la période où le giga-octet était de mise et pour ma part, je remonte facilement à l’ère du méga-octet. On ne parle pas ici de trois ordres de grandeur (1000) mais bien de neuf (1000000000), c’est pas rien! Il y a ici un excellent candidat pour la fuite en avant.
Là où je veux en venir, c’est qu’à chaque époque, l’archivage de l’information pose un problème, parce que les organisations doivent souvent conserver les données géospatiales passées pour des périodes allant jusqu’à perpétuité et qu’on est habitué à utiliser le terme “archives” pour représenter ce type de conservation. Dans notre vécu associé au monde du papier, des archives sont des boîtes de papier conservées à demeure dans une voûte ou un espace sécuritaire, mais tout de même accessible, à l’abri des attaques du temps. En informatique, on pense immédiatement à des supports magnétiques ou magnéto-optiques et à des armoires de rangement. Dans ce dernier cas, le paradigme avec le papier ne tient pas la route: pour le papier, le système de lecture (nos yeux) est stable dans le temps alors que pour les archives électroniques, le système de lecture doit être archivé avec la donnée parce qu’il est requis pour y accéder. En clair, pour lire les rubans magnétiques 9 pistes des années 80 (Max. 250 MO), il faut un dérouleur de bandes de l’époque avec son interface, son logiciel de contrôle et même un ordinateur compatible; pour lire la cassette DAT des années 90 (2-4 GO), il faut une unité DAT et son logiciel de l’époque et pour lire la cassette DLT des années 2000 (40-400 GO), il faut une unité DLT et son logiciel de l’époque. Un autre paradigme qui ne tient pas bien la route avec les nouvelles technologies, c’est la stabilité du médium: le papier peut se conserver des centaines d’années avec des précautions minimales, alors que les meilleurs supports de données numériques ne dépassent pas 25 ans de conservation.
C’est ici que la fuite en avant vient à notre rescousse! Si notre croissance en termes de données est normale et régulière, les données d’hier peuvent aisément représenter une proportion acceptable par rapport aux données courantes et on peut les conserver en ligne à perpétuité. Cette assertion paraît farfelue? Pas si sûr, voyons un exemple: avec une croissance régulière de 20% par année, une organisation qui avait besoin de 1 giga-octet de stockage en 1980, peut-être au coût de 50000$, aurait besoin de 240 giga-octets en 2010 (quelques centaines de dollars) pour stocker l’ensemble des actifs des 30 dernières années. Un autre exemple? Avec la même croissance annuelle de 20%, une organisation qui archivait 10 téra-octets d’imagerie dans un SAN en 2000 (0,5-2M$) en serait à 62 téra-octets en 2010 (0,2-1M$). On peut s’amuser avec les chiffres et se faire des scénarios, mais les références du passé confirment jusqu’à une croissance annuelle de 30 à 35% pour rester confortablement à l’intérieur des limites de l’amélioration continue des rapports stockage-coûts tout au long des années. Si le passé est garant de l’avenir, on pourrait donc conserver toutes nos archives passées dans un système de stockage en ligne, sans se soucier des problèmes d’accès à des technologies périmées et à des médias devenus illisibles avec le temps. La sécurité des données est quant à elle toujours assurée par le système de copie de sécurité du moment, qui conserve des copies qui ne seront utilisées qu’en cas de bris d’équipement causant des pertes de données: on garde à l’esprit que la copie de sécurité n’est pas une archive.
Comme quoi la fuite en avant, comme le changement de point de vue (la parallaxe) a parfois des avantages…
André Verville
Géomatique Verville
parallaxe@averville.ca
