ENTREPRISES & STRATÉGIES — Technologies

Doc en stock

Doc en stock



Paperjam

L'entreprise regorge de mégas, de gigas, et de plus en plus de teras et de petabytes d'information et de documents ? qu'il faut bien organiser, stocker et archiver quelque part de manière sécurisée

Sans information, l'entreprise ne peut plus fonctionner. La perte d'une information peut même conduire à la ruine. Les données doivent être conservées, protégées, gérées et partagées sur toutes les plates-formes informatiques et dans tous les environnements. Pour Jean-François Vander Meersche, responsable stockage grand compte chez IBM, "les clients ne font plus de différence entre les petites et les grandes données". La perte d'un e-mail peut être critique, aussi désuet que cela puisse paraître. Certes, on conviendra que les données les plus critiques pour une banque seront celles liées au transactionnel (fichiers clients, opérations sur les comptes, transactions boursières), et peut-être pas les documents Word usuels!

Les informations liées à la base de données seront stockées dans un environnement spécifique par une application, tandis que le stockage des documents moins critiques sera généralement géré par l'utilisateur, qui choisira - lui-même ou à l'aide d'un logiciel - l'endroit du réseau destiné à accueillir le document. Jean-François Vander Meersche continue: "Aux utilisateurs à gérer le degré de criticité des données? on peut faire huit copies de la même base de données clients d'une entreprise, mais pas des fichiers Word 'traditionnels', cela coûterait trop cher. On assure différents niveaux de protection'.

Digitaliser

La School of Information Management & Systems de Berkeley, dans une étude sponsorisée par EMC, leader mondial des systèmes de stockage, nous apprend qu'environ 93% de l'information produite chaque année est stockée sous forme digitale. Le représentant d'IBM continue: "Evidemment, tout peut arriver, et même si nous appliquons la tolérance zéro en matière de sécurité, les données les plus critiques sont, en fin de chaîne, stockées également sur bande, dans un endroit sécurisé, en plus du stockage sur réseau".

Les supports tels que les bandes magnétiques ou encore les disques optiques n'ont donc pas encore tiré leur révérence, loin de là. Le papier non plus (voir plus loin, avec les solutions de LAB), bien que le 11 septembre lui ait porté un coup bas. Wilbert Hawinkel, Technical Business Consultant chez EMC, revient sur ces images de milliers de papiers qui flottaient dans les airs et s'amassaient dans les rues new-yorkaises : "Ils sont tous irrémédiablement perdus! Je ne pense pas que beaucoup de sociétés avaient prévu une seconde copie de ces archives dans un autre endroit. Dans le WTC, on retrouvait pas mal de sociétés liées au domaine juridique, que la loi américaine soumet à certains délais quant à la conservation des documents. Tout à coup, il n'y avait plus rien. Il y a des sociétés qui, actuellement, doivent se rendre chez leurs clients pour faire des photocopies des documents originaux et recréer ainsi l'archive. Cela coûte évidemment énormément".

On se dirige donc de plus en plus vers des solutions de digitalisation des documents, qui sont stockés dans un système qui permet d'avoir automatiquement une seconde copie à distance ? une "copie miroir", dans un centre propre au client ou à un prestataire de confiance - ce qui augmente le niveau de sécurité et de protection des archives contre les sinistres.

La digitalisation du papier ne concerne pas seulement l'archivage, mais également le stockage et la gestion électronique de celui-ci. Ainsi, Benoît Dome, directeur insurance industry chez Fujitsu Consulting, estime que le secteur des assurances a beaucoup à gagner de la digitalisation en termes de workflow: "La gestion du papier est un grand challenge dans ce domaine. Numériser les documents et les indexer dans un dossier électronique propre à chaque gestionnaire permet d'augmenter l'efficacité opérationnelle. En outre, cela réduit la superficie d'archivage nécessaire. Comme cela se fait déjà en Belgique ou au Canada, nous conseillons de numériser le courrier et les faxs entrants, de convertir les dossiers existants au format numérique".

Inutile de préciser qu'un document numérisé se conservera mieux et plus longtemps qu'un document papier rangé au fond de votre coffre-fort. LAB propose le "document imaging", soit la copie du papier (mais aussi du micro-film, de la micro-fiche) sur un support électronique tel que le CD-Rom. Ainsi, la copie papier est gardée en un endroit sécurisé, tandis que le CD-Rom peut être utilisé aussi souvent que désiré, sans crainte de détérioration. Le "batch scanning" scanne rapidement les documents et les indexe dans des boîtes A4 en utilisant ArcStore, le logiciel développé par LAB (voir ci-contre), tandis que l'?Index scanning" permet une indexation selon les critères spécifiques  de l'utilisateur, et donc une recherche plus performante sur ArcStore.

Supports physiques

Les informations digitalisées mais non protégées par une copie à distance doivent être transférées sur support informatique (ou papier), et placées régulièrement dans un environnement sécurisé. C'est notamment dans ce cas que peut intervenir LAB, spécialisé dans l'archivage (papier, virtuel et sur support numérique), principalement à destination du secteur financier, dont le centre sécurisé et les dix dépôts situés aux alentours de Luxembourg permettent la gestion des "computer media" (entendez les supports physiques de stockage: microfilms, cassettes magnétiques, CD, computer back-up tapes, rayons X,?).

Patrick Lowe, managing director de LAB, explique: "Le Lab Data Centre fournit des pièces individuelles ou des espaces partagés modulaires pour les clients, le tout dans un environnement totalement sécurisé". Situé à 10 km de Luxembourg, le LAB Data Centre est conçu spécialement à cet effet et son bâtiment est totalement équipé au niveau de l'infrastructure électrique (UPS, Uninterruptible Power Supply), des générateurs de back-up (huile et gaz) et du transformeur dédié. À cela s'ajoutent entre autres un système d'alarmes de pointe, la surveillance caméra constante, un personnel de sécurité sur le site, la détection de fumée, de feu et d'intrusion et un accès contrôlé électroniquement (accès direct à l'alarme et à Securicor).

L'externalisation de la gestion des données permet notamment de gagner de l'espace, mais aussi de gagner en sécurité sur d'autres points: toutes les salles sont équipées de flooring anti-statique, contrôle de l'humidité et de la température, protections anti-feu, alarmes feu et fumée, le tout dans un véritable "bunker". Les boîtes spécifiques qui recueillent les supports sur lesquels sont agglutinées les données disposent d'un numéro d'identification unique. En outre, les utilisateurs des données n'ont plus à perdre leur temps pour les rechercher: via ArcStore, ils les retrouvent facilement.

Le stockage multi-sites des back-up sur support media est possible pour une sécurité additionnelle, et le service ?Express? de LAB garantit des livraisons dans les 2 heures pour une commande faite avant 14h, toujours effectuée via ArcStore. Un numéro de téléphone d'urgence est mis à disposition pour une livraison en dehors des heures de bureau.

Dernière étape dans la vie des supports physiques: leur destruction, assurée également par LAB via des containers sécurisés collectés régulièrement. Toujours en utilisant ArcStore, le client peut définir une date de destruction de ces données. Un processus sécurisé sera alors appliqué, incluant "l'ink removal', le déchiquetage et même un certificat de destruction. En outre, une collecte journalière des documents à détruire peut être organisée, les papiers étant transportés depuis les containers de destruction installés chez le client jusqu'à chez LAB dans des sacs de sécurité et, bien sûr, des fourgons qui le sont tout autant.

Types de connexion

Revenons-en à l'immatériel. Il existe principalement trois types de connexion entre le client et ses données, répondant aux doux noms de DAS (direct attached storage), NAS (network attached storage) et SAN (storage area network).

Le système DAS qui, schématiquement, concernait la mise en place sur un serveur d'un disque dont les données étaient physiquement attachées au boîtier, a progressivement été abandonné au profit des disques centralisés. Le SAN est un réseau dédié uniquement aux données. Dans l'entreprise, un LAN permet de connecter tous les postes de travail à leurs serveurs. Le même principe est appliqué au stockage avec le SAN:  grâce à un réseau, on connecte un ensemble de disques centralisés à tous les serveurs. Le SAN coexiste avec le LAN. Le NAS connaît un succès grandissant depuis environ 3 ans. Dans ce système, on ne crée pas un SAN à côté du LAN, mais on superpose une couche de données au réseau LAN. Jean-François Vander Meersche explique l'importance de l'évolutivité: "L'offre d'IBM permet de combiner le SAN au LAN. On commence avec un NAS sur un LAN et, une fois que l'entreprise grandit et qu'il faut des capacités beaucoup plus importantes et une sécurité accrue, on peut passer à un réseau SAN propre qui peut être connecté au NAS. L'activité des clients peut donc croître sans qu'ils aient trop à dépenser". 

EMC combine aussi NAS et SAN - on parle de ?networked storage? - et intègre les deux technologies dans le logiciel HighRoad.

IBM présente également un système plus récent, basé sur le protocole iSCSI. Grâce à ce SCSI sur IP, IBM fait transiter les données de manière transparente pour l'utilisateur, quel que soit le type de réseau choisi. On peut donc commencer par un NAS, puis un SAN, et enfin le combiner avec iSCSI. Jean-François Vander Meersche explique ainsi que les serveurs ont été les pièces maîtresses des années nonante, mais que la problématique s'est déplacée depuis: "Utiliser une multiplicité de serveurs plutôt qu'un seul mainframe compliquait la gestion. Hier, les données étaient attachées à ces serveurs. On assiste à un courant de recentralisation des données: les machines continuent le pull des disques sur lesquels les clients mettent toutes les données. Si le serveur tombe en panne, cela ne pose pas de problème, il est remplacé. Dans tous les cas, les données n'ont pas été affectées?.

Nouveau: le CAS

Les systèmes s'adressent plutôt aux données variables, telles que les transactions, les inventaires des entreprises de production, ? En complément, ils sont rejoints par un petit dernier, le CAS (content addressed storage), lancé fin avril par EMC. Selon la School of Information Management & Systems de Berkeley, pas moins de 75% de l'information stockée sous forme digitale est du "fixed content", c'est-à-dire une information à stocker sous sa forme finale, car elle ne va plus être modifiée. EMC anticipe et lance le Centera, système CAS qui offre l'avantage de ne plus avoir à archiver sous forme papier, microfilm, bande magnétique ou disque optique les documents, mais online.

Ce n'est pas seulement un produit nouveau, mais une nouvelle segmentation dans le marché du stockage. De plus en plus d'informations sont créées sous forme digitale dès le premier jour, et sous forme rich media. De plus en plus aussi, on veut avoir accès à ces documents immédiatement à partir du réseau. Le CAS permet une rétention sur le long terme (en dizaines d'années), une capacité de stockage énorme (de 5 terabytes à 1 petabyte) et propose un accès indépendant du lieu. En effet, peu importe pour l'utilisateur de savoir où une donnée est stockée. Il veut simplement y accéder rapidement. Au lieu de stocker des documents sur un PC en sauvegardant sur un certain driver dans une structure de répertoire ("location dependant"), on stocke les données en utilisant le contenu binaire des documents, en calculant une clé unique au document qui devient la référence pour le retrouver. En calculant la clé unique, si après 10 ans on va rechercher les documents pour les réutiliser, on peut utiliser la clé. Si la clé recalculée est la même, on peut donc garantir que le contenu n'a pas été changé. Centera élimine aussi la duplication: si un même document arrive dans le Centera, il recalcule la même clé unique, et on sait qu'il est déjà stocké.

EMC: une solution complète

tocker les données et informations, les protéger et les gérer activement demanderait quatre couches, que l'on retrouve à la fois dans les solutions à succès Clariion et Symmetrix:

- La plate-forme matérielle

- Les fonctionnalités qui tournent sur cette plate-forme, et qui vont permettre d'activement protéger les données, comme c'est le cas des solutions avec miroir à distance.

- Le réseau de stockage: SAN, NAS  - regroupés sous l'appellation "network infrastructure storage" ou le tout nouveau CAS, c'est-à-dire toutes sortes de technologies permettant de connecter les applications aux informations, donc le serveur au système de stockage. EMC prend une position neutre vis-à-vis des typologies existantes, selon les besoins, et peut conseiller le SAN et le NAS à la fois.

- La gestion de l'environnement: depuis octobre 2001, EMC propose la stratégie "AutoIS", qui veut rendre le stockage plus simple, plus automatisé et plus ouvert en gérant notamment les équipements de Compaq ou encore IBM.  Symmetrix permet par exemple une optimisation du placement des données. Il existe des logiciels qui vont analyser les chargements des systèmes de stockage pour que la charge soit bien balancée sur toute la machine.

LAB: ArcStore, logiciel de gestion de bases de données

Véritable fer de lance de LAB, le logiciel ArcStore est l'outil roi pour le client: il lui permet de gérer tous les aspects de ses besoins quotidiens en données papier, supports physiques et documents scannés. A partir de son desktop (et bientôt à partir d'une interface web sécurisée), l'utilisateur peut donc gérer les nouvelles archives, les livraisons de données, la rotation des back-up, la destruction (en utilisant ArcStore plus),? Il crée un système de numbering unique qui identifie chaque archive et assigne à chacune des propriétés comme la date de destruction, le type d'archive dont il s'agit et s'il a été numérisé. Le logiciel est également disponible pour gérer et stocker les archives indépendamment de Lab.

Comme toujours, la sécurité est de mise, et les informations sensibles à propos des bases de données, images scannées et listings de données sont donc encryptées à des niveaux élevés (utilisation de SSL ? secure sockets layer ? le protocole de sécurité standard qui encrypte toutes les informations qui sont transférées).

IBM: le concept d'Enterprise Storage Globalisation

Le client demande des solutions qui s'appliquent à ses besoins de solidité, de redondance, de multicopies sur des sites à longue distance. Il désire aussi que les données existent de manière non redondante inutilement, qu'elles soient disponibles uniquement pour les personnes qui en ont les droits d'accès. C'est ce que propose IBM avec son architecture unique "Total Storage".

Du côté du hardware, les disques (on parle de capacités allant jusqu'à 70, 140 voire 181 gigas), "tapes" (IBM a récemment annoncé la première cassette avec une bande d'1 térabyte!) et autres bandes de stockage.

Du côté du software, les produits Tivoli (logiciels multifacettes pour la gestion de l'informatique de l'entreprise, dont un des aspects est le stockage) s'intègrent dans la gestion informatique du système chez le client, que le système de stockage soit NAS, SAN ou eSCSI.

Entre les deux, l'aspect services, crucial depuis la conception, le cahier des charges et la livraison clés en mains de la solution de stockage, pour les petits besoins (quelques gigas sur disque) comme les grands (dizaines de térabytes sur disque).

On a migré de l'aspect "mon serveur, mon application' multiplié par 100, voire par 1.000, qui était trop dangereux en cas de panne, à une centralisation des données non sur les serveurs mais, chez IBM, dans un "ESS" (Enterprise Storage Server), sorte de grosse boîte qui contient physiquement les données sur disques avec une solution de duplication, cette redondance pouvant se situer à distance sur un autre site, ou encore sur la même machine. Au client à mettre les barrières en droit d'accès pour les données plus ou moins critiques qui coexistent.

Elle permettra aux clients de partager leurs données sur des environnements matériels concurrents. Dans l'avenir, un aspect de plus en plus essentiel sera la virtualisation. IBM a d'ailleurs conclu un accord avec Hitachi sur le développement en commun de celle-ci. Hitachi et IBM continuent à produire leurs machines propres, qui pourront coexister chez le client.