ABBYY Europe, membre du groupe ABBYY, principal fournisseur de technologies de reconnaissance de documents et de linguistique, et la société de service en numérisation et publication de données AIS, annoncent aujourd'hui l'utilisation du module de reconnaissance optique des lettres gothiques et des langues européennes anciennes d'ABBYY pour la numérisation des textes officiels législatifs du Mémorial A du Luxembourg et notamment la partie concernant la législation.
Ce projet d'ampleur s'inscrit dans la volonté de l'Etat Luxembourgeois de publier l'ensemble des recueils en ligne, sur le site www.legilux.lu, portail juridique du Gouvernement du Grand-Duché de Luxembourg. La société AIS en charge de la prestation a choisi la solution FineReader XIX d ‘ABBYY en raison des particularités linguistiques et typographiques de l'important corpus.
Une volonté : offrir au public l'accès aux textes législatifs
Le site www.legilux.lu, portail juridique en ligne du Gouvernement du Grand-Duché de Luxembourg, doit permettre au grand public ainsi qu'aux professionnels d'accéder à la législation Luxembourgeoise. Le Journal Officiel Luxembourgeois a été organisé en 3 recueils distincts : les Mémorials A, B et C. Le Mémorial A est un recueil de législation, il contient les actes législatifs et réglementaires, le Mémorial B est le recueil administratif et économique, tandis que le Mémorial C est le recueil des sociétés et associations.
Une problématique complexe: une typographie ancienne et des textes bilingues
Les recueils du Mémorial A postérieurs à 1937 ont facilement été mis en ligne, mais la tâche s'est avérée plus complexe lorsqu'il s'est agi de numériser les éditions antérieures du Mémorial A qui se présentaient sous forme de livres épais, à la reliure aléatoire. Si ces inconvénients constituaient à eux seuls une problématique suffisante dans le traitement des recueils, il est une autre particularité qui a justifié la nécessité de faire appel à un spécialiste des services en numérisation de données : le texte natif du Mémorial A est une alternance de textes en gothique allemand (Fraktur) et en français, une particularité que le Luxembourg doit aux relations étroites qu'il entretient avec les deux nations voisines.
C'est la société AIS, par l'intermédiaire de l'association momentanée Imprimerie centrale/Victor Buck, qui a été choisie pour réaliser cette numérisation ambitieuse. La société AIS est spécialisée dans la reprise et l'utilisation de données complexes à échelle industrielle. Elle réalise pour ses clients les traitements de masse permettant d'accéder aux données de manière structurée et de les publier simultanément sur plusieurs média au moindre coût.
Au total, d'ici la fin 2006, les 150 tomes du Mémorial A, datés de 1837 à nos jours, soit environ 120 000 pages, vont être numérisées, puis transformées en PDF sécurisés, format « texte caché » (l'image d'origine apparaît avec le texte en-dessous : l'utilisateur a la possibilité de sélectionner le texte et de le réutiliser dans un autre document grâce à la fonction copier/coller).
«Nous sommes très fiers d'avoir été choisis par la société AIS et associés à un projet de conservation et de numérisation du patrimoine législatif Luxembourgeois. FineReader XIX est le fruit de notre expertise éprouvée en reconnaissance optique de caractères et de notre savoir-faire en linguistique. La confiance que nous accorde AIS prouve également que la technologie ABBYY est particulièrement indiquée pour les oeuvres complexes, multilingues, ainsi que pour les textes anciens. Nous ne doutons pas que cette collaboration déjà fructueuse devrait déboucher sur d'autres projets de cette ampleur. », affirme Jupp Stoepetie, Directeur ABBYY Europe.