Ce n’est ni de la physique, ni de la science des matériaux, ni de la chimie de pointe, domaines traditionnellement associés aux supercalculateurs. Le projet Spresso, issu d’une coopération entre Meluxina, la Bibliothèque nationale du Luxembourg (BNL) et des chercheurs du Centre pour l’Histoire contemporaine et digitale (C2DH), ainsi que du département informatique de l’Université du Luxembourg, vise à «explorer l’amélioration automatique à grande échelle des photographies de journaux historiques du 20e siècle au moyen d’algorithmes d’apprentissage profond», explique l’Uni.
L’intérêt: faciliter le travail des historiens, pour qui les photographies de presse de l’époque constituent une source essentielle. Or, elles ont été imprimées selon un procédé appelé «demi-teinte», dont la qualité n’est pas idéale, avec son motif de points.

Le projet Spresso élimine les motifs réduisant la qualité de photographies de presse datant du 20e siècle. (Photo: Uni.lu)
Applicable sur plus de 3 millions d’images
Le projet s’est concentré sur les copies numériques d’images en demi-teinte fournies par le projet Impresso, une coopération entre le C2DH, l’Université du Luxembourg, l’EPFL de Lausanne et l’Université de Zurich, ainsi qu’un large éventail d’archives, de bibliothèques et de journaux au Luxembourg et en Suisse. À partir de celles-ci, l’algorithme a créé de nouvelles images synthétiques en éliminant les motifs qui réduisaient leur qualité.
Après avoir testé différents algorithmes sur un ensemble de 10.000 images, Dany Pais da Silva, ancien étudiant en informatique, sous la direction du professeur Luis Leiva, a mis en œuvre un prototype de pipeline pour la conversion des images historiques sur les installations de calcul haute performance de l’université. Avec le soutien des ingénieurs de LuxProvide, l’équipe a pu transférer le processus sur le supercalculateur Meluxina, permettant une mise à l’échelle pour l’appliquer à plus de 3 millions d’images. «Obtenir l’accès aux images brutes a été un défi pour nous, car nous avons dû les transférer de leur source originale à Meluxina, puis les ramener dans les locaux de l’université», explique le professeur.
Le nouvel ensemble de données sera réinjecté dans l’application Impresso pour fournir aux historiens et au grand public ces images de meilleure qualité.