Comment construire une solution IA sans données préalables?

L’intelligence artificielle peut être d’une aide précieuse dans le secteur bancaire, notamment pour animer un système de détection de transactions frauduleuses. Toutefois, est-il possible de mettre en œuvre cette technologie quand on ne possède pas de données préalables?

Les spécialistes du secteur s’accordent en général à le dire: pour mettre en œuvre une solution utilisant l’intelligence artificielle, il faut disposer d’un grand nombre de données numérisées, correctement structurées. Doit-on dès lors, dans le cas contraire, laisser tomber l’idée d’utiliser cette technologie, alors même qu’elle s’avérerait précieuse pour résoudre un problème crucial pour un secteur d’activité particulier ? Pas forcément, selon Dimitrios Kampas, Data & Analytics Lead au sein de Lighthouse, le Center of Excellence for Data & Analytics de KPMG Luxembourg. «Un de nos clients – une grande banque internationale – nous a demandé s’il était possible de concevoir un système permettant de détecter les transactions frauduleuses dans le marché financier du gré à gré», explique-t-il. «Nous avons tout de suite pensé à une solution d’intelligence artificielle pour répondre à cette demande spécifique. Toutefois, l’institution ne disposait d’aucune donnée préalable sur ces transactions frauduleuses, ce qui est problématique quand on veut utiliser cette technologie, qui se construit la plupart du temps sur des données déjà récoltées.»

Simuler des données

Convaincues qu’une solution reposant sur l’intelligence artificielle était définitivement la plus adaptée, les équipes de KPMG se sont tout d’abord concentrées sur le comportement des fraudeurs. «Nous devions essayer de comprendre leur manière d’agir, encore une fois sans disposer de données issues de notre client», indique Dimitrios Kampas. «Pour établir un profil type, nous avons sondé toutes les personnes qui, en interne, avaient travaillé sur ce sujet. Sur cette base, nous avons pu simuler des données, c’est-à-dire des transactions frauduleuses types.»

Toutefois, pour créer un système capable de repérer les transactions frauduleuses à la source, il fallait croiser ces données simulées, issues de l’observation du mode opératoire des fraudeurs, avec le comportement des clients «normaux», non-fraudeurs. «Pour que nous puissions savoir à quel moment il faut donner l’alerte par rapport à une opération suspecte, nous devions également éplucher le comportement des clients: si un client avec un compte particulier a pour habitude de faire ses transactions entre midi et 18h et qu’on constate qu’une transaction suspecte a lieu à 5h, un premier signal d’alerte est donné», détaille Dimitrios Kampas. «Au fur et à mesure, l’outil finit par définir des ‘patterns’ du comportement des clients, qui sont de plus en plus fiables.»

Alerter ni trop tôt ni trop tard

Pour s’assurer de ne pas décréter qu’une transaction est frauduleuse trop rapidement, l’intelligence artificielle créée par KPMG pour ce client particulier fonctionne sur un système de crédits. Pour qu’une transaction soit considérée comme une fraude, une ou plusieurs irrégularités – c’est-à-dire des comportements inhabituels pour le client – doivent être repérées dans la transaction. Chaque irrégularité est pénalisée par un certain nombre de points. La définition de ces pénalités, du score total attribué aux transactions suspectes ainsi que du seuil pour signaler une fraude, s’affine de manière automatique sur la base des données réelles et des retours des collaborateurs.

La solution, qui est aujourd’hui 100% opérationnelle, fonctionne alors comme n’importe quelle intelligence artificielle: elle apprend de manière indépendante, sur base des données qu’elle récolte, et devient de plus en plus précise et efficace. Pour KPMG Luxembourg, il s’agissait du premier projet d’intelligence artificielle pour lequel aucune donnée préalable n’était disponible. «Dans d’autres situations, nous avons dû générer de manière synthétique des données fondées sur d’anciennes fraudes afin d’équilibrer la proportion mineure de cas de fraude par rapport aux cas ‘normaux’ dans l’ensemble des données que nous possédions. De la sorte, nous améliorons les capacités d’apprentissage statistique du système. Mais ce projet est en effet le premier où l’on partait vraiment de rien. Il est assez encourageant de constater que le manque de données n’est pas vraiment un frein à la construction d’une solution d’intelligence artificielle capable de s’adapter à chaque transaction individuelle, à chaque personne», conclut Dimitrios Kampas.