Le lundi 27 janvier 2025, le cours de l’action Nvidia a chuté de 17%, effaçant près de 540 milliards de dollars de valeur boursière – la plus grande perte jamais enregistrée par une entreprise en une seule journée dans l’histoire. (Photo: Nvidia)

Le lundi 27 janvier 2025, le cours de l’action Nvidia a chuté de 17%, effaçant près de 540 milliards de dollars de valeur boursière – la plus grande perte jamais enregistrée par une entreprise en une seule journée dans l’histoire. (Photo: Nvidia)

La perte de 540 milliards de dollars de la valeur boursière de Nvidia en une seule journée a fait suite à l’affirmation de la start-up chinoise Deepseek selon laquelle elle aurait créé un modèle d’IA compétitif pour seulement 5,6 millions de dollars, ce qui a perturbé le secteur de l’IA et posé des problèmes aux fabricants de puces haut de gamme, aux centres de données spécialisés et aux fournisseurs d’infrastructures.

Il y a une semaine, le lundi 20 janvier 2025, une start-up chinoise spécialisée dans l’intelligence artificielle, Deepseek, a fait une audacieuse qui a provoqué une onde de choc dans le monde de la technologie. L’entreprise a révélé ses modèles de raisonnement de première génération, Deepseek-R1-Zero et Deepseek-R1 – tous deux entraînés sans mise au point supervisée – et a affirmé que le modèle R1 atteignait des performances équivalentes à celles du modèle O1 d’OpenAI pour les tâches de mathématiques, de code et de raisonnement. Si l’annonce elle-même n’a pas immédiatement suscité de grandes réactions dans le monde de la finance, elle s’est distinguée par la décision de l’entreprise de mettre ses modèles en open-source.

DeepSeek le code de DeepSeek-R1-Zero, DeepSeek-R1 et six modèles distillés denses sous la licence MIT sur Github, permettant ainsi à quiconque de jouir d’une liberté quasi illimitée, y compris de le modifier et de créer son propre usage commercial propriétaire.

Plus étonnant encore, ces modèles étaient capables de fonctionner sur des ordinateurs de bureau Mac haut de gamme, et pas seulement sur des systèmes de référence optimisés pour l’IA. Les chercheurs et les passionnés ont rapidement commencé à effectuer leurs propres analyses comparatives, validant ainsi certaines des affirmations de Deepseek.

Une semaine plus tard, les marchés financiers ont réagi de manière spectaculaire. Nvidia, la principale société de conception et de fabrication des puces d’intelligence artificielle les plus puissantes, a vu le cours de ses actions s’effondrer. Le vendredi 24 janvier, les actions de Nvidia ont clôturé à 142,62 dollars, mais à la clôture du lundi, le prix avait chuté de 17%, à 118,42 dollars, effaçant près de 540 milliards de dollars de sa valeur de marché – la plus grande perte jamais enregistrée par une entreprise en une seule journée.

Débat sur les coûts

Pour certains experts, l’affirmation de Deepseek selon laquelle son modèle R1 a été développé à l’aide de 2.048 GPU Nvidia H800 et d’environ 2,7 millions d’heures de formation GPU sur deux mois semble hautement improbable. En supposant que la norme industrielle soit de 2$ par heure de location de GPU, cela impliquerait un coût de développement de seulement 5,6 millions de dollars, soit une fraction de ce qu’OpenAI dépense pour des modèles similaires. En revanche, OpenAI a investi des dizaines de millions dans la construction de GPT-4, en utilisant 25.000 des plus puissantes puces Nvidia H100. Alors, où est le problème?

Apparemment, certains chercheurs et experts pensent que Deepseek avait accès à un nombre de puces Nvidia beaucoup plus important que ce qui a été divulgué. D’autre part, Deepseek n’a pas utilisé le langage de codage propriétaire de Nvidia, Cuda, considéré comme le standard de l’industrie, et a revendiqué une plus grande efficacité. Si cela s’avère exact, les conséquences pourraient être considérables et aller bien au-delà de l’actuelle «guerre des puces».

Quelles sont les prochaines étapes?

Bien qu’il soit difficile de formuler des hypothèses pour l’ensemble de l’industrie, les modèles en libre accès, capables de fonctionner sur des ordinateurs standards et d’être portables, pourraient entraîner un changement radical dans l’économie du développement de l’IA. En outre, si les affirmations de Deepseek concernant les coûts de développement se vérifient, même partiellement, les milliards de dollars dépensés ou réservés aux centres de données d’IA construits sur mesure, à l’approvisionnement en énergie et à d’autres infrastructures pourraient être menacés. Pour les des milliards dans ces installations, cela représenterait un sérieux défi pour leurs stratégies à long terme.