Global Soul Limited liyi@gs-smt.com 86-755-27962186
En janvier de cette année, la startup DeepSeek a publié deux percées grâce à son nouveau modèle R1, redéfinissant discrètement l'économie de l'intelligence artificielle.Ce modèle atteint des performances optimales à 1/40 du coût du modèle précédent.En décembre 2024, le modèle de langage grand format V3 de DeepSeek a réduit les coûts de formation de plus de 90%.
Deux des percées de DeepSeek ont attiré l'attention:DeepSeek a révélé que demander à des modèles d'IA d'élaborer leurs processus de raisonnement - une approche de recherche connue sous le nom de "chain-of-thought prompting" - améliorait la précision et l'efficacitéDeuxièmement, DeepSeek utilise l'intelligence artificielle pour générer ses propres ensembles de données, complètement indépendants de l'étiquetage manuel des données.Bien qu'il y ait des arguments que DeepSeek n'est pas aussi bon marché qu'il le prétend, ces percées ont certainement inauguré une nouvelle ère de l'économie de l'IA.
La structure des coûts de l'intelligence artificielle est en train de changer radicalement.et les investissements dans les infrastructuresCe changement pourrait renverser les forces du marché, aidant finalement les start-ups agiles à rattraper les géants de la technologie à court terme tout en augmentant les marges bénéficiaires.
Les géants de la technologie ont déjà investi plus de 100 milliards de dollars dans le développement d'infrastructures d'IA, et cela continue d'augmenter.Maintenant, ils doivent réfléchir à la façon de générer un retour sur ces investissements énormes et maintenir un avantage sur les algorithmes contre plus agilesDans un environnement en mutation rapide, les géants de la technologie et les start-ups sont confrontés à un signal clair: saisir rapidement l'opportunité du progrès technologique,ou être éliminé.
Le paysage du marché de l'IA avant et après DeepSeek
Avant la montée de DeepSeek, les start-ups avaient du mal à rivaliser avec les dépenses en infrastructure des géants de la technologie,qui a versé des milliards de dollars dans la construction d' immenses centres de données chaque trimestre et a obtenu d' énormes avantages des progrès de la technologie de l' intelligence artificielleCes géants disposent non seulement d'énormes ressources de données, mais rassemblent également un grand nombre de doctorants talentueux, et les progrès des algorithmes dépendent également de leur forte force technique.Les réseaux de distribution établis de longue date leur permettent d'acheminer rapidement des produits vers les clients existants et d'accélérer les progrès technologiques grâce à des boucles de rétroaction.
Aujourd'hui, cependant, les startups sont assez grandes pour rivaliser avec les géants de la technologie.Réduction significative de l'avantage des géants de la technologie en matière d'infrastructureLes coûts de raisonnement ont chuté de près de mille fois au cours des trois dernières années et devraient encore diminuer à l'avenir.La durée de l'avantage algorithmique a été réduite de 45 à 100 jours et pourrait continuer à diminuer..
Lorsque les coûts de formation ne sont plus un goulot d'étranglement clé, la performance d'inférence (c'est-à-dire le rendement des modèles d'IA dans les applications en temps réel) devient un nouvel objectif.Des modèles moins chers offrant une puissance comparable à celle des modèles plus grands et pouvant fonctionner sur un GPU de performance inférieureSi des produits d'IA plus intelligents peuvent être livrés à un coût très bas, alors les startups auront enfin une chance de surpasser les géants de la technologie tout en augmentant leurs profits.
L'allocation efficace de la main-d'œuvre renforce encore l'avantage du concurrent.optimiser, et distribuer des modèles à un coût beaucoup plus bas que les géants de la technologie.Les concurrents sont en mesure de profiter de marges bénéficiaires plus élevées de la même manière que les startups cloud ont gagné un avantage en améliorant l'économie unitaire il y a 15 ans.
Cette tendance n'est pas seulement bonne pour les startups. Elle met également des entreprises comme Nvidia à un plus grand risque. Après l'annonce de DeepSeek, le cours des actions de Nvidia a chuté de 12%, bien qu'il ait depuis rebondi.Les risques pour les fabricants de puces sont accrus parce que la demande passe du matériel axé sur la formation à des solutions d'inférence plus efficacesLa montée en puissance des unités de traitement neuronal (Npus) de qualité consommateur pourrait accélérer ce changement, permettant aux modèles d'IA de fonctionner nativement sur des appareils tels que les smartphones et les ordinateurs portables.
Dépenses pour l'intelligence artificielle
Ce qui est bon pour les challengers est mauvais pour les géants de la technologie.Les géants de l'intelligence artificielle ont presque instinctivement lié la domination de DeepSeek aux implications de la sécurité nationale dans une tentative de rassembler le soutien pour son développement de technologie similaire, ignorant le fait que les chercheurs américains, y compris à l'Université de Stanford, ont été en mesure de reproduire et même de surpasser la technologie de DeepSeek.Les entreprises qui investissent d'énormes sommes dans des projets d'infrastructure de données peuvent se demander:: Les énormes dépenses consacrées à la recherche et au développement de modèles d'IA ont-elles été gaspillées?
Les tendances historiques suggèrent que la plupart des progrès de l'IA ont en effet reposé sur un investissement en capital excessif à l'échelle.dépassant ce qui était considéré comme algorithmiquement optimal à l'époqueLes nouvelles avancées technologiques prouvent que nous pouvons obtenir les mêmes performances à moindre coût.l'expansion des fournisseurs de cloud hyperscale nécessite encore des centres de données plus grands et doit supporter des coûts d'inférence en hausse.
Nous assistons déjà à une course aux armements pour les réalisations de DeepSeek, avec des modèles comme le modèle Gemini de Google,Azure AI Foundry de Microsoft et LLaMA open source de Meta sont tous en compétition pour la dominationLes modèles open source peuvent jouer un rôle clé. Mark Zuckerberg, PDG de Meta, a souligné l'importance de l'IA personnalisée, c'est-à-dire des modèles adaptés aux besoins, à la culture et aux préférences des utilisateurs individuels..Cette vision s'aligne sur une tendance plus large dans le développement de l'IA: des modèles plus petits et plus spécialisés capables de fournir des performances élevées sans avoir besoin d'une infrastructure cloud massive.
Les startups gagnent de nouveaux jetons
Dans le même temps, les géants de l'open source et du closed source ont des objectifs différents, ce qui renforce encore l'avantage du concurrent.Les modèles open source créés par des sociétés comme Meta continueront de concurrencer et de réduire les coûts dans l'écosystèmeLes startups peuvent tirer parti de la concurrence entre les deux camps pour obtenir le meilleur rapport prix/performance pour chaque utilisation,tout en augmentant les marges bénéficiaires.
Indépendamment de la taille de l'entreprise, le message est clair: profitez rapidement des avantages spécifiques dont elles disposent - dynamique du marché, puissance de calcul et talents - ou faites face à l'échec.Le cycle du progrès technologique se raccourcit, depuis les mois ou même les années qu'il fallait pour établir de nouvelles normes de performance, à la percée technologique de DeepSeek suggérant qu'il pourrait maintenant prendre aussi peu que 41 jours.L'innovation progresse à un rythme sans précédent, et l'espace de tolérance à la défaillance se rétrécit rapidement.