
Lorsque les jetons coûtent plus cher que les humains, la « narration IA » rencontre des difficultés.
TechFlow SélectionTechFlow Sélection

Lorsque les jetons coûtent plus cher que les humains, la « narration IA » rencontre des difficultés.
Nous ne sommes pas actuellement dans une bulle à la manière de celle de 1999, mais le récit selon lequel « la croissance de la consommation de tokens équivaut au succès de la transformation IA » finira inévitablement par s’effondrer.
Rédaction : Bao Yilong
Source : Wall Street Insights
La pertinence des dépenses entreprises en IA est aujourd’hui soumise à un examen rigoureux : la consommation de jetons (tokens) ne cesse d’augmenter, tandis que la valeur commerciale quantifiable demeure introuvable.
Le 22 mai, Andrew Macdonald, directeur des opérations d’Uber — dont la capitalisation boursière dépasse 200 milliards de dollars — a déclaré publiquement, lors d’un podcast, qu’il n’existait « aucune corrélation tangible » entre la hausse de la consommation de tokens et l’amélioration réelle des produits.
Macdonald a souligné que les entreprises trouvaient de plus en plus difficile de justifier rationnellement leurs dépenses croissantes en IA. Il a même inventé un terme pour désigner le gaspillage interne au sein des équipes d’ingénierie : « tokenmaxxing » (« maximisation des tokens »).
Début mai, Microsoft a commencé à réduire ses licences internes de Claude Code, invoquant l’insoutenabilité financière des factures liées aux tokens.
Ces deux événements, survenus presque simultanément, obligent le marché à prendre au sérieux une variable jusqu’alors négligée : l’économie des tokens — autrement dit, la rentabilité unitaire de la consommation de tokens à l’échelle des entreprises — qui passe ainsi d’un sujet marginal à un pilier central de toute la réflexion sur les investissements en IA.
Cinq séries de données dessinent un nouveau paysage
Depuis avril, plusieurs séries de données ont été publiées successivement, révélant collectivement un tableau inquiétant.
En avril dernier, le directeur technique d’Uber a indiqué publiquement que l’entreprise avait épuisé son budget annuel alloué à Claude Code en seulement quatre mois.
Parmi ses 5 000 ingénieurs, le taux d’utilisation mensuel se situe entre 84 % et 95 %. Les factures mensuelles par utilisateur varient de 150 à 2 000 dollars. Lors d’une démonstration interne de deux heures, ce même CTO aurait consommé des tokens d’une valeur de 1 200 dollars.
Macdonald a décrit sa réaction face à ce chiffre comme « un véritable choc muet ».
Du côté de Microsoft, selon la newsletter Notepad de Tom Warren (The Verge), Claude Code s’est rapidement imposé auprès des ingénieurs internes, mais le modèle de facturation basé sur les tokens rend insoutenable une montée en puissance à grande échelle — ce qui a conduit Microsoft à réduire progressivement ses licences associées.
GitHub a annoncé qu’à compter du 1er juin, tous les abonnements Copilot passeraient d’un modèle fixe à un système de facturation à l’usage.
Le fil de discussion officiel a recueilli près de 900 votes négatifs, notamment parce que certains utilisateurs ont calculé qu’une seule session de programmation assistée par agent coûte généralement entre 30 et 40 dollars — signifiant qu’un abonnement mensuel de 10 dollars serait épuisé dès la première utilisation.
La plateforme de productivité pour développeurs Entelligence.AI, après avoir analysé les données de 2 444 entreprises, a constaté que :
- Pour chaque dollar dépensé en frais de tokens IA, seul 0,18 dollar génère une valeur concrète perceptible par les utilisateurs.
- 0,44 dollar est consacré à la correction des bogues introduits par l’IA elle-même ; 0,27 dollar est absorbé par les travaux de révision ; 0,11 dollar est perdu dans les frictions liées aux processus de validation.
Selon l’indice Bloomberg Silicon Data LLM Token Expenditure Index, le prix des tokens a augmenté d’environ 65 % depuis la fin février, tandis que les prix des logiciels IA aux États-Unis ont grimpé de 20 % à 37 % sur un an.
Débat haussier / baissier : un même fait, deux lectures opposées
Les mêmes données conduisent à des conclusions radicalement divergentes selon les cadres d’analyse retenus.
La thèse haussière considère que le chaos actuel n’est qu’un mal nécessaire inhérent à une transition réussie.
Selon Jim Schneider, analyste chez Goldman Sachs, dans une analyse datée début mai, l’IA agente devrait faire exploser la consommation de tokens de 24 fois d’ici 2030, atteignant environ 120 milliards de milliards de tokens par mois. La marge brute des fournisseurs de services cloud à très grande échelle et des éditeurs de modèles devrait ainsi passer dans le vert au cours des trois à douze prochains mois.
Rich Privorotsky, également chez Goldman Sachs, estime que le premier trimestre 2026 pourrait marquer le pic de la « maximisation des tokens » en tant qu’indicateur clé de performance (KPI), et que le secteur serait en train de basculer vers une métrique plus saine : le coût unitaire d’une action efficace.
Des recherches économiques menées par JPMorgan montrent aussi qu’au début de 2026, le nombre de nouveaux packages Python et de mises à jour publiés sur PyPI a connu une forte accélération — une tendance absente lors du lancement de ChatGPT en 2022 — ce qui atteste d’une amélioration réelle de la productivité.
Par ailleurs, le ratio cours/bénéfice (P/E) des « Mag 7 » s’élève actuellement à environ 20 fois le bénéfice anticipé, bien en deçà des pics historiques observés pendant la bulle technologique de 2000 (52 fois), au Japon en 1989 (67 fois) ou durant l’ère des « Beautiful 50 » (34 fois). Selon les critères classiques de mesure des bulles, la situation actuelle ne constitue donc pas une bulle spéculative.
La thèse baissière, exposée de façon la plus systématique dans un rapport de Jim Covello, analyste semi-conducteurs chez Goldman Sachs, publié en avril, met en lumière un autre phénomène.
Elle souligne que, dans la chaîne de valeur de l’IA, presque toute la valeur créée afflue vers les entreprises de semi-conducteurs — un phénomène sans précédent historique, et donc structurellement insoutenable. En temps normal, les fabricants de puces devraient bénéficier de la croissance de leurs clients ; or, dans ce cycle, leur essor se fait au détriment de toute la chaîne d’approvisionnement en amont.
Le bénéfice net de NVIDIA a été multiplié par environ 20 depuis le lancement de ChatGPT ; les principaux fournisseurs de services cloud à très grande échelle ont épuisé leurs flux de trésorerie opérationnels et sont désormais contraints de lever des dettes — les émissions de dette liées aux centres de données devraient atteindre environ 182 milliards de dollars en 2025, soit le double de celles de 2024.
Une étude du MIT Nanda révèle que 95 % des entreprises ayant investi dans l’IA générative n’ont obtenu aucun retour sur investissement. Ce décalage peut perdurer un certain temps, mais il ne saurait être éternel.
Les risques d’une structure de financement circulaire
Ce débat touche également un aspect encore plus complexe : le circuit financier entre les fournisseurs de services cloud à très grande échelle et les laboratoires d’IA.
Selon une compilation de documents publics d’entreprises réalisée par The Information, OpenAI et Anthropic représentent à eux deux plus de la moitié des engagements futurs de services cloud — d’un montant total estimé à environ 2 000 milliards de dollars — pris par Microsoft, Oracle, Google et Amazon. Plus précisément :
- Sur les 627 milliards de dollars de commandes en attente de Microsoft, 280 milliards sont liés à OpenAI ;
- Sur les 553 milliards de dollars de pipeline commercial d’Oracle, 54 % (soit environ 300 milliards de dollars) proviennent d’engagements d’OpenAI ;
- Sur les 467,6 milliards de dollars de Google, Anthropic représente 43 % (soit environ 2 000 milliards de dollars) ;
- Chez Amazon, l’exposition correspondante atteint 51 % de ses 464 milliards de dollars de commandes en attente.
Cette structure de financement présente une nature intrinsèquement circulaire. Par exemple, l’investissement de 13 milliards de dollars de Microsoft dans OpenAI est majoritairement réalisé sous forme de crédits Azure. OpenAI utilise ces crédits pour acheter de la puissance de calcul sur Azure, que Microsoft intègre ensuite directement à ses revenus cloud.
Ainsi, le même fournisseur de services cloud à très grande échelle joue à la fois le rôle d’investisseur en capital dans les laboratoires d’IA et celui de prestataire de services de calcul facturé.
Ce schéma se reflète également dans les résultats comptables. Alphabet a annoncé un bénéfice record de 62,6 milliards de dollars au premier trimestre, dont environ 28,7 milliards (près de la moitié) proviennent de la valorisation comptable de sa participation dans Anthropic.
Chez Amazon, le bénéfice trimestriel de 30,3 milliards de dollars inclut 16,8 milliard de dollars de gains non réalisés avant impôts liés à Anthropic, tandis que son flux de trésorerie libre s’est effondré de 95 %, tombant à 1,2 milliard de dollars, en raison d’un investissement en capitaux dans les centres de données atteignant 44,2 milliards de dollars au cours de la même période.
La pérennité de ce système dépend de la capacité continue des laboratoires d’IA à lever des fonds externes afin de tenir leurs engagements vis-à-vis des fournisseurs cloud — capacité elle-même conditionnée à la volonté persistante des entreprises clientes de payer des factures de tokens en constante augmentation.
Selon des informations rapportées, Anthropic coûterait actuellement 3 dollars pour chaque dollar de revenu généré. Une simple ralentissement du rythme des levées de fonds suffirait à entamer la crédibilité des prévisions de revenus cloud, et à exercer une pression réévaluative sur les multiples de valorisation des géants du cloud.
Cette chaîne fonctionne dans les deux sens — et peut donc aussi se rompre dans les deux sens.
Ce n’est pas 1999, mais le problème est bel et bien réel
La situation actuelle ne correspond pas à une bulle classique.
Sur le plan des multiples de valorisation, les « Mag 7 » affichent actuellement un ratio cours/bénéfice anticipé d’environ 20 fois, largement inférieur aux pics historiques de 52 fois atteints lors de la bulle technologique de 2000, de 67 fois au Japon en 1989 ou de 34 fois à l’époque des « Beautiful 50 ».
La technologie IA est réelle. Pour les utilisateurs intensifs, les gains de productivité sont mesurables et vérifiables. Le chiffre d’affaires annuel d’OpenAI avoisine les 20 milliards de dollars, celui d’Anthropic environ 4,3 milliards : ces deux laboratoires ne disparaîtront pas du jour au lendemain.
Aujourd’hui, le coût des tokens (c’est-à-dire la dépense en puissance de calcul) est devenu le facteur déterminant du succès ou de l’échec de l’IA — alors qu’il y a seulement six mois, personne ne parlait guère de ce sujet.
À l’époque, tout le monde ne s’intéressait qu’à une seule question : « Est-ce que la technologie fonctionne ? » Aujourd’hui, la réponse est claire : oui, elle fonctionne bel et bien — pour certaines tâches précises et certains profils d’utilisateurs.
Mais une nouvelle question se pose : les économies réalisées par les entreprises clientes grâce à l’IA seront-elles suffisamment rapides et importantes pour remonter la chaîne de valeur, et dépasser la fenêtre de valorisation accordée par les marchés aux laboratoires d’IA et aux géants du cloud ?
Les optimistes estiment que, tant que la technologie continuera de mûrir, le retour sur investissement (ROI) des entreprises deviendra positif dans un délai de 1 à 1,5 an.
Les pessimistes, eux, prévoient que de plus en plus de dirigeants, à l’instar de Macdonald, dénonceront publiquement le faible rapport coût-efficacité de l’IA et procéderont à des coupes budgétaires.
Ces deux scénarios sont déjà en cours de réalisation. Le verdict reste incertain. Une chose est sûre, toutefois : l’illusion selon laquelle « une augmentation de la consommation de tokens prouve automatiquement le succès de la transformation IA » est définitivement révolue.
Une forte consommation de tokens ne signifie pas nécessairement une valeur commerciale réelle : ces deux bulles doivent impérativement être dégonflées. La facture de l’IA est arrivée à échéance — mais qui paiera finalement ? Cela reste encore une inconnue.
Bienvenue dans la communauté officielle TechFlow
Groupe Telegram :https://t.me/TechFlowDaily
Compte Twitter officiel :https://x.com/TechFlowPost
Compte Twitter anglais :https://x.com/BlockFlow_News











