
La « bataille des subventions en tokens » menée par les géants de l’IA est-elle sur le point de prendre fin ?
TechFlow SélectionTechFlow Sélection

La « bataille des subventions en tokens » menée par les géants de l’IA est-elle sur le point de prendre fin ?
Peut encore baisser de 80 %.
Auteur|Yuhang Yuan
Les tokens sont chers, et cela fait mal au portefeuille.
Ce n’est pas seulement le cri du cœur des adeptes actuels du « Vibe Coding », même les géants technologiques de la Silicon Valley, qui auparavant prônaient avec ferveur le « Tokenmaxxing », ont commencé à imposer des limites aux tokens accordés à leurs employés.
Pourtant, un fait contre-intuitif mérite d’être souligné : les étudiants utilisant actuellement des abonnements IA bénéficient déjà d’une subvention considérable de la part des grands acteurs de l’IA — leur coût réel en tokens est déjà fortement subventionné, voire jusqu’à 70 fois le montant de leur abonnement !
Ce qui inquiète davantage encore, c’est que OpenAI et Anthropic, les deux leaders mondiaux de l’IA, sont désormais entrés dans la phase finale de préparation à leur introduction en bourse (IPO). Une fois cotées en bourse, suivront-elles l’exemple des « guerres de subventions » ayant marqué l’ère internet, où les entreprises survivantes ont progressivement augmenté leurs prix unitaires afin de ramener le coût des tokens à un niveau « rationnel » ?
La bonne nouvelle est que ce scénario pourrait ne jamais se concrétiser. Récemment, Bill Maris, fondateur de Google Ventures, a posé une question clé lors de l’épisode « All-in » d’un podcast :
« Que feraient OpenAI et Anthropic si Google décidait de réduire de 80 % le prix des tokens ? »
Par ailleurs, peu de temps auparavant, l’entreprise émergente Agnes AI a détaillé, lors d’un direct avec GeekPark, la perspective d’une « ère des tokens gratuits » .
Alors, le prix des tokens va-t-il augmenter ou diminuer à l’avenir ? Et qu’est-ce que cela signifie pour ceux qui sont déjà accros à l’IA ?
01 Les subventions sur les tokens sont déjà à plein régime
Pourquoi affirmer que le prix actuel des tokens n’est en réalité pas élevé ?
Parce que, du moins dans le cadre des modèles d’abonnement IA, les tarifs pratiqués par les différentes entreprises sont déjà des « prix cassés », fortement subventionnés.
Récemment, SemiAnalysis a mené une analyse approfondie comparant, pour les abonnements OpenAI et Anthropic, la valeur réelle des tokens consommés avec le montant effectif de l’abonnement.
SemiAnalysis a réalisé une démarche simple mais efficace : utiliser concrètement les services IA sur diverses plateformes selon leurs offres d’abonnement pour accomplir différentes tâches, puis recalculer, à partir des tarifs publics des API, le coût réel en tokens de ces tâches. Voici les résultats obtenus :

Remarquez une tendance : plus le forfait est coûteux, plus le taux de subvention est élevé. Cela indique clairement que ces offres haut de gamme ne visent pas à générer des profits — il s’agit d’une « tarification inversée », consistant à absorber des pertes massives afin de fidéliser les utilisateurs les plus intensifs. En effet, ces derniers sont souvent des développeurs ou des décideurs d’entreprises : une fois verrouillés sur une plateforme donnée, ils entraînent derrière eux toute leur équipe et l’intégralité de leur chaîne de production.
Jusqu’à quel point peuvent-ils supporter de telles pertes ? La réponse classique est : « brûler de l’argent pour gagner en échelle ; une fois cette dernière atteinte, augmenter les prix pour récupérer les pertes ». C’est exactement ainsi que fonctionnait l’internet mobile — Didi et Uber ont subventionné des milliards de yuans de courses, et les tarifs ont augmenté après la fin des subventions ; Meituan a subventionné d’innombrables commandes de livraison de repas, et les frais de livraison ont ensuite augmenté. Ce raisonnement suppose toutefois une condition essentielle : que les subventions permettent d’établir un « effet de verrouillage ».
Didi a pu augmenter ses tarifs parce que les chauffeurs dépendent des flux de commandes fournis par la plateforme, et les passagers dépendent de la disponibilité des chauffeurs. Meituan a pu augmenter ses frais parce que les commerçants dépendent de son trafic et de son réseau logistique. À la fin des subventions, les utilisateurs étaient déjà « verrouillés » dans l’écosystème, et le coût de changement était extrêmement élevé.
Mais la guerre de l’IA diffère fondamentalement de celle de l’internet : les tokens n’engendrent presque aucun effet de verrouillage.
Si Claude augmente ses tarifs, les développeurs peuvent migrer leurs appels API vers GPT ou Gemini en une seule journée — les interfaces deviennent de plus en plus standardisées, et de nombreux frameworks de développement intègrent même des fonctions de basculement entre plusieurs modèles. Pour les utilisateurs ordinaires, c’est encore plus simple : il suffit de changer d’URL. Contrairement au service de transport, qui repose sur un réseau local de chauffeurs, ou à la livraison de repas, qui dépend d’un réseau logistique, ou encore aux réseaux sociaux, qui reposent sur des liens relationnels entre amis, l’IA ne possède aucune barrière structurelle. Un token est un token : qu’il provienne de telle ou telle entreprise, il reste identique.
Cela signifie que dès que les subventions cessent, les utilisateurs peuvent partir instantanément. Ces subventions ne servent pas à « construire une barrière », mais plutôt à « maintenir le rythme cardiaque » — dès qu’un concurrent propose un prix inférieur, les utilisateurs partent.
Et cela sans même prendre en compte un nouveau facteur, en train de faire exploser les factures de tout le monde : les agents IA.
Une conversation avec ChatGPT peut consommer quelques milliers de tokens. Mais lorsqu’un agent IA exécute une tâche complexe — par exemple, écrire un code puis le déboguer automatiquement, ou analyser un document de plusieurs dizaines de pages pour générer un rapport — la consommation de tokens peut être multipliée par 5 à 30 par rapport à une conversation ordinaire. Des développeurs ont mesuré que, dans le cadre de l’offre Claude Max à 100 dollars, une seule session de programmation avec un agent IA pouvait consommer des tokens valant près de 100 dollars. Le CTO d’Uber a récemment révélé que l’entreprise avait épuisé son budget IA prévu pour toute l’année 2026 en seulement quatre mois.
La question est donc la suivante : cette guerre de subventions sur les tokens peut-elle se poursuivre indéfiniment ? Qui, parmi les acteurs en présence, sera capable de rester debout une fois le chaos apaisé ?
Bill Maris estime que la réponse est claire : les géants traditionnels.
02 Les tokens comme arme
Pour comprendre la véritable brutalité de cette guerre des subventions, il faut d’abord identifier une asymétrie structurelle : les sources de financement des différents acteurs sont totalement différentes.
Le chiffre d’affaires publicitaire annuel de Google dépasse les 300 milliards de dollars américains. Il ne s’agit pas d’argent fourni par des investisseurs ni de fonds levés lors de levées de capital, mais bien d’une « machine à imprimer des billets » qui fonctionne automatiquement chaque jour. Des milliards d’utilisateurs dans le monde ouvrent quotidiennement le moteur de recherche, regardent YouTube ou utilisent Gmail, et les revenus publicitaires affluent naturellement sur les comptes de Google. Aucun roadshow, aucune cour assidue auprès des analystes, aucune justification à fournir quant à la dépense de ces sommes.
Google utilise ses bénéfices publicitaires pour subventionner les tokens IA comme un propriétaire de puits de pétrole engagerait une guerre des prix contre les stations-service — son pétrole sort directement de son propre sol, tandis que celui de ses rivaux est acheté à crédit auprès des banques.
OpenAI et Anthropic sont précisément ces entreprises qui achètent leur « pétrole » à crédit.
OpenAI a levé plus de 180 milliards de dollars américains, sa valorisation atteignant désormais plus de 850 milliards de dollars. Anthropic a, quant à elle, levé plus de 130 milliards de dollars. Ces fonds proviennent de fonds de capital-risque et d’investisseurs stratégiques — ils ne font pas acte de charité, mais espèrent voir ces entreprises entrer en bourse afin de réaliser des gains substantiels lors de leur sortie.
Or, une fois cotées en bourse, les vrais défis commencent. L’introduction en bourse implique la publication publique des comptes financiers. Chaque trimestre, les analystes de Wall Street scrutent les revenus, les bénéfices, les coûts d’acquisition clients et les coûts marginaux. Lorsqu’ils constatent que, pour chaque dollar reçu au titre d’un abonnement, l’entreprise perd réellement 70 dollars — aucune croissance spectaculaire ne suffira à soutenir le cours de l’action.
Bill Maris expose ce raisonnement très clairement dans le podcast. Il déclare textuellement : « Si j’étais Google et décidais de réduire arbitrairement le prix des tokens de 80 %, quelle serait la conséquence sur le modèle économique d’OpenAI et d’Anthropic ? »
L’animateur demande alors quelle est la probabilité que cela se produise. Maris ne hésite pas : « 100 %. Capital as a weapon, tokens as a weapon (le capital comme arme, les tokens comme arme). »
Il ne s’agit pas ici d’une simple hypothèse d’analyste. Bill Maris est fondateur et PDG de Google Ventures, ainsi que vice-président des projets spéciaux chez Google ; il a notamment contribué à la création de Waymo et de Google X. Tous les participants présents comprennent parfaitement : il ne s’agit pas d’un scénario théorique, mais d’une description précise de la façon dont Google mène ses combats.
Le scénario qu’il décrit est simple : Google annonce une baisse de 80 % du prix de son API Gemini. Que feront les clients professionnels ? Si la qualité du produit est comparable — et Gemini est déjà, sur de nombreux benchmarks, à égalité avec Claude et GPT — mais que le prix est réduit de 80 %, continuerez-vous à payer plus cher ?
Maris donne lui-même la réponse : « Si vous êtes une entreprise, pourquoi ne pas choisir Google et Gemini, où vous paierez 80 % de moins pour un produit quasi identique ? La pression exercée sur les autres entreprises deviendra alors extrêmement forte. »
Or OpenAI et Anthropic disposent presque de moyens de riposte symétriques. Elles ne peuvent pas suivre une baisse de prix — elles ne possèdent pas de « machine à imprimer des billets », chaque dollar dépensé provenant de capitaux investis. Elles ne peuvent non plus compter sur un avantage technologique durable pour justifier des tarifs plus élevés — les écarts entre modèles de grande taille se réduisent rapidement : aujourd’hui, vous devancez vos concurrents de trois mois, mais dans trois mois, ils vous auront rattrapés. Ce n’est pas une différence générationnelle comme celle entre l’iPhone et Nokia. Les « douves » protégeant les modèles IA ressemblent davantage à des digues de sable, emportées dès que la marée monte.
Selon la narration de Bill Maris, Google dispose d’un avantage significatif. Mais dans le monde de l’IA, Google peut-il vraiment dominer ? Meta pourrait à tout moment ouvrir le code source d’un modèle gratuit ; la Chine compte DeepSeek et ByteDance ; Amazon développe également son propre modèle. Lorsque les tokens sont rendus aussi bon marché que des légumes, les concurrents ne disparaissent pas — ils baissent aussi leurs prix.
La guerre de l’IA pourrait bien ne pas avoir de vainqueur.
03 Le « jeu infini » des tokens ?
Même ceux qui connaissent peu l’histoire seront tentés de formuler, concernant l’issue probable de la guerre actuelle de l’IA, l’une des deux hypothèses suivantes :
Première hypothèse : le scénario du « service internet » — celui de Didi, ou d’Amazon : d’abord subventionner, puis monopoliser, puis augmenter les prix pour récolter les fruits du travail. Dans ce scénario, la guerre des prix actuelle n’est qu’un prélude : à terme, un ou deux acteurs dominent la majeure partie du marché et obtiennent le pouvoir de fixer les prix. Si tel est le cas, les pertes colossales actuelles constituent un investissement rentable — comme Amazon, qui a perdu de l’argent pendant vingt ans avant de devenir le leader mondial du commerce électronique et du cloud computing.
Deuxième hypothèse : le scénario des « infrastructures publiques » — électricité, bande passante, stockage dans le cloud. Les tokens deviendraient une ressource fondamentale standardisée, sur laquelle personne ne pourrait longtemps conserver un pouvoir de fixation des prix, car les différences entre produits sont minimes et le coût de changement quasi nul. La concurrence repousserait les prix à leur niveau minimal, proche du coût de production, et les marges s’effondreraient. À terme, l’État pourrait intervenir pour réguler le secteur — comme il l’a fait, il y a cent ans, pour l’électricité et les télécommunications.
La distinction entre ces deux scénarios repose sur un seul mot :
Verrouillage.
Didi a pu augmenter ses tarifs parce que les passagers étaient verrouillés dans le réseau de chauffeurs, et les chauffeurs dans le flux de commandes. Amazon a pu augmenter ses prix parce que les commerçants étaient verrouillés dans son écosystème logistique et de trafic.
L’effet de verrouillage constitue la pierre angulaire du modèle « perdre d’abord, gagner ensuite ».
Mais, comme nous l’avons déjà démontré à plusieurs reprises, les tokens IA ne présentent presque aucun effet de verrouillage. Les API sont standardisées, le coût de changement est quasiment nul. La condition essentielle au succès du premier scénario n’existe tout simplement pas pour les tokens.
Si le second scénario — celui d’une infrastructure publique — s’avère le plus réaliste, ce que nous observons n’est pas une guerre destinée à aboutir à un vainqueur, mais une course d’usure sans fin.
Wang Xing, fondateur de Meituan, a décrit cet état de compétition. Son analyse est la suivante : certaines compétitions ne comportent pas de notion de « victoire ». L’objectif des participants n’est pas de battre leurs rivaux, mais de garantir leur permanence autour de la table de jeu. Car tant qu’on y reste, on continue à lever des fonds, à recruter et à itérer. Seule la sortie de la table constitue la défaite absolue.
En appliquant ce cadre d’analyse à la situation actuelle de l’IA, de nombreuses situations apparemment contradictoires deviennent soudainement claires.
La dernière valorisation d’OpenAI, supérieure à 800 milliards de dollars, ne reflète pas uniquement le coût de formation de ses modèles. Elle traduit surtout le besoin de financer la poursuite de la guerre des prix. Lever des fonds n’a pas pour objectif de remporter la victoire, mais de « conserver le droit de continuer à se battre ».
Google envisage de réduire de 80 % le prix des tokens non pas pour éliminer OpenAI et Anthropic, mais pour garantir sa position de joueur central dans l’ère de l’IA — tout comme il a utilisé Android gratuitement pour s’assurer de ne pas être relégué au second plan durant l’ère mobile.
Quant à Anthropic, elle a fixé le prix de son API pour le dernier modèle phare Fable 5 à deux fois celui de la génération précédente — 10 dollars par million de tokens en entrée, 50 dollars par million en sortie — une hausse apparente qui vise en réalité à sélectionner activement les clients professionnels prêts à payer un prix élevé pour des capacités haut de gamme, car Anthropic sait pertinemment qu’elle ne pourra pas rivaliser avec Google dans la guerre des subventions grand public.
Chaque nouvelle vague de guerre des prix élargit l’usage de l’IA. Cette expansion implique davantage de données, davantage de cas d’usage et davantage de développeurs intégrés à l’écosystème, ce qui renforce, en retour, les modèles de tous les acteurs. Les participants utilisent la guerre elle-même comme moyen d’attirer des ressources pour s’améliorer — il ne s’agit pas d’un jeu à somme nulle où l’un gagne et l’autre perd, mais d’un processus où tous s’enrichissent mutuellement grâce à la concurrence, sans toutefois pouvoir espérer des profits exceptionnels.
Cela ne vous rappelle-t-il pas l’évolution du secteur électrique ?
Il y a 140 ans, Edison et Westinghouse pensaient tous deux se disputer un marché « gagnant-gagnant », où celui qui définirait la norme électrique en deviendrait le maître absolu. Ils investirent toutes leurs ressources dans cette conviction. Or l’histoire de l’électricité nous enseigne une vérité simple :
Lorsqu’une technologie est suffisamment importante, universelle et standardisée, elle cesse d’appartenir à une seule entreprise. Elle devient une infrastructure.
La concurrence dans le domaine de l’IA semble, à première vue, opposer Google à OpenAI et à Anthropic, et porter sur les performances des modèles ou les volumes de financement. Mais en prenant du recul, la véritable fonction de cette compétition est d’accélérer la transformation de l’IA en une infrastructure que nulle entreprise ne pourra jamais monopoliser.
Lorsque Bill Maris affirme que « cela se produira à 100 % », il ne prophétise peut-être pas seulement une baisse de prix de Google. Il anticipe inconsciemment une tendance plus large : dans le monde de l’IA, les tokens n’appartiendront finalement à personne — tout comme personne, aujourd’hui, ne « possède » l’électricité.
Pour OpenAI et Anthropic, cela signifie une réalité dérangeante : même en disposant d’un avantage technologique, même en levant des fonds colossaux, l’avenir qu’elles espèrent — « gagner beaucoup d’argent grâce à l’IA » — pourrait n’avoir jamais existé. Ce qu’elles s’efforcent de construire n’est pas une entreprise profitable, mais une infrastructure de demain — l’eau, l’électricité et les routes de la prochaine génération.
Pour les utilisateurs, cela pourrait, dans une certaine mesure, constituer une bonne nouvelle. Car tant que la guerre des subventions sur les tokens se poursuivra, ils continueront à bénéficier d’un « excellent rapport qualité-prix » : 20 dollars de coût réel pour 400 dollars de puissance de calcul.
Bienvenue dans la communauté officielle TechFlow
Groupe Telegram :https://t.me/TechFlowDaily
Compte Twitter officiel :https://x.com/TechFlowPost
Compte Twitter anglais :https://x.com/BlockFlow_News














