
La facture de l’inférence IA explose : Shopify et Roblox alertent que les économies réalisées grâce aux licenciements ne suffisent pas à couvrir les coûts des puces.
TechFlow SélectionTechFlow Sélection

La facture de l’inférence IA explose : Shopify et Roblox alertent que les économies réalisées grâce aux licenciements ne suffisent pas à couvrir les coûts des puces.
Aux deux extrémités du dividende IA — les économies de main-d’œuvre d’un côté et la consommation de puissance de calcul de l’autre — apparaissent pour la première fois ensemble sur un même compte rendu financier, avec cette dernière nettement supérieure.
Auteur : Claude, TechFlow
Introduction de TechFlow : La saison des résultats financiers du premier trimestre 2026 des géants technologiques révèle un nouveau phénomène : tandis que l’IA permet aux entreprises de geler leurs recrutements et de supprimer des postes, sa consommation croissante de tokens et l’usure accélérée de ses GPU érodent à rebours les marges bénéficiaires. Chez Shopify, la marge brute de son activité d’abonnement est freinée par les coûts liés aux modèles de langage (LLM) ; chez Roblox, environ un quart de la révision à la baisse de son taux de rentabilité annuel est directement attribuable aux investissements accrus dans l’IA ; quant aux dépenses en capital dédiées à l’IA par Amazon, Meta, Microsoft et Google en 2026, elles atteindront collectivement 725 milliards de dollars, soit une hausse de 77 % en glissement annuel. Pour la première fois, les deux extrémités du dividende IA — les économies sur les coûts de main-d’œuvre d’un côté, la consommation exponentielle de puissance de calcul de l’autre — apparaissent simultanément sur un même compte de résultat, avec cette dernière largement prépondérante.
La saison des résultats du premier trimestre vient ainsi apporter une correction à la narration simplifiée selon laquelle « l’IA remplace la main-d’œuvre ».
Une série d’entreprises technologiques, tout en présentant des résultats impressionnants en matière de gel des embauches et d’accélération du cycle de développement produit, se voient contraintes d’expliquer aux investisseurs un problème plus délicat : la dépréciation vertigineuse des puces IA et la consommation imprévisible de tokens sont en train de grignoter les économies réalisées grâce aux licenciements.
Harel Finkelstein, président de Shopify, a déclaré lors de la conférence téléphonique sur les résultats du 5 mai 2026 que l’IA assume désormais plus de 50 % de la rédaction du code au sein de l’entreprise, et qu’elle a permis à Shopify de livrer plus de 300 nouveaux produits et fonctionnalités sans modifier le nombre total de ses employés. Toutefois, lors de la même conférence, la direction a reconnu que la marge brute de ses solutions d’abonnement était partiellement érodée par les coûts liés aux modèles de langage (LLM), un phénomène appelé à perdurer.
Shopify : le gouffre noir des coûts LLM derrière une marge brute de 80 %
La marge brute des solutions d’abonnement de Shopify s’est établie à 80 % au premier trimestre, stable par rapport à l’année précédente, mais le coût de ce maintien évolue sensiblement.
Selon le formulaire 10-Q déposé par Shopify auprès de la SEC, les coûts associés aux solutions d’abonnement ont augmenté de 20 % au premier trimestre 2026, atteignant 148 millions de dollars (contre 123 millions de dollars un an plus tôt). À eux seuls, les coûts liés au cloud et aux infrastructures (y compris les dépenses relatives à l’IA) ont augmenté de 22 millions de dollars, constituant ainsi le principal moteur de cette hausse globale. Jeff Hoffmeister, directeur financier de Shopify, a précisé lors de la conférence sur les résultats que « les effets d’échelle et les gains d’efficacité obtenus sur le plan du support sont partiellement compensés par la hausse des coûts liés aux LLM, principalement imputable à l’utilisation accrue par les commerçants de Sidekick, et que ce phénomène devrait se poursuivre ».
Sidekick est l’assistant IA intégré à la plateforme Shopify. Ce trimestre, le nombre de boutiques actives hebdomadaires utilisant Sidekick a bondi de 385 % en glissement annuel. Les commerçants y ont créé plus de 12 000 applications personnalisées, soit une augmentation de plus de 200 % par rapport au trimestre précédent ; près de la moitié des flux Shopify (Shopify Flows) sont désormais générés par IA. Le trafic vers les boutiques piloté par l’IA a progressé de 800 %, tandis que les commandes issues de la recherche IA ont augmenté de près de 1 300 %.
Mais cette explosion d’utilisation se traduit par une croissance exponentielle des appels d’inférence IA. Chaque interaction entre un commerçant et Sidekick, chaque suggestion proactive générée par la fonction Pulse, génère une facture en tokens payée au fournisseur du modèle sous-jacent.
Shopify distingue clairement, pour ses investisseurs, les coûts liés à l’« IA interne » et ceux liés à l’« IA externe » : l’utilisation interne de l’IA pour écrire du code et réduire les effectifs relève d’une victoire dans le « jeu des coûts », tandis que l’offre d’outils IA aux commerçants constitue une stratégie visant à « lier étroitement les coûts d’infrastructure à l’intensité d’utilisation par les clients ». Finkelstein a résumé cette logique lors de la conférence sur les résultats en affirmant que « l’IA constitue un avantage structurel, pas seulement un coût ».
Roblox : un quart de la révision à la baisse de la rentabilité provient directement de l’IA
Naveen Chopra, directeur financier de Roblox, a explicitement indiqué lors de la conférence téléphonique sur les résultats du premier trimestre 2026, le 30 avril, que, dans la révision à la baisse de son taux de rentabilité annuel par rapport aux prévisions initiales, environ un quart était imputable aux investissements accrus dans l’IA et à l’ajustement des modalités de rémunération des développeurs (DevEx) destiné aux utilisateurs américains âgés de 18 ans et plus.
Roblox exploite actuellement plus de 400 modèles IA, tant sur ses propres serveurs GPU que sur le cloud, traitant jusqu’à 1,5 million d’appels d’inférence par seconde, couvrant des domaines variés tels que les recommandations de découverte, la sécurité des communications, les recommandations de marché ou encore la génération 3D.
La direction tente de découpler les coûts d’inférence via des ajustements de modèle économique. David Baszucki, cofondateur et PDG de Roblox, a déclaré lors de la conférence sur les résultats que le projet « Roblox Reality », qui permettra de faire tourner en temps réel des vidéos photoréalistes en résolution 2K à 60 Hz, ne sera pas offert gratuitement : « Cela nécessitera des ressources informatiques dans le cloud. Nous mettrons en place un mécanisme d’abonnement ou de paiement à l’usage, ce qui nous permettra, selon nous, de compenser les coûts liés à l’inférence en temps réel. »
Chopra a ajouté que le montant global des dépenses en capital prévu par Roblox pour 2026 reste inchangé, grâce notamment au déploiement massif de GPU dans ses propres centres de données afin de répondre aux besoins d’inférence de l’année, tandis que certaines tâches d’entraînement continueront d’être externalisées vers le cloud. Roblox avait déjà annoncé, fin 2025, avoir amélioré de dix fois l’efficacité énergétique et opérationnelle sur certains cas d’usage spécifiques — notamment la modération de contenu et la découverte — en transférant une partie de ses charges d’inférence IA depuis des fournisseurs tiers vers ses propres centres de données.
Cependant, la révision à la baisse des perspectives annuelles de Roblox intègre plusieurs pressions combinées : ces investissements accrus dans l’IA, la déleverage des coûts fixes liée à une baisse attendue du volume de réservations, ainsi que la hausse du taux DevEx applicable aux créateurs de contenu adultes (18+) à 37,8 %. Ces éléments ont conduit le marché à réévaluer la rentabilité attendue de l’entreprise pour l’ensemble de l’année.
Le grand livre sectoriel : 72,5 milliards de dollars de dépenses en capital contre 2,7 milliards d’économies salariales
Les cas microéconomiques de Shopify et de Roblox s’inscrivent dans un déséquilibre structurel macroéconomique bien plus large.
Selon les données citées par 24/7 Wall St., les dépenses en capital consacrées à l’IA par Amazon, Meta, Microsoft et Google atteindront collectivement 725 milliards de dollars en 2026, soit une hausse de 77 % en glissement annuel. Ainsi, Meta prévoit un montant total de dépenses en capital compris entre 125 et 145 milliards de dollars sur l’ensemble de l’année, ce qui représente un investissement quotidien de 370 millions de dollars uniquement pour la construction de ses centres de données ; Microsoft prévoit 190 milliards de dollars pour l’année civile 2026, et Amazon s’est engagée à consacrer 200 milliards de dollars.
Ce chiffre contraste fortement avec les dépenses liées aux ressources humaines. Le coût total des rémunérations chez Meta — salaires, avantages sociaux et incitations actions inclus — s’élève à environ 27 milliards de dollars. Même si Meta licenciait immédiatement tous ses employés, les économies réalisées ne représenteraient pas plus d’un cinquième de ses dépenses d’infrastructure prévues pour 2026.
Dan Ives, analyste chez Wedbush Securities, estimait dans une note publiée le 25 avril que les 8 000 licenciements annoncés par Meta permettraient d’économiser environ 2,4 milliards de dollars par an en frais opérationnels, soit seulement 12 % environ de la dépréciation supplémentaire attendue en 2026. Autrement dit, pour compenser intégralement chaque dollar dépensé en puissance de calcul IA, il faudrait réaliser près de dix dollars d’économies sur les coûts de main-d’œuvre.
Susan Li, directrice financière de Meta, a qualifié lors de la conférence sur les résultats du quatrième trimestre 2025 les réductions d’effectifs de l’entreprise de « création d’un modèle opérationnel plus léger, destiné précisément à compenser nos investissements massifs en cours ». Cette formulation positionne clairement les licenciements comme un outil financier destiné à absorber les dépenses en capital liées à l’IA, et non comme un simple effet secondaire d’une hausse de la productivité.

La victoire des fournisseurs de modèles, le dilemme des couches applicatives
Les grands bénéficiaires de ce jeu comptable sont les fournisseurs fondamentaux de modèles et de puissance de calcul. La marge brute du service Microsoft Cloud demeure stable à 69 % malgré la pression exercée par l’expansion de ses infrastructures IA ; celle d’OpenAI est estimée à environ 50 %, et celle d’Anthropic à environ 60 %. Quant à Nvidia, elle affiche toujours une marge brute d’environ 70 % pour son exercice 2026.
En revanche, les entreprises de la couche applicative — en particulier les éditeurs SaaS qui consomment à la fois de l’IA et commercialisent des capacités IA sous forme d’abonnements — font face à une nouvelle structure financière : leurs revenus sont étroitement corrélés à l’intensité d’utilisation de l’IA, tandis que leurs coûts sont dictés par les prix fixés par les fournisseurs de modèles en amont, et que chaque mise à jour de modèle risque d’engendrer une nouvelle vague de consommation de tokens.
Tanay Jaipuria, dans son analyse des marges brutes IA, souligne que, bien que le coût unitaire d’inférence d’un modèle donné diminue de 80 à 90 % par an, les prix des modèles de pointe restent stables, voire augmentent. Ainsi, si les entreprises de la couche applicative persistent à invoquer systématiquement le modèle le plus performant à chaque requête, leur coût des marchandises vendues (COGS) est en réalité entièrement piloté par les grilles tarifaires des fournisseurs de modèles.
La réponse de Shopify consiste à positionner ses produits IA comme une porte d’entrée stratégique permettant de renforcer l’ancrage des commerçants sur sa plateforme, transformant ainsi la hausse des coûts d’inférence en indicateur indirect de la « profondeur d’intégration » sur la plateforme ; celle de Roblox consiste à séparer les expériences IA haut de gamme de la version gratuite, obligeant les utilisateurs à payer directement pour l’inférence. Ces deux approches reposent sur un même constat partagé : mathématiquement, il est impossible de compenser les factures liées à la puissance de calcul IA uniquement par des économies salariales issues de licenciements.
Bienvenue dans la communauté officielle TechFlow
Groupe Telegram :https://t.me/TechFlowDaily
Compte Twitter officiel :https://x.com/TechFlowPost
Compte Twitter anglais :https://x.com/BlockFlow_News














