
Pourquoi le modèle d’abonnement aux services d’intelligence artificielle est-il voué à disparaître ?
TechFlow SélectionTechFlow Sélection

Pourquoi le modèle d’abonnement aux services d’intelligence artificielle est-il voué à disparaître ?
Le modèle d’abonnement risque de se vider de son contenu : utilisez-le tant qu’il est encore disponible.
Auteur|Zhang Yongyi

Le 9 juin, Anthropic a lancé son modèle public le plus puissant à ce jour, Claude Fable 5. Selon la coutume, il s’agit d’une fête pour les utilisateurs payants : l’argent que vous versez chaque mois vous donne enfin le droit d’accéder immédiatement au modèle phare.
Mais une ligne du communiqué, publiée immédiatement après l’annonce, a suscité une vive controverse : à compter du 22 juin, Fable 5 sera retiré de tous les abonnements, et son utilisation continuera à nécessiter l’achat séparé de crédits consommables.
Autrement dit, même si vous souscrivez un abonnement, vous n’aurez accès au modèle phare que pendant 14 jours.
Un modèle doté dès sa sortie d’un « avis d’expulsion » est une première dans l’industrie des grands modèles.
Beaucoup y voient une erreur commise par Anthropic, ou encore une preuve d’arrogance. Je pense tout au contraire qu’il ne s’agit pas d’une erreur, mais d’un avertissement préalable.
Le modèle d’abonnement en IA est voué à disparaître — non pas parce qu’une entreprise serait avide, mais parce que le fondement même sur lequel repose ce modèle d’abonnement est en train d’être démantelé… par l’IA elle-même.
01 Un modèle phare doté d’un compte à rebours de 14 jours
Précisons d’abord les faits. Selon le calendrier officiel d’Anthropic (9 juin 2026), Fable 5 est inclus gratuitement dans les abonnements Pro, Max, Team et les versions entreprises facturées à l’unité à compter de sa date de lancement, jusqu’au 22 juin ; à partir du 23 juin, il sera supprimé de ces offres, et chaque token utilisé devra être débité d’un solde prépayé de crédits consommables, aux mêmes tarifs que ceux appliqués à l’API.
Ce tarif n’est pas bon marché : 10 dollars par million de tokens d’entrée, 50 dollars par million de tokens de sortie — exactement le double du précédent modèle phare, Opus 4.8. Plus subtilement, même durant la période gratuite, Fable 5 consomme environ deux fois plus de quota d’abonnement — pour effectuer la même tâche, il épuise le quota deux fois plus vite qu’Opus.
La réaction des utilisateurs était prévisible. Sur Hacker News, certains ont qualifié cette stratégie de « donner puis reprendre » d’inquiétante, soupçonnant Anthropic de vouloir pousser les abonnés vers un modèle de facturation à l’usage ; d’autres développeurs ont testé concrètement que une seule session de programmation assistée par agent dans l’abonnement Max (100 dollars/mois) pouvait consommer des tokens d’une valeur proche de 100 dollars.

Les utilisateurs se plaignent massivement sur les réseaux sociaux du fait que leurs crédits sont largement insuffisants | Source : Twitter
Et ce n’est pas seulement Anthropic qui agit ainsi. Au cours des huit dernières semaines, toute l’industrie a suivi la même trajectoire : le 2 avril, OpenAI a remplacé la facturation à la requête pour Codex par une facturation à l’usage conforme à ses tarifs API, puis étendu ce changement à tous ses clients entreprises existants.
GitHub a gelé, le 20 avril, les nouvelles inscriptions à Copilot version individuelle, avant d’annoncer, une semaine plus tard, la transition complète vers le système de « crédits IA », mise en œuvre le 1er juin — l’offre Pro coûte 10 dollars par mois, assortie de 10 dollars de crédits.
Anthropic, quant à elle, a multiplié les initiatives : à compter du 4 avril, l’utilisation des quotas d’abonnement par des frameworks tiers d’agents (tels qu’OpenClaw) a été interdite, ces usages étant désormais soumis à la facturation à l’usage ; le 21 avril, la mention « Claude Code » figurant sur la page des tarifs de l’offre Pro a discrètement été remplacée par une croix rouge, provoquant une levée de boucliers dans la communauté, avant d’être retirée dans les 24 heures suivantes, avec pour justification officielle une « petite expérimentation ciblée sur environ 2 % des nouveaux inscrits » ; le 14 mai, l’entreprise a annoncé officiellement que, à compter du 15 juin, le SDK Agent et les appels sans interface seraient exclus du périmètre couvert par les abonnements, et facturés séparément selon les tarifs API.
Trois entreprises, huit semaines, une seule direction — ce n’est pas une coïncidence, mais la réponse commune de toute une industrie face à un même problème mathématique.
À quoi ressemble donc ce problème ?
02 Ce qui est facturé, ce n’est jamais la puissance de calcul
Le cabinet d’études SemiAnalysis a récemment mis ce problème mathématique en lumière. Il a acquis chaque niveau d’abonnement d’Anthropic et d’OpenAI, puis exécuté des tâches longues de programmation jusqu’à épuisement complet des quotas hebdomadaires, avant de recalculer leur valeur selon les tarifs publics de l’API.
Jusqu’alors, la perception générale dans le secteur était que, pour un abonnement mensuel de 200 dollars, on pouvait consommer au maximum l’équivalent de 2 000 dollars de tokens. Les résultats réels dépassent largement cette estimation : l’abonnement Claude Pro (20 dollars) permet d’atteindre environ 400 dollars de consommation ; l’offre Max 20x (200 dollars) autorise jusqu’à 8 000 dollars. Chez OpenAI, la différence est encore plus marquée : ChatGPT Plus (20 dollars) peut générer jusqu’à environ 700 dollars de tokens, tandis que l’offre Pro 20x (200 dollars) atteint près de 14 000 dollars.

Le taux de subvention maximal atteint 70 fois | Source : SemiAnalysis
Deux précisions sont nécessaires : ces chiffres représentent des valeurs maximales obtenues en « épuisant entièrement le quota », et non la consommation quotidienne typique des utilisateurs ; par ailleurs, les tarifs API incluent une marge bénéficiaire, et leur conversion ne reflète pas le coût réel de la puissance de calcul. Mais la tarification doit garantir la couverture de ce seuil maximal — une compagnie d’assurance ne peut pas supposer qu’aucun sinistre ne se produira.

Comparaison des volumes consommables réels mesurés par SemiAnalysis pour chaque niveau d’abonnement | Source : X @kimmonismus / SemiAnalysis
La subvention en soi n’est pas fatale. Les services de streaming l’ont pratiquée, tout comme les applications de transport ; brûler de l’argent pour croître est un art ancestral du web. Ce qui est véritablement fatal, c’est une différence fondamentale entre le modèle d’abonnement en IA et ces autres secteurs.
Netflix ose proposer un abonnement mensuel grâce à deux éléments : le coût marginal d’ajouter un film supplémentaire tend vers zéro, et une personne ne dispose que de 24 heures par jour pour regarder. Spotify suit le même principe. Le postulat implicite du modèle d’abonnement est que la consommation est limitée par les contraintes physiologiques humaines — ce qui est réellement facturé, ce n’est jamais le contenu, mais le temps humain.
L’IA des chatbots correspondait encore partiellement à ce postulat. Même le plus bavard des utilisateurs ne peut taper qu’un nombre limité de caractères par jour ; les quotas inutilisés par les utilisateurs occasionnels suffisaient à couvrir la consommation excessive des utilisateurs intensifs.
Puis sont arrivés les agents.
Quelle est la nature d’une tâche exécutée par un agent ? Il lit 20 fichiers, planifie, modifie du code, exécute des tests, analyse les erreurs, itère — chaque cycle consomme 5 à 30 fois plus de tokens qu’une conversation ordinaire. Et surtout, il n’a pas besoin de votre présence. J’en ai moi-même fait l’expérience : récemment, j’ai demandé à un agent de traiter les données de vols de deux aéroports ; pendant que je prenais une douche, la tâche s’est achevée… et mon quota était épuisé. Vous dormez, mais le compteur tourne.
L’agent ne supprime pas seulement le plafond des prix : il supprime le plafond de la consommation. Or, toute l’évolution de l’IA — tâches plus longues, autonomie accrue, instances multiples exécutées en parallèle — converge vers un même objectif final :
Éliminer complètement l’humain du processus de consommation.
GitHub l’a clairement exprimé dans son annonce : les usages basés sur les agents « deviennent la norme ». Autrement dit, les scénarios où le modèle d’abonnement reste encore vaguement viable — à savoir l’utilisateur assis devant son écran, dialoguant phrase par phrase — ne représentent qu’une part décroissante de la valeur globale créée par l’IA.
À ce stade, certains demandent : « Si la subvention est trop importante, pourquoi ne pas simplement augmenter les prix ? »
Cela a déjà été tenté, conduisant à un résultat encore plus problématique. En revenant sur le tableau de SemiAnalysis, un détail anormal retient l’attention : plus le niveau d’abonnement est élevé, plus le taux de subvention augmente.
Chez Claude, le taux passe de 20 fois pour l’offre à 20 dollars à 40 fois pour celle à 200 dollars ; chez OpenAI, il passe de 35 à 70 fois. La moitié de cette différence s’explique par la conception tarifaire — les niveaux supérieurs multiplient les quotas par un coefficient, ce qui revient à accorder une remise aux gros clients ; l’autre moitié résulte du comportement des utilisateurs — ceux qui dépensent 200 dollars pour l’offre 20x le font précisément pour épuiser intégralement leur quota ; les utilisateurs occasionnels ne figurent tout simplement pas dans cette catégorie.
En assurance, ce phénomène porte un nom : la sélection adverse. Lorsqu’un contrat d’assurance attire exclusivement les assurés présentant le risque le plus élevé, ce contrat n’a plus aucune viabilité actuarielle. Un prix fixe sélectionnera systématiquement les utilisateurs dont la consommation dépasse ce montant — il ne s’agit pas d’un problème opérationnel, mais structurel ; ajuster les prix ne fera qu’affiner davantage ce tri.
Durant toute l’année 2025, le secteur a en réalité essayé toutes les solutions possibles. En janvier, Sam Altman a reconnu sur X que l’abonnement ChatGPT Pro (200 dollars/mois) était déficitaire, car la consommation dépassait largement les attentes — tentative de hausse tarifaire avortée.

OpenAI a tenté, mais échoué | Source : X
Au milieu de l’année, Cursor est passé d’une facturation à la requête à une facturation à la puissance de calcul, provoquant un départ massif d’abonnés, ce qui a contraint son PDG à présenter publiquement des excuses — modification des règles en cours de route, échec cuisant ; en été, Anthropic a imposé un plafond hebdomadaire à Claude Code, justifiant cette mesure par le fait que certains utilisateurs laissaient fonctionner leurs agents en continu, entraînant une consommation de puissance de calcul chiffrée en dizaines de milliers de dollars par utilisateur — la limitation du débit n’a soulevé que de la colère.
Une fois tous ces correctifs avérés inefficaces, les huit semaines récentes ont vu un alignement collectif des acteurs. Nick Turley, responsable de ChatGPT chez OpenAI, l’a clairement formulé dans le podcast BG2 : « Dans le contexte actuel, proposer un forfait illimité revient à proposer un forfait d’électricité illimité. »
03 L’enveloppe subsiste, mais le noyau est mort
Certains objectent, avec une certaine force, que le modèle d’abonnement fonctionne parfaitement bien : ChatGPT Plus reste à 20 dollars par mois, Claude Pro est toujours commercialisé, et GitHub conserve même un forfait mensuel pour son assistant de complétion de code. Cette prédiction de disparition ne serait-elle pas une simple exagération ?
Cette objection mérite d’être prise au sérieux, car le phénomène qu’elle décrit est réel. Mais elle identifie mal ce qui est en train de mourir.
L’âme du modèle d’abonnement n’a jamais été la simple forme « débit mensuel », mais bien la promesse implicite de « prix fixe, usage sans restriction » — vous n’avez pas à calculer le coût de chaque utilisation, ce qui constituait précisément la raison de sa victoire face aux modèles de paiement à l’usage.
Or ce qui se produit aujourd’hui est le suivant : le cycle de facturation subsiste, mais la promesse a été retirée.
Les 10 dollars mensuels de GitHub Pro contiennent 10 dollars de crédits, valables jusqu’à épuisement — ce n’est plus un abonnement, c’est une carte de recharge prépayée habillée d’un vernis d’abonnement. Les crédits d’Anthropic sont débités selon les tarifs API, ceux d’OpenAI peuvent être automatiquement rechargés. Le modèle d’abonnement ne sera pas supprimé : il sera vidé de son sens. L’enveloppe subsiste, mais le noyau est mort.

Annonce officielle de la transition de GitHub Copilot vers la facturation en crédits IA | Source : GitHub
Il ne reste qu’une dernière enclave véritable : la conversation pure. Elle peut encore bénéficier d’un forfait mensuel, car c’est le dernier scénario d’utilisation de l’IA dont la consommation reste verrouillée par la durée disponible d’un humain. Mais une ligne de défense ne protège pas une enclave — chaque dollar investi en R&D dans ce secteur vise à faire passer l’IA d’un mode « vous posez la question, elle répond » à un mode « elle agit spontanément pour vous accomplir la tâche ». L’abonnement conversationnel ne sera pas supprimé, il sera marginalisé : il restera sur place, tandis que la véritable valeur et les véritables revenus migreront progressivement vers le modèle de facturation à l’usage.
Un autre élément temporel frappant ne peut être ignoré : selon TechCrunch (juin 2026), au moment du lancement de Fable 5, Anthropic prépare conjointement avec OpenAI son introduction en Bourse. Pendant trois ans, les subventions ont été financées par des fonds de capital-risque ; les investisseurs des marchés publics ne toléreront pas un compte de résultat où « chaque nouvel utilisateur intensif creuse davantage le déficit ». Le calendrier du retrait du capital-risque détermine que la confrontation ne pourra être indéfiniment reportée.
Cela signifie des choses différentes selon les acteurs. Pour les entreprises, les dépenses en IA devront désormais être gérées comme les dépenses cloud — selon The Information, le CTO d’Uber a indiqué dans une note interne que l’entreprise avait épuisé, en quatre mois, son budget IA annuel 2026 ; établir des budgets, installer des outils de surveillance, router les tâches vers les modèles appropriés deviendront des compétences obligatoires pour chaque équipe. Pour les utilisateurs particuliers, ce fut longtemps le cas où les utilisateurs occasionnels subventionnaient les utilisateurs intensifs ; aujourd’hui, chacun paie pour son propre compteur.

La transformation du budget IA d’Uber a également suscité de vives controverses | Source : The Information
Franchement, cela n’est pas forcément entièrement négatif. Une fois le signal-prix rétabli, la question « Cette tâche mérite-t-elle vraiment d’être exécutée par une IA ? » devient pour la première fois une interrogation réelle — et lorsqu’un secteur commence à y répondre sérieusement, c’est souvent le signe qu’il quitte la logique de la course aux pertes pour entrer dans celle d’un business normal.
À ce stade, je voudrais glisser une phrase : Avant l’installation du compteur, le modèle d’abonnement actuel représente probablement le moment le plus généreux que l’industrie ait jamais offert à ses utilisateurs — profitez-en, tant qu’il en est encore temps.
La logique se trouve dans le tableau de SemiAnalysis. Lu du point de vue de l’utilisateur, ce n’est pas un arrêt de mort, mais une liste de prestations encore en vigueur : pour 200 dollars mensuels, la plateforme vous accompagne dans la consommation de jusqu’à 14 000 dollars de puissance de calcul. Une subvention d’une telle ampleur ne s’était plus vue depuis les guerres des transports urbains et des livraisons de restauration — et nous connaissons tous l’issue de ces deux conflits : une fois la subvention retirée, les prix n’ont jamais regagné leurs niveaux antérieurs.
Il convient donc d’exécuter dès maintenant les tâches lourdes. Par exemple, la fenêtre d’accès gratuit à Fable 5 dans les abonnements expire le 22 juin ; plutôt que d’attendre l’ère des crédits pour optimiser chaque dépense, mieux vaut programmer dès à présent les longues tâches que vous avez toujours voulu lancer, mais jugiez trop coûteuses. Ce n’est pas du « pillage » — c’est simplement tirer parti, en toute lucidité, d’une erreur de tarification destinée à être corrigée.

La métaphore de Turley pourrait aller encore plus loin que ce qu’il entendait exprimer. Le véritable signe que l’électricité est devenue une infrastructure n’est pas qu’elle soit arrivée dans chaque foyer, mais qu’un compteur y soit installé — à partir de ce moment, personne ne débat plus de savoir « si l’électricité devrait être facturée en forfait », on ne discute plus que des tarifs.
Le modèle d’abonnement ne recevra pas d’avis de décès. Il deviendra simplement, un jour calme de facturation, une petite ligne discrète intitulée « frais d’entrée » dans votre relevé de dépenses.
D’ici là — profitez-en, tant qu’il en est encore temps.
Bienvenue dans la communauté officielle TechFlow
Groupe Telegram :https://t.me/TechFlowDaily
Compte Twitter officiel :https://x.com/TechFlowPost
Compte Twitter anglais :https://x.com/BlockFlow_News