
Les jetons sortent de Chine pour vendre l’électricité chinoise à l’échelle mondiale
TechFlow SélectionTechFlow Sélection

Les jetons sortent de Chine pour vendre l’électricité chinoise à l’échelle mondiale
Une guerre électrique sans fumée
Auteur : Black Lobster, TechFlow
En été 1858, un câble sous-marin en cuivre traversa l’océan Atlantique, reliant Londres à New York.
L’importance de cet événement ne résidait jamais dans la vitesse de transmission, mais bien dans la structure du pouvoir : celui qui posait les câbles sous-marins pouvait « pomper » l’information au cours de son flux. Grâce à ce réseau mondial de télégraphie, l’Empire britannique contrôlait les renseignements provenant de ses colonies, les cours du coton et les nouvelles relatives aux conflits armés.
La puissance impériale reposait non seulement sur sa flotte, mais aussi sur ce câble.
Plus de cent soixante ans plus tard, cette logique se répète, mais d’une manière inattendue.
En 2026, les grands modèles chinois s’emparent progressivement du marché mondial des développeurs. Selon les données les plus récentes d’OpenRouter, les modèles chinois représentent à eux seuls 61 % de la consommation totale de jetons (tokens) parmi les dix modèles les plus utilisés sur la plateforme ; les trois premiers sont tous originaires de Chine. Les requêtes API envoyées quotidiennement par des développeurs de San Francisco, Berlin ou Singapour traversent les câbles optiques sous-marins du Pacifique pour atteindre des centres de données chinois, où la puissance de calcul est mobilisée, l’électricité consommée, et les résultats renvoyés.
L’électricité n’a jamais quitté le réseau électrique chinois, mais sa valeur a été transférée transfrontalièrement via les tokens.
La grande migration des modèles d’IA
Le 24 février 2026, OpenRouter a publié une analyse hebdomadaire : la consommation totale de tokens par les dix modèles les plus utilisés sur la plateforme s’élevait à environ 8,7 billions ; les modèles chinois en représentaient à eux seuls 5,3 billions, soit 61 %. Le modèle MiniMax M2.5, avec 2,45 billions de tokens, a fait une entrée remarquée en tête du classement, suivi immédiatement par Kimi K2.5 et GLM-5 de Zhipu AI — les trois premières places étant toutes occupées par des modèles chinois.

Données actualisées le 26 février
Ce phénomène n’est pas fortuit : une étincelle a tout déclenché.
Début 2026, OpenClaw a fait son apparition spectaculaire : un outil open source permettant aux IA de « travailler » véritablement — capable de piloter directement un ordinateur, d’exécuter des commandes et de réaliser simultanément des workflows complexes. En quelques jours seulement, son nombre d’étoiles sur GitHub a dépassé 210 000.
John, un professionnel de la finance, a installé OpenClaw dès sa sortie et l’a relié à l’API d’Anthropic afin de surveiller automatiquement les marchés boursiers et d’envoyer des signaux de trading. Quelques heures plus tard, il fixait son solde bancaire, interdit : plusieurs dizaines de dollars avaient disparu.
Voilà la nouvelle réalité apportée par OpenClaw. Autrefois, discuter avec une IA impliquait quelques milliers de tokens par échange, un coût négligeable. Mais une fois OpenClaw intégré, l’IA exécute simultanément plusieurs tâches en arrière-plan, rappelle constamment le contexte et itère de façon répétée : la consommation de tokens n’est plus linéaire, elle devient exponentielle. La facture accélère comme une voiture dont le capot est ouvert, le compteur de carburant dégringole, sans possibilité de freiner.
Une « astuce » s’est rapidement répandue dans la communauté des développeurs : utiliser des jetons OAuth pour connecter directement les comptes abonnés d’Anthropic ou de Google à OpenClaw, transformant ainsi le forfait mensuel « illimité » en carburant gratuit pour les agents IA — méthode adoptée par de nombreux développeurs.
Les contre-mesures officielles n’ont pas tardé.
Le 19 février, Anthropic a mis à jour ses conditions d’utilisation, interdisant explicitement l’usage des identifiants d’abonnement Claude avec des outils tiers tels qu’OpenClaw ; toute intégration des fonctionnalités Claude doit désormais passer obligatoirement par le canal d’API payant. Google, quant à lui, a procédé à des blocages massifs des comptes abonnés ayant utilisé OpenClaw pour accéder à Antigravity et à Gemini AI Ultra.
« Depuis longtemps, nous souffrons de la tyrannie », déclare John, qui se tourne aussitôt vers les grands modèles nationaux.
Sur OpenRouter, le grand modèle chinois MiniMax M2.5 obtient un score de 80,2 % sur les tâches d’ingénierie logicielle, contre 80,8 % pour Claude Opus 4.6 — une différence quasi imperceptible. En revanche, leurs prix sont radicalement différents : 0,3 dollar par million de tokens en entrée pour le premier, contre 5 dollars pour le second — soit un écart d’environ 17 fois.
John bascule donc vers le modèle chinois : son workflow continue de fonctionner normalement, tandis que sa facture diminue d’un ordre de grandeur. Ce type de migration se produit actuellement à l’échelle mondiale.
Chris Clark, COO d’OpenRouter, le dit clairement :« Les modèles open source chinois ont conquis une part importante du marché principalement parce qu’ils sont massivement utilisés dans les workflows d’agents IA déployés par les développeurs américains. »
L’exportation de l’électricité
Pour comprendre la nature profonde de l’exportation des tokens, il faut d’abord analyser leur structure de coûts.
Un token paraît léger : il correspond approximativement à 0,75 mot anglais ; une conversation ordinaire avec une IA ne consomme que quelques milliers de tokens. Mais lorsqu’on additionne ces tokens par trillions, la réalité physique qui les sous-tend devient pesante.
Le coût d’un token repose essentiellement sur deux éléments :la puissance de calcul et l’électricité.
La puissance de calcul correspond à l’amortissement des GPU : l’achat d’un NVIDIA H100, à environ 30 000 dollars, se traduit, à chaque inférence, par un coût d’amortissement. L’électricité constitue le carburant indispensable au fonctionnement continu des centres de données : un GPU en charge maximale consomme environ 700 watts, et avec les systèmes de refroidissement, la facture énergétique d’un grand centre de données IA peut aisément dépasser plusieurs centaines de millions de dollars par an.
Traçons maintenant ce processus physique sur une carte.
Un développeur américain à San Francisco lance une requête API. Les données quittent la Californie, traversent le câble optique sous-marin du Pacifique, et arrivent dans un centre de données chinois. Des grappes de GPU entrent en action, l’électricité circule depuis le réseau électrique national vers ces puces, l’inférence est effectuée, puis le résultat est renvoyé. Tout ce processus prend peut-être une ou deux secondes.
L’électricité n’a jamais quitté le réseau électrique chinois, mais sa valeur a été transférée transfrontalièrement via les tokens.
Cela recèle une particularité magique inaccessible au commerce traditionnel : le token est immatériel, il ne passe pas par les douanes, n’est pas frappé de droits de douane, et n’apparaît même pas dans les statistiques commerciales courantes. La Chine exporte massivement des services de puissance de calcul et d’électricité, mais ces exportations restent presque invisibles dans les données officielles du commerce extérieur des biens.
Le token devient ainsi un dérivé de l’électricité ; l’exportation des tokens est, en substance, une exportation de l’électricité.
Cela s’explique également par le coût relativement faible de l’électricité en Chine, dont le prix moyen est environ 40 % inférieur à celui des États-Unis — une différence de coût physique que les concurrents ne peuvent facilement reproduire.
Par ailleurs, les grands modèles chinois bénéficient également d’avantages algorithmiques et d’un intense « surcompétition » interne.
L’architecture MoE (Mixture of Experts) de DeepSeek V3 active uniquement une partie des paramètres pendant l’inférence ; des tests indépendants montrent que son coût d’inférence est environ 36 fois inférieur à celui de GPT-4o. De même, MiniMax M2.5, doté de 229 milliards de paramètres au total, n’en active que 10 milliards à la fois.
Au sommet, c’est la surcompétition : Alibaba, ByteDance, Baidu, Tencent, Moonshot, Zhipu AI, MiniMax… Une dizaine d’entreprises se font concurrence farouchement sur le même segment, faisant chuter les prix bien en dessous des niveaux de rentabilité raisonnables — vendre à perte pour attirer l’attention est devenu la norme du secteur.
Examinons cela de plus près : cela suit le même schéma que l’exportation des produits manufacturés chinois, tirant parti des avantages de la chaîne d’approvisionnement et de la surcompétition sectorielle pour faire chuter drastiquement le prix des tokens.
Du bitcoin aux tokens
Avant les tokens, une première forme d’exportation de l’électricité avait déjà eu lieu.
Vers 2015, les gestionnaires de centrales électriques du Sichuan, du Yunnan et du Xinjiang ont commencé à recevoir la visite d’étranges clients.
Ces derniers louaient des usines désaffectées, y installaient des machines serrées les unes contre les autres, et les laissaient fonctionner 24 heures sur 24. Ces machines ne produisaient rien d’autre que des calculs mathématiques incessants ; parfois, elles parvenaient à extraire un bitcoin de cette suite infinie d’opérations.
Telle était la première génération de l’exportation de l’électricité : transformer l’hydroélectricité et l’éolien bon marché, via le calcul de hachage réalisé par les machines minières, en actif numérique négociable mondialement, puis le convertir en dollars sur les bourses.
L’électricité ne franchissait aucune frontière, mais sa valeur, portée par le bitcoin, affluait vers les marchés mondiaux.
Pendant plusieurs années, la Chine a fourni plus de 70 % de la puissance de calcul mondiale consacrée au minage de bitcoins. Son hydroélectricité et son charbon ont ainsi participé, de façon détournée, à une redistribution mondiale des capitaux.
En 2021, tout s’est arrêté net. Un coup de fouet réglementaire s’est abattu : les mineurs se sont dispersés, et la puissance de calcul a migré vers le Kazakhstan, le Texas et le Canada.
Mais cette logique n’a jamais disparu ; elle attendait simplement une nouvelle enveloppe. Puis ChatGPT est apparu, les grands modèles se sont lancés dans une course effrénée, et les anciennes mines de bitcoins se sont transformées en centres de données IA ; les machines minières sont devenues des GPU dédiés au calcul, et les bitcoins produits se sont mués en tokens — seule l’électricité est restée inchangée.
L’exportation du bitcoin et celle des tokens sont isomorphes à un niveau fondamental, mais les tokens possèdent aujourd’hui une valeur commerciale supérieure.
Le minage de bitcoins consiste en un simple calcul mathématique, produisant un actif financier dont la valeur dépend de sa rareté et du consensus du marché — sans aucun lien avec le contenu des calculs effectués. La puissance de calcul elle-même n’a aucune productivité intrinsèque : elle n’est qu’un sous-produit d’un mécanisme de confiance.
L’inférence par les grands modèles est différente. Les GPU consomment de l’électricité pour produire des services cognitifs réels : code, analyses, traductions, créations. La valeur des tokens découle directement de leur utilité pour l’utilisateur. C’est une intégration plus profonde :une fois qu’un workflow de développement dépend d’un modèle donné, le coût de changement augmente avec le temps.
Il existe toutefois une différence cruciale : le minage de bitcoins a été expulsé de Chine, tandis que l’exportation des tokens est un choix actif des développeurs du monde entier.
La guerre des tokens
Le câble sous-marin posé en 1858 incarnait la souveraineté de l’Empire britannique sur l’autoroute de l’information : celui qui possède les infrastructures définit les règles du jeu.
L’exportation des tokens est, elle aussi, une guerre non déclarée, semée d’obstacles.
La souveraineté des données constitue le premier obstacle : une requête API lancée par un développeur américain, traitée dans un centre de données chinois, traverse physiquement le territoire chinois. Pour les développeurs individuels ou les petites applications, ce n’est pas un problème ; mais dans les cas impliquant des données sensibles d’entreprise, des informations financières ou des exigences de conformité gouvernementale, c’est un frein majeur. C’est pourquoi les modèles chinois pénètrent le plus fortement les domaines des outils de développement et des applications personnelles, mais restent quasiment absents des systèmes centraux des entreprises.
L’interdiction d’exportation des GPU haut de gamme d’NVIDIA constitue le deuxième obstacle : le développement de l’IA en Chine subit des restrictions d’exportation sévères sur ces puces, et les architectures MoE ainsi que les optimisations algorithmiques ne compensent qu’en partie cet handicap — un plafond reste donc inévitable.
Mais ces obstacles actuels ne sont que le prologue : un champ de bataille bien plus vaste est en train de se former.
Les tokens et les modèles d’IA sont devenus une nouvelle dimension stratégique de la rivalité sino-américaine, comparable à celle des semi-conducteurs ou d’internet au XXe siècle — voire encore plus proche d’une métaphore plus ancienne :la course à l’espace.
En 1957, le lancement du Spoutnik 1 par l’Union soviétique a provoqué un choc national aux États-Unis, entraînant le lancement immédiat du programme Apollo et l’investissement de ressources équivalentes à des milliers de milliards de dollars actuels pour ne pas perdre la course spatiale.
La logique de la course à l’IA est étonnamment similaire, mais son intensité dépassera largement celle de la course spatiale. L’espace est un domaine physique, peu perceptible pour le citoyen lambda ; l’IA, en revanche, pénètre dans les capillaires de l’économie — chaque ligne de code, chaque contrat, chaque système décisionnel gouvernemental peut reposer sur un grand modèle national. Celui dont le modèle devient l’option par défaut pour les développeurs mondiaux acquiert, de façon invisible, une influence structurelle sur l’économie numérique mondiale.
C’est précisément ce phénomène d’exportation des tokens qui inquiète profondément Washington.
Lorsqu’une base de code, un workflow d’agent ou la logique d’un produit sont construits autour de l’API d’un modèle chinois, le coût de migration augmente de façon exponentielle avec le temps. À ce stade, même une loi américaine restrictive serait contrecarrée par la « résistance des pieds » des développeurs — tout comme aucun programmeur aujourd’hui ne pourrait se passer de GitHub.
L’exportation actuelle des tokens n’est peut-être que le prélude à une confrontation durable. Les grands modèles chinois ne proclament pas vouloir renverser quoi que ce soit ; ils se contentent, à des prix inférieurs, de fournir leurs services à chaque développeur du monde possédant une clé API.
Cette fois-ci, ce ne sont pas des ingénieurs navals, mais des équipes de développeurs à Hangzhou, Pékin et Shanghai — ainsi que des grappes de GPU fonctionnant jour et nuit dans une province du sud — qui posent les câbles.
Cette course n’a pas de compte à rebours : elle se déroule 24 heures sur 24, son unité de mesure est le token, et son champ de bataille, chaque terminal de développeur.
Bienvenue dans la communauté officielle TechFlow
Groupe Telegram :https://t.me/TechFlowDaily
Compte Twitter officiel :https://x.com/TechFlowPost
Compte Twitter anglais :https://x.com/BlockFlow_News












