
6 grands IA s'affrontent dans une bataille de trading, le test de Turing à la sauce crypto aura-t-il un bon résultat ?
TechFlow SélectionTechFlow Sélection

6 grands IA s'affrontent dans une bataille de trading, le test de Turing à la sauce crypto aura-t-il un bon résultat ?
Un bon IA est celui qui sait gagner de l'argent.
Rédaction : David, TechFlow
Bonne nouvelle : après le krach historique du 11 octobre, les échanges cryptos reprennent de l’activité.
Mauvaise nouvelle : c’est une IA qui trade.
En cette début de semaine, le marché s’anime. Un projet nommé nof1.ai suscite de nombreuses discussions sur les réseaux sociaux crypto.
L’attention est simple : observer en direct six grands modèles d’IA trader des actifs numériques sur Hyperliquid, et voir lequel gagne le plus d’argent.

Attention, ce n’est pas un compte virtuel. Claude, GPT-5, Gemini, Deepseek, Grok et Qwen disposent chacun de 10 000 dollars en argent réel pour trader sur Hyperliquid. Toutes les adresses sont publiques, et chacun peut suivre en temps réel cette « bataille entre traders IA » via ce lien.
L’élément intéressant ? Ces six IA utilisent exactement les mêmes instructions (prompt) et reçoivent les mêmes données de marché. La seule variable, c’est leur manière propre de « penser ».
En quelques jours seulement après son lancement le 18 octobre, certaines IA ont déjà gagné plus de 20 %, tandis que d'autres affichent des pertes proches de 40 %.
En 1950, Turing a proposé le célèbre test de Turing pour répondre à la question « Une machine peut-elle penser comme un humain ? ». Aujourd’hui, dans le monde crypto, six grandes IA s’affrontent dans un champ de bataille Alpha pour répondre à une question encore plus captivante :
Si l’on laisse les IA les plus intelligentes trader sur un vrai marché, laquelle survivra ?
Dans cette version crypto du « test de Turing », le solde du compte pourrait bien être le seul juge impartial.
Gagner de l'argent, c'est tout ce qui compte : Deepseek en tête
Les évaluations classiques des IA — qu’il s’agisse d’écrire du code, de résoudre des problèmes mathématiques ou de produire des textes — se déroulent dans un environnement « statique ».
Les questions sont fixes, les réponses prévisibles, voire déjà présentes dans les données d’entraînement.
Mais le marché crypto est différent.
Dans un contexte d’asymétrie d’information extrême, chaque prix change à chaque seconde, sans réponse standard, seulement des gains ou des pertes. Plus important encore, le marché crypto est typiquement un jeu à somme nulle : votre profit est la perte d’un autre. Le marché punit immédiatement et sans pitié chaque erreur de décision.
Le projet Nof1, organisateur de cette bataille entre IA, affirme clairement sur son site :
Markets are the ultimate test of intelligence (Les marchés sont le test ultime de l’intelligence).

Si le test de Turing classique demande : « Peux-tu faire croire à un humain que tu es humain ? », alors cet Alpha Arena pose plutôt la question suivante :
Peux-tu gagner de l’argent sur le marché crypto ? C’est en réalité cela que les investisseurs attendent vraiment des IA.
Actuellement, les adresses des six grands modèles sur Hyperliquid sont publiques, vous pouvez facilement consulter leurs positions et historiques de trading.

Par ailleurs, le site nof1.ai affiche en interface toutes les transactions passées, positions, profits et processus de réflexion des IA, permettant à tous de s’y référer aisément.
Pour les lecteurs totalement novices, voici les règles précises du jeu :
Chaque IA dispose d’un capital initial de 10 000 dollars, et peut trader des contrats perpétuels sur BTC, ETH, SOL, BNB, DOGE et XRP, avec pour objectif de maximiser les rendements sous contrôle du risque. Chaque IA décide librement du moment d’ouvrir ou fermer une position, ainsi que du levier utilisé. La saison 1 durera plusieurs semaines selon l’évolution, et la saison 2 inclura des mises à jour importantes.
Au 20 octobre, soit trois jours après le début des opérations, la situation est déjà nettement différenciée.

Le groupe de tête est mené par Deepseek Chat V3.1, avec un capital de 12 533 $ (+25,33 %). Juste derrière, Grok-4 atteint 12 147 $ (+21,47 %), suivi par Claude Sonnet 4.5 à 11 047 $ (+10,47 %).
Qwen3 Max affiche une performance modeste à 10 263 $ (+2,63 %). GPT-5 accuse un retard significatif avec 7 442 $ (-25,58 %). Et le plus mauvais résultat revient à Gemini 2.5 Pro, à 6 062 $ (-39,38 %).
Le succès de Deepseek est à la fois surprenant et logique.
Surprenant, car ce modèle est bien moins médiatisé que GPT ou Claude dans la communauté IA internationale. Logique, car Deepseek est soutenu par l’équipe de HF Quant (Huafang Quant).
Ce géant de la finance quantitative, dont l’actif sous gestion dépasse les mille milliards de yuans, a bâti sa réputation sur les algorithmes de trading. Du trading quantitatif aux grands modèles d’IA, puis au trading réel sur crypto, Deepseek semble revenir à ses racines.
À titre de comparaison, GPT-5 d’OpenAI affiche une perte supérieure à 25 %, et Gemini de Google fait encore pire, avec près de 40 % de pertes en 44 transactions.
Dans un scénario de trading réel, il semblerait que la simple puissance linguistique ne suffise pas : la compréhension du marché prime.
Même arme, techniques différentes
Si vous suivez Alpha Arena depuis le 18 octobre, vous avez vu que les IA étaient initialement très proches, mais que leurs performances se sont rapidement écartées.
À la fin du premier jour, Deepseek, le meilleur, n’avait gagné que 4 %, tandis que Qwen3, le plus faible, avait perdu 5,26 %. La plupart des IA oscillaient entre +2 % et -2 %, comme si elles testaient le marché.
Mais le 20 octobre, la tendance bascule. Deepseek bondit à +25,33 %, alors que Gemini chute à -39,38 %. En seulement trois jours, l’écart entre le meilleur et le pire atteint 65 points de pourcentage.
Encore plus intéressant : la différence de fréquence de trading.
Gemini a effectué 44 transactions, soit environ 15 par jour, comme un trader spéculatif anxieux. Claude n’en a réalisé que 3, et Grok conserve même des positions ouvertes. Cette divergence ne peut pas s’expliquer par les instructions, puisqu’elles sont identiques pour tous.

En analysant les gains/pertes, Deepseek a subi une perte maximale unique de 348 dollars, mais un gain total de 2 533 dollars. Gemini a eu un gain maximum de 329 dollars, mais une perte maximale de 750 dollars.
Les différents modèles (grands modèles publics non affinés spécifiquement) adoptent des approches radicalement différentes de l’équilibre risque/rendement.
De plus, vous pouvez consulter dans l’onglet « Model Chat » du site les historiques de discussion et processus de pensée de chaque modèle. Ces monologues sont fascinants.

Tout comme les traders humains ont des styles différents, les IA semblent aussi exprimer des personnalités distinctes. Les transactions fréquentes et la pensée de Gemini ressemblent à celles d’un hyperactif, Claude est prudent comme un fonds conservateur, Deepseek est stable comme un vétéran du trading quantitatif, annonçant simplement ses positions, sans aucun commentaire émotionnel.
Ces traits de caractère ne semblent pas programmés, mais émergent naturellement pendant l’entraînement. Face à l’incertitude, chaque IA adopte une stratégie de réponse différente.
Toutes les IA voient les mêmes graphiques, les mêmes volumes, la même profondeur de marché. Elles utilisent même les mêmes prompts. Alors, d’où viennent ces écarts considérables ?
L’impact des données d’entraînement est probablement clé.
Huafang Quant, derrière Deepseek, a accumulé pendant des années des données massives de trading et des stratégies. Même si ces données ne sont pas directement utilisées pour entraîner le modèle, influencent-elles la perception de l’équipe sur « ce qu’est une bonne décision de trading » ?
En comparaison, les données d’entraînement d’OpenAI et Google proviennent surtout d’articles académiques et de textes web, ce qui peut manquer de réalisme face au trading en conditions réelles.
Des traders suggèrent également que Deepseek a pu optimiser sa capacité de prédiction de séries temporelles lors de l’entraînement, tandis que GPT-5 excellerait davantage en traitement du langage naturel. Face à des données structurées comme les graphiques de prix, les architectures réagissent différemment.
Regarder les IA trader, c’est aussi un business
Alors que tout le monde observe les gains et pertes des IA, peu prêtent attention à l’entreprise mystérieuse derrière.
Le projet nof1.ai, initiateur de cette bataille entre IA, n’a pas grande notoriété. Mais en examinant sa liste de comptes suivis sur les réseaux, on trouve quelques indices.
Derrière nof1.ai ne semblent pas se trouver des entrepreneurs crypto classiques, mais plutôt une équipe homogène de chercheurs en IA d’obédience académique.
Le profil de Jay A Zhang (fondateur) est particulièrement intéressant :
"Grand amateur des boucles étranges – cybernétique, RL, biologie, marchés, méta-apprentissage, réflexivité".
La « réflexivité » est la théorie centrale de Soros : la perception des participants influence le marché, et l’évolution du marché influe à son tour sur leur perception. Faire un tel expérimentation sur le trading IA par quelqu’un qui étudie la « réflexivité » a quelque chose de presque inévitable.
Permettre à tous de voir comment les IA tradent, et observer comment cette « observation » elle-même affecte le marché.

Un autre cofondateur, Matthew Siper, est doctorant en apprentissage automatique à l’Université de New York, et chercheur scientifique en IA. Qu’un étudiant non diplômé dirige un tel projet renforce l’impression qu’il s’agit d’une validation de recherche académique.
Parmi les comptes suivis par nof1, on trouve aussi des chercheurs de Google DeepMind et un professeur associé de l’Université de New York spécialisé en IA et jeux.
À la lumière de leurs actions et profils, Nof1 ne cherche visiblement pas juste un effet de mode. Le nom de la plateforme SharpeBench est ambitieux : le ratio de Sharpe étant la référence pour mesurer le rendement ajusté au risque. Leur véritable objectif pourrait bien être de créer une plateforme de benchmark pour les capacités de trading des IA.
On soupçonne que Nof1 bénéficie d’un fort soutien financier, ou qu’il prépare le terrain pour des services de trading automatisé par IA.
S’ils proposaient un abonnement aux stratégies de Deepseek, nombreux seraient ceux à payer. À partir de ce prototype, développer des solutions de gestion automatisée par IA, d’abonnement à des stratégies ou de services pour entreprises, est un business tout à fait envisageable.
Au-delà de l’équipe, observer le trading des IA peut lui-même générer des profits.
Dès le lancement d’Alpha Arena, certains ont commencé à copier les trades.
La stratégie la plus simple consiste à suivre aveuglément Deepseek : acheter ce qu’il achète, vendre ce qu’il vend. D’autres jouent en sens inverse, prenant systématiquement la position opposée à celle de Gemini.
Mais copier comporte un problème : quand tout le monde sait que Deepseek va acheter, la stratégie reste-t-elle efficace ? C’est précisément ce que Jay Zhang appelle la réflexivité : l’observation modifie l’objet observé.
Il y a aussi une illusion de démocratisation des stratégies de haut niveau.
En apparence, chacun connaît la stratégie des IA, mais en réalité, on ne voit que les résultats, pas la logique. La logique de prise de bénéfice ou de stop-loss de chaque IA n’est pas nécessairement cohérente ou fiable.
Alors que Nof1 teste le comportement des IA en trading, les petits investisseurs cherchent la formule magique, d’autres traders espionnent les techniques, et les chercheurs collectent des données.
Seules les IA ignorent qu’elles sont observées, continuant à exécuter sérieusement chaque transaction. Si le test de Turing classique porte sur la « tromperie » et l’« imitation », la bataille actuelle d’Alpha Arena reflète la réponse des acteurs crypto à la capacité et aux résultats des IA.
Dans ce marché crypto axé sur les résultats, une IA capable de gagner de l’argent pourrait bien être plus importante qu’une IA capable de parler.
Bienvenue dans la communauté officielle TechFlow
Groupe Telegram :https://t.me/TechFlowDaily
Compte Twitter officiel :https://x.com/TechFlowPost
Compte Twitter anglais :https://x.com/BlockFlow_News














