
Alpha Arena révèle les défauts du trading IA : les modèles occidentaux perdent 80 % de leur capital en une semaine
TechFlow SélectionTechFlow Sélection

Alpha Arena révèle les défauts du trading IA : les modèles occidentaux perdent 80 % de leur capital en une semaine
Le marché est le test ultime de l'IA.
Rédaction : Juan Galt
Traduction : AididiaoJP, Foresight News
L'intelligence artificielle peut-elle trader les cryptomonnaies ? Jay Azhang, ingénieur informatique et professionnel de la finance basé à New York, teste précisément cette question via Alpha Arena. Ce projet oppose les plus grands modèles linguistiques entre eux, chacun disposant d’un capital de 10 000 dollars, afin de déterminer lequel parviendra à générer le plus de profits dans le trading de cryptomonnaies. Les modèles impliqués sont Grok 4, Claude Sonnet 4.5, Gemini 2.5 pro, ChatGPT 5, Deepseek v3.1 et Qwen3 Max.
Vous vous dites peut-être maintenant : « Waouh, quelle excellente idée ! » Et vous seriez surpris d'apprendre qu'au moment où cet article est rédigé, trois des cinq IA sont en perte, tandis que deux modèles chinois open source, Qwen3 et Deepseek, prennent la tête.

Oui, les puissantes IA propriétaires, fermées et gérées par des géants occidentaux comme Google et OpenAI, ont perdu plus de 8 000 dollars en un peu plus d'une semaine – soit plus de 80 % de leur capital initial en cryptomonnaies – alors que leurs homologues open source orientaux se trouvent en territoire positif.
Le trade le plus couronné de succès à ce jour ? Qwen3 maintient une position bénéficiaire grâce à une simple prise de position haussière sur le bitcoin avec un effet de levier de 20 fois. Grok 4, sans surprise, a passé la majeure partie du temps à miser massivement sur le dogecoin avec un effet de levier de 10 fois, ayant brièvement occupé la première place aux côtés de Deepseek, mais se retrouve désormais proche d’une perte de 20 %. Peut-être que Elon Musk devrait publier un meme sur le dogecoin pour sortir Grok de cette mauvaise passe.

Parallèlement, Gemini de Google adopte une vision résolument baissière, prenant des positions vendeuses sur tous les actifs cryptos négociables, une posture qui reflète fidèlement sa politique générale en matière de cryptomonnaies au cours des 15 dernières années.
Finalement, il a enchaîné toute une semaine de trades erronés possibles, ce qui demande presque une certaine compétence, surtout quand on sait que Qwen3 s’est contenté de parier sur la hausse du bitcoin. Si c’est là le meilleur niveau que peuvent offrir les IA fermées, alors peut-être OpenAI devrait-il rester fermé, afin de nous éviter des pertes supplémentaires.
Un nouveau benchmark pour l’IA
L'idée de confronter des modèles d'IA dans une arène de trading de cryptomonnaies recèle des implications profondes. Premièrement, les IA ne peuvent pas trouver dans leur entraînement préalable les réponses aux défis du trading en cryptomonnaie, car celui-ci est imprévisible — contrairement aux autres benchmarks traditionnels. En d'autres termes, de nombreux modèles d'IA ont été formés avec les réponses à certains tests, ce qui explique naturellement leurs bons résultats lorsqu'ils y sont soumis. Or, certaines études montrent que modifier légèrement ces tests peut radicalement altérer les performances mesurées.
Ce débat soulève une question essentielle : quel est le test ultime de l’intelligence ? Selon Elon Musk, créateur de Grok 4 et admirateur de Iron Man, prédire l'avenir constitue la mesure suprême de l’intelligence.

Et force est d’admettre qu’il n’existe guère de futur plus incertain que le prix à court terme des cryptomonnaies. Comme l’explique Azhang : « Notre objectif avec Alpha Arena est de rapprocher les benchmarks du monde réel, et les marchés sont parfaits à cet égard. Ils sont dynamiques, adversariaux, ouverts et fondamentalement imprévisibles. Ils mettent à l’épreuve l’IA d’une manière que les benchmarks statiques ne peuvent égaler. Le marché est le test ultime de l’IA. »
Cette vision des marchés s’inscrit profondément dans les principes libertariens ayant présidé à la naissance du bitcoin. Des économistes comme Murray Rothbard et Milton Friedman ont souligné dès il y a plus d’un siècle que les marchés échappent fondamentalement aux prévisions des gouvernements centraux, et que seul un calcul économique rationnel peut émerger lorsque des individus réels assument leurs pertes en prenant des décisions économiques authentiques.
Autrement dit, les marchés sont les entités les plus difficiles à prédire, car elles dépendent des opinions et décisions subjectives d’individus intelligents à travers le monde ; ils constituent donc le test ultime de l’intelligence.
Azhang précise dans la description de son projet que les IA doivent non seulement viser le rendement, mais aussi optimiser le rapport risque-rendement. Cette dimension du risque est cruciale, car une seule mauvaise transaction peut effacer tous les gains antérieurs, comme observé dans l’effondrement du portefeuille de Grok 4.
Un autre problème existe : ces modèles apprennent-ils réellement de leur expérience en trading de cryptomonnaies ? Cela reste techniquement difficile, car le coût d’un entraînement préalable complet pour une IA est extrêmement élevé. Ils peuvent être affinés (fine-tuned) avec leur propre historique de transactions ou celui d’autres, voire conserver leurs opérations récentes en mémoire à court terme ou dans leur fenêtre contextuelle, mais cela ne suffit pas. L’IA idéale pour le trading devra probablement apprendre véritablement de son expérience, une technologie récemment annoncée dans le milieu académique, mais encore loin d’être commercialisable. Le MIT les nomme des modèles d’IA auto-adaptatifs.
Comment savoir si ce n’est pas simplement de la chance ?
Une autre analyse possible de ce projet et de ses résultats jusqu’à présent est qu’il pourrait être indiscernable d’une « marche aléatoire ». Une marche aléatoire revient à lancer un dé pour chaque décision. À quoi cela ressemblerait-il sur un graphique ? Il existe en fait un simulateur permettant d’observer ce phénomène ; visuellement, cela ne différerait pas tant que ça.

La question du hasard sur les marchés a été soigneusement traitée par des intellectuels comme Nassim Taleb dans son ouvrage *Antifragile*. Il y argumente que, d’un point de vue statistique, il est tout à fait normal et possible qu’un trader, par exemple Qwen3, ait de la chance pendant une semaine entière, ce qui donne l’impression d’une capacité de raisonnement exceptionnelle. Taleb va plus loin : il soutient que Wall Street compte suffisamment de traders pour qu’il soit très probable que l’un d’eux connaisse une veine de chance ininterrompue pendant 20 ans, bâtissant une réputation quasi divine, entouré d’admirateurs le considérant comme un génie, jusqu’au moment où sa chance s’épuise.
Par conséquent, pour qu’Alpha Arena produise des données significatives, il devra fonctionner sur une période prolongée, et ses schémas ainsi que ses résultats devront être reproduits indépendamment, avec un risque réel sur capital, avant de pouvoir être distingués d’une simple marche aléatoire.
En fin de compte, constater que des modèles open source comme DeepSeek, rentables et efficaces, surpassent leurs homologues fermés est révélateur. Alpha Arena est jusqu’à présent une excellente source de divertissement, ayant déjà fait le buzz sur X.com la semaine dernière. Nul ne peut prédire ce que sera son avenir ; nous devrons attendre pour savoir si le pari de son créateur – confier 50 000 dollars à cinq chatbots pour parier sur les cryptomonnaies – finira par payer.
Bienvenue dans la communauté officielle TechFlow
Groupe Telegram :https://t.me/TechFlowDaily
Compte Twitter officiel :https://x.com/TechFlowPost
Compte Twitter anglais :https://x.com/BlockFlow_News












