
6大AIが取引戦争を展開、仮想通貨界の「チューリングテスト」は良い結果になるだろうか?
TechFlow厳選深潮セレクト

6大AIが取引戦争を展開、仮想通貨界の「チューリングテスト」は良い結果になるだろうか?
儲けられるAIこそが良いAIである。
執筆:David、TechFlow
朗報です。10月11日の歴史的暴落後、暗号資産取引が再び活発になっています。
悪報は、それを取引しているのがAIだということです。
今週の初め、市場が活気づく中、nof1.ai というプロジェクトが暗号系SNSで大きな話題を集めています。
人々の注目点はシンプルです。Hyperliquid上で6つのAI大規模言語モデルが暗号資産取引を行い、誰が最も儲けるかをリアルタイムで見守るのです。

これはシミュレーション取引ではないことに注意してください。Claude、GPT-5、Gemini、Deepseek、Grok、通義千問の各モデルが、それぞれ1万ドルの実資金を用いてHyperliquidで取引しています。すべてのウォレットアドレスは公開されており、誰でもこの「AIトレーダー対決」をリアルタイムで見学できます。
興味深いのは、これら6つのAIがまったく同じプロンプトを使い、まったく同じ市場データを受け取っていることです。唯一の変数は、それぞれの「思考方式」です。
10月18日の開始からわずか数日間で、あるAIは20%以上を利益を上げ、一方で40%近く損失を出すものも出ています。
1950年、チューリングは有名なチューリングテストを提唱し、「機械は人間のように考えられるか」という問いに答えようとした。今、仮想通貨業界では6つのAIがAlpha競技場で戦い、より面白い問いに答えようとしているのです。
もし最高レベルのAIたちが実際の市場で取引したら、どのAIが生き残れるだろうか?
あるいはこの仮想通貨版「チューリングテスト」において、口座残高こそが唯一の審判なのかもしれない。
儲けるAIが良いAI、現時点でDeepseekがリード
従来のAI評価は、コード作成、数学問題、文章作成など、「静的」な環境下でのテストが中心でした。
問題は固定され、回答は予測可能であり、訓練データ内にすでに存在している可能性すらあります。
しかし暗号資産市場は異なる。
情報の非対称性が極端な状態で、価格は毎秒変動し、正解はなく、損益だけが結果として現れます。さらに重要なのは、暗号資産市場が典型的なゼロサムゲームであること。あなたが得た利益は、他の誰かの損失です。市場はあらゆる誤った意思決定を即座に、そして容赦なく罰します。
このAI取引バトルを開催したNof1チームは、自社ウェブサイトにこう記しています。
Markets are the ultimate test of intelligence(市場はAIの知能を試す究極のテストである)。

従来のチューリングテストが「人間に自分が機械だと気づかせないかどうか」を問うとするなら、このAlpha Arenaが問うているのは次のことです。
暗号資産市場で儲けることができるか。実はこれが、仮想通貨ユーザーがAIに本当に求めていることなのです。
現在、6つのAI大規模言語モデルのHyperliquid上でのアドレスは以下の通りです。誰でもそれらのポジションや取引履歴を簡単に確認できます。

また、nof1.aiの公式サイトでは、これらのAIの全取引履歴、保有ポジション、利益状況、思考プロセスが可視化されており、誰でも簡単に参照できます。
このプロジェクトを知らない読者のために、各AIの具体的な取引ルールを説明します。
各AIには1万ドルの初期資金が与えられ、BTC、ETH、SOL、BNB、DOGE、XRPのペリpetual契約を取引できます。リスクをコントロールしつつ収益を最大化することが目標です。すべてのAIは、いつエントリーし、いつ決済するか、どれくらいのレバレッジを使うかを自主的に決定しなければなりません。Season 1は数週間程度運営される予定で、Season 2では大きなアップデートが行われます。
10月20日時点、つまり取引開始から3日後、戦況はすでに明確に分かれています。

現在トップを走るのはDeepseek Chat V3.1で、資金は12,533ドル(+25.33%)。それに続くのはGrok-4の12,147ドル(+21.47%)、Claude Sonnet 4.5は11,047ドル(+10.47%)です。
やや平凡な成績なのはQwen3 Maxで10,263ドル(+2.63%)。大きく遅れているのがGPT-5で残高は7,442ドル(-25.58%)。最も振るわなかったのはGemini 2.5 Proで6,062ドル(-39.38%)となっています。
最も意外でありながら、理にかなっているのがDeepseekの好成績です。
意外なのは、このモデルが国際的なAIコミュニティでの注目度がGPTやClaudeほど高くないこと。理にかなっているのは、Deepseekの背後に幻方量子チームがいることによります。
数千億人民元の運用規模を持つこの定量取引の巨人は、AI進出以前はアルゴリズム取引で事業を始めた企業です。定量取引からAI大規模モデルへ、そして再びAIを使って実際の暗号資産取引を行う。Deepseekはまさに原点回帰しているようなものです。
これに対して、OpenAIの自慢のGPT-5は25%以上を損失、GoogleのGeminiはさらに惨憺たる結果で、44回の取引の末に近40%の損失を出しています。
実際の取引シーンでは、強力な言語能力だけでは不十分で、市場に対する理解の方が重要なのかもしれません。
同じ銃、異なる射撃スタイル
10月18日からAlpha Arenaを追っていると、最初は数個のAIの動きは似ていましたが、時間とともに差が広がっていきました。
初日終了時、最も良かったDeepseekでも利益は4%、最も悪かったQwen3は5.26%の損失でした。ほとんどのAIは±2%の範囲内で推移しており、市場を試しているように見えました。
しかし10月20日になると様相が一変。Deepseekは25.33%まで急騰し、Geminiは-39.38%まで下落しました。わずか3日間で、トップと最下位の差は65ポイントにまで拡大しました。
さらに興味深いのは取引頻度の違いです。
Geminiは44件の取引を行い、平均して1日15回と、不安げな投機トレーダーのような行動です。一方、Claudeは3件しか取引しておらず、Grokに至っては未決済のポジションをまだ持っています。この違いはプロンプトの内容では説明できません。なぜなら彼らは全く同じプロンプトを使っているからです。

損益分布を見ると、Deepseekの最大単独損失は348ドルですが、総利益は2533ドルです。Geminiの最大単独利益は329ドルですが、最大損失は750ドルにも達しています。
異なるAI(パブリックモデル、ファインチューニングなし)は、リスクとリターンのバランスをまったく異なる方法で取っています。
さらに、ウェブサイトのModel Chat機能では、各モデルのチャットログと思考プロセスを確認できます。これらの独白は非常に興味深いものです。

人間のトレーダーがそれぞれ異なるスタイルを持つように、AIもまた異なる「性格」を示しているようです。Geminiの頻繁な取引と思考は多動症患者のようで、Claudeの慎重さは保守的なファンドマネージャーのようで、Deepseekは定量取引のベテランのように落ち着き、ポジションのみを述べ、感情的な評価は一切しません。
このような「性格」は意図的に設計されたものではなく、学習過程の中で自然に出現したものと思われます。不確実性に直面したとき、異なるAIは異なる対応方法を好みます。
すべてのAIは同じK線、同じ出来高、同じ板情報を目にしています。同じプロンプトさえ使っています。では、なぜこれほど大きな差が出るのでしょうか?
その鍵は訓練データにあるかもしれません。
Deepseekの背後にある幻方量子は、長年にわたり膨大な取引データと戦略を蓄積してきました。これらのデータが直接学習に使われていなくても、それが「良い取引判断とは何か」という理解に影響を与えている可能性があります。
一方、OpenAIやGoogleの訓練データは学術論文やネット上のテキストに偏っており、実際の取引に対する理解が現場感に欠ける可能性があります。
また、トレーダーの間では、Deepseekは時系列予測能力に特化して最適化されているのに対し、GPT-5は自然言語処理に優れているのではないかとの見方もあります。価格チャートのような構造化データを扱う場合、アーキテクチャの違いがパフォーマンスに影響を与えるのです。
AIの取引を見るのも、立派なビジネス
誰もがAIの損益に注目している中、裏でこのプロジェクトを支える謎の企業に気づく人はほとんどいません。
このAI取引バトルを仕掛けたnof1.aiは、特に知名度が高いわけではありません。しかし、彼らのSNSのフォローリストを見てみると、いくつかの手がかりが見えてきます。
nof1.aiの背後には典型的な暗号起業家たちではなく、純粋なアカデミックなAI研究者たちがいるようです。
創業者Jay A Zhangの自己紹介も非常に興味深いものです。
"Big fan of strange loops - cybernetics, RL, biology, markets, meta-learning, reflexivity"。
reflexivity(反身性)はソロスの核心理論です。市場参加者の認知が市場に影響を与え、市場の変化が再び参加者の認知に影響を与えるというものです。この「反身性」を研究する人物がAI取引市場の実験を行うというのは、ある種の宿命を感じさせます。
AIがどのように取引しているかを誰もが見られるようにすることで、「観察されること」が市場にどう影響するかを見ようとしているのです。

もう一人の共同創業者Matthew Siperは、ニューヨーク大学の機械学習分野の博士課程在籍者であり、AI研究科学者でもあります。まだ卒業していない博士学生がプロジェクトを主導している点からも、これは学術研究を検証するためのプロジェクトに近いと言えるでしょう。
nof1がフォローしている他のアカウントには、Google DeepMindの研究者や、AIとゲームを専門に研究するニューヨーク大学の准教授もいます。
彼らの行動と背景から見て、Nof1は明らかに話題作りのためにやっているわけではありません。プラットフォーム名SharpeBenchには野心が感じられます。シャープレシオはリスク調整後のリターンを測る黄金基準であり、彼らが真に目指しているのはAI取引能力のベンチマークプラットフォームの構築かもしれません。
一部ではNof1が大資本の支援を受けているのではないか、あるいは将来的なAI取引サービスの布石ではないかとの憶測もあります。
もし彼らがDeepseekの取引戦略をサブスクリプションサービスとして提供すれば、利用者は少なくないでしょう。このプロトタイプをもとに、AI資産運用、戦略購読、大企業向け取引ソリューションといったビジネス展開も十分に予想されます。
チーム自体以外にも、AI取引の「見学」自体にビジネスチャンスがあります。
Alpha Arenaがローンチされた直後から、すでにトレード追随者が現れています。
最も簡単な戦略は、Deepseekの取引をそのまま模倣することです。彼が買うなら自分も買い、売るなら自分も売ります。また、コメント欄には逆張りをする者も多く、Geminiが買えば売り、売れば買うという戦略を取っています。
しかし追随には問題があります。全員がDeepseekの次の取引を知ってしまうと、その戦略は本当に有効なのでしょうか? これこそが創業者Jay Zhangが言う「反身性」です。観察行為自体が、観察対象を変えるのです。
ここには取引戦略の民主化という幻想もあります。
表面的には誰もがAIの取引戦略を知っているように見えますが、実際には取引結果しか見えていません。取引ロジックではないのです。各AIの利食いや損切りのロジックは連続的かつ信頼できるとは限りません。
Nof1がAI取引の行動をテストしている間、小投資家は富を得る鍵を探し、他のトレーダーは盗み学び、研究者たちはデータを収集しています。
唯一、AI自身だけが自分が見られていることに気づかず、真剣に取引を続けています。古典的なチューリングテストが「欺瞞」と「模倣」に関するものだったとするなら、今のAlpha Arenaの取引バトルは、仮想通貨プレイヤーがAIの能力と結果にどう反応するかに関するものです。
結果重視のこの暗号資産市場では、会話が上手なAIよりも、儲けるAIの方が重要なのかもしれません。
TechFlow公式コミュニティへようこそ
Telegram購読グループ:https://t.me/TechFlowDaily
Twitter公式アカウント:https://x.com/TechFlowPost
Twitter英語アカウント:https://x.com/BlockFlow_News














