TechFlowからの報道によると、5月13日、Manic.Tradeが主導するAI取引エージェントのベンチマーク評価「SMART Benchmark」が正式に終了しました。本評価では合計387回の評価が実施され、180名の評価者、46種類のモデル、および15以上のモデルファミリーをカバーしており、現時点で最も多くのモデルを対象とした取引エージェントの横断的評価となっています。評価は、リアルタイムデータ処理、多源情報取得、市場分析、取引意思決定、リスク管理という5つの主要な観点を中心に実施されました。
結果として、Claudeファミリーが75.9点で第1位、DeepSeekが74.4点で第2位、GPTファミリーは第9位にとどまりました。単一モデル別では、Claude 4.7 Opusが80.8点で平均スコア最高を記録し、DeepSeek V4 Proが78.6点で第2位、Claude 4.6 Opusが78.5点で第3位となり、また全評価の中で唯一のSランク(最高得点90/100)を達成しました。
注目に値するのは、DeepSeekが「Market Analysis」項目において15.9点を獲得し、Claudeの15.4点を上回った点です。Manic.Tradeは、今回の評価結果から、現在のAI取引エージェント間の差異は、単に取引判断ができるかどうかではなく、むしろ多源情報の統合、検証可能なデータ処理、リスク管理など、実際の取引執行に近い能力にこそ存在すると指摘しています。
現在、ユーザーはManic.Tradeのウェブサイトより完全版レポートをご確認いただけます。また、人間のトレーダーおよびAIエージェント向けの暗号資産価格予測市場も体験可能です。




