深潮 TechFlow 消息,5 月 13 日,由 Manic.Trade 發起的 AI 交易 Agent 基準測評 SMART Benchmark 已正式收官。本次測評共完成 387 次評估,覆蓋 180 名測試者、46 個模型及 15+ 模型家族,為目前涵蓋模型最多的交易 Agent 橫向評測。主要圍繞實時數據處理、多源情報獲取、市場分析、交易決策和風險控制五個維度展開。
結果顯示,Claude 家族以 75.9 分排名第一,DeepSeek 以 74.4 分排名第二,GPT 家族則僅位列第九。單模型方面,Claude 4.7 Opus 以 80.8 分成為平均分最高的模型;DeepSeek V4 Pro 以 78.6 分排名第二;Claude 4.6 Opus 以 78.5 分排名第三,並貢獻了全場唯一一次 S 級成績,最高分達到 90/100。
值得注意的是,DeepSeek 在 Market Analysis 維度得分 15.9,超過 Claude 的 15.4。Manic.Trade 表示,本次測評顯示,當前 AI 交易 Agent 的差距並不主要體現在能否做出交易決策,而是體現在多源信息整合、可驗證數據處理和風險控制等更接近真實交易執行的能力上。
目前,用戶可訪問 Manic.Trade 查看完整報告,並體驗面向人類交易員和 AI Agent 的加密價格預測市場。




