深潮 TechFlow 消息,5 月 13 日,由 Manic.Trade 发起的 AI 交易 Agent 基准测评 SMART Benchmark 已正式收官。本次测评共完成 387 次评估,覆盖 180 名测试者、46 个模型及 15+ 模型家族,为目前涵盖模型最多的交易 Agent 横向评测。主要围绕实时数据处理、多源情报获取、市场分析、交易决策和风险控制五个维度展开。
结果显示,Claude 家族以 75.9 分排名第一,DeepSeek 以 74.4 分排名第二,GPT 家族则仅位列第九。单模型方面,Claude 4.7 Opus 以 80.8 分成为平均分最高的模型;DeepSeek V4 Pro 以 78.6 分排名第二;Claude 4.6 Opus 以 78.5 分排名第三,并贡献了全场唯一一次 S 级成绩,最高分达到 90/100。
值得注意的是,DeepSeek 在 Market Analysis 维度得分 15.9,超过 Claude 的 15.4。Manic.Trade 表示,本次测评显示,当前 AI 交易 Agent 的差距并不主要体现在能否做出交易决策,而是体现在多源信息整合、可验证数据处理和风险控制等更接近真实交易执行的能力上。
目前,用户可访问 Manic.Trade 查看完整报告,并体验面向人类交易员和 AI Agent 的加密价格预测市场。




