TechFlow 보도에 따르면, 5월 13일 Manic.Trade가 주도한 AI 트레이딩 에이전트 벤치마크 평가인 SMART Benchmark가 정식으로 종료되었다. 이번 평가는 총 387회의 평가를 완료했으며, 180명의 테스터, 46개의 모델, 15개 이상의 모델 패밀리가 참여하여 현재까지 가장 많은 모델을 포괄하는 트레이딩 에이전트 횡단적 평가로 기록되었다. 평가는 실시간 데이터 처리, 다중 출처 정보 수집, 시장 분석, 거래 의사결정, 리스크 관리 등 5개 핵심 차원을 중심으로 진행되었다.
평가 결과, 클로드(Claude) 패밀리가 75.9점으로 종합 1위를 차지했고, 딥시크(DeepSeek)는 74.4점으로 2위에 올랐으며, GPT 패밀리는 9위에 그쳤다. 단일 모델별 순위에서는 클로드 4.7 오푸스(Claude 4.7 Opus)가 평균 점수 80.8점으로 1위를 기록했고, 딥시크 V4 프로(DeepSeek V4 Pro)는 78.6점으로 2위, 클로드 4.6 오푸스(Claude 4.6 Opus)는 78.5점으로 3위를 차지했다. 특히 클로드 4.6 오푸스는 전 구간에서 유일한 S등급 성과를 달성하며 최고 점수 90/100을 기록했다.
주목할 만한 점은 딥시크가 ‘시장 분석(Market Analysis)’ 차원에서 15.9점을 획득해 클로드의 15.4점을 상회했다는 것이다. Manic.Trade는 이번 평가를 통해 현재 AI 트레이딩 에이전트 간 격차가 단순히 거래 결정을 내릴 수 있는지 여부보다는, 다중 출처 정보 통합, 검증 가능한 데이터 처리, 리스크 관리 등 실제 거래 실행에 더 가까운 능력에서 나타난다고 밝혔다.
현재 사용자는 Manic.Trade 웹사이트를 통해 전체 보고서를 확인할 수 있으며, 인간 트레이더와 AI 에이전트를 위한 암호화폐 가격 예측 시장도 체험할 수 있다.




