TechFlow đưa tin, ngày 13 tháng 5, bài kiểm tra chuẩn hóa SMART Benchmark dành cho các Agent giao dịch AI do Manic.Trade khởi xướng đã chính thức khép lại. Đợt đánh giá này đã hoàn thành tổng cộng 387 lượt đánh giá, bao quát 180 người tham gia kiểm thử, 46 mô hình và hơn 15 họ mô hình, hiện là cuộc đánh giá ngang tầm rộng nhất dành cho các Agent giao dịch xét về số lượng mô hình được kiểm tra. Đánh giá tập trung chủ yếu vào năm khía cạnh: xử lý dữ liệu thời gian thực, thu thập thông tin từ nhiều nguồn, phân tích thị trường, ra quyết định giao dịch và kiểm soát rủi ro.
Kết quả cho thấy họ mô hình Claude dẫn đầu với 75,9 điểm, DeepSeek đứng thứ hai với 74,4 điểm, trong khi họ mô hình GPT chỉ xếp vị trí thứ chín. Về từng mô hình riêng lẻ, Claude 4.7 Opus đạt 80,8 điểm — cao nhất về điểm trung bình; DeepSeek V4 Pro xếp thứ hai với 78,6 điểm; Claude 4.6 Opus đạt 78,5 điểm, đứng thứ ba, đồng thời là mô hình duy nhất đạt cấp độ S trong toàn bộ đợt đánh giá, với điểm số cao nhất đạt 90/100.
Đáng chú ý, DeepSeek đạt 15,9 điểm ở tiêu chí Phân tích thị trường (Market Analysis), vượt qua mức 15,4 điểm của Claude. Manic.Trade nhận định rằng kết quả đánh giá lần này cho thấy khoảng cách giữa các Agent giao dịch AI hiện nay không nằm chủ yếu ở khả năng đưa ra quyết định giao dịch, mà chủ yếu nằm ở những năng lực gần hơn với thực tiễn giao dịch thực tế như: tích hợp thông tin từ nhiều nguồn, xử lý dữ liệu có thể xác minh và kiểm soát rủi ro.
Hiện tại, người dùng có thể truy cập Manic.Trade để xem báo cáo đầy đủ và trải nghiệm thị trường dự báo giá tiền mã hóa dành riêng cho cả nhà giao dịch con người lẫn Agent AI.




