GPT đứng thứ 9, DeepSeek vượt mặt Claude, Agent giao dịch mạnh nhất l…

Chuyên sâu báo cáo Web3

Tôi muốn đăng bài

Yêu cầu phỏng vấn

Theo dõi chúng tôi

Cảnh báo rủi ro: mọi nội dung trên website này không cấu thành tư vấn đầu tư và chúng tôi không cung cấp bất kỳ dịch vụ tín hiệu hay dẫn dắt giao dịch nào. Theo thông báo của PBoC và 10 bộ ngành về việc tăng cường phòng ngừa rủi ro đầu cơ tiền mã hóa, xin hãy nâng cao ý thức rủi ro. Liên hệ: [email protected] Mã ICP: 琼ICP备2022009338号

TechFlow đưa tin, ngày 13 tháng 5, bài kiểm tra chuẩn hóa SMART Benchmark dành cho các Agent giao dịch AI do Manic.Trade khởi xướng đã chính thức khép lại. Đợt đánh giá này đã hoàn thành tổng cộng 387 lượt đánh giá, bao quát 180 người tham gia kiểm thử, 46 mô hình và hơn 15 họ mô hình, hiện là cuộc đánh giá ngang tầm rộng nhất dành cho các Agent giao dịch xét về số lượng mô hình được kiểm tra. Đánh giá tập trung chủ yếu vào năm khía cạnh: xử lý dữ liệu thời gian thực, thu thập thông tin từ nhiều nguồn, phân tích thị trường, ra quyết định giao dịch và kiểm soát rủi ro.

Kết quả cho thấy họ mô hình Claude dẫn đầu với 75,9 điểm, DeepSeek đứng thứ hai với 74,4 điểm, trong khi họ mô hình GPT chỉ xếp vị trí thứ chín. Về từng mô hình riêng lẻ, Claude 4.7 Opus đạt 80,8 điểm — cao nhất về điểm trung bình; DeepSeek V4 Pro xếp thứ hai với 78,6 điểm; Claude 4.6 Opus đạt 78,5 điểm, đứng thứ ba, đồng thời là mô hình duy nhất đạt cấp độ S trong toàn bộ đợt đánh giá, với điểm số cao nhất đạt 90/100.

Đáng chú ý, DeepSeek đạt 15,9 điểm ở tiêu chí Phân tích thị trường (Market Analysis), vượt qua mức 15,4 điểm của Claude. Manic.Trade nhận định rằng kết quả đánh giá lần này cho thấy khoảng cách giữa các Agent giao dịch AI hiện nay không nằm chủ yếu ở khả năng đưa ra quyết định giao dịch, mà chủ yếu nằm ở những năng lực gần hơn với thực tiễn giao dịch thực tế như: tích hợp thông tin từ nhiều nguồn, xử lý dữ liệu có thể xác minh và kiểm soát rủi ro.

Hiện tại, người dùng có thể truy cập Manic.Trade để xem báo cáo đầy đủ và trải nghiệm thị trường dự báo giá tiền mã hóa dành riêng cho cả nhà giao dịch con người lẫn Agent AI.

Liên kết gốc

Thêm vào mục ưa thích

Chia sẻ lên mạng xã hội

Tin nhanh 7x24h

Tuyển chọn TechFlow

GPT đứng thứ 9, DeepSeek vượt mặt Claude, Agent giao dịch mạnh nhất lại là phiên bản “lỗi thời” 4.6

7x24h Tin nhanh

GPT đứng thứ 9, DeepSeek vượt mặt Claude, Agent giao dịch mạnh nhất lại là phiên bản “lỗi thời” 4.6