
Alpha Arena phơi bày điểm yếu giao dịch AI: Các mô hình phương Tây mất 80% vốn trong một tuần
Tuyển chọn TechFlowTuyển chọn TechFlow

Alpha Arena phơi bày điểm yếu giao dịch AI: Các mô hình phương Tây mất 80% vốn trong một tuần
Thị trường là bài kiểm tra tối hậu của AI.
Bài viết: Juan Galt
Biên dịch: AididiaoJP, Foresight News
AI có thể giao dịch tiền mã hóa không? Jay Azhang, một kỹ sư máy tính kiêm chuyên gia tài chính tại New York, đang thử nghiệm câu hỏi này thông qua Alpha Arena. Dự án này đặt các mô hình ngôn ngữ lớn mạnh nhất đối đầu với nhau, mỗi mô hình được cấp 10.000 USD vốn để xem ai kiếm được nhiều tiền hơn trong giao dịch tiền mã hóa. Các mô hình tham gia bao gồm Grok 4, Claude Sonnet 4.5, Gemini 2.5 pro, ChatGPT 5, Deepseek v3.1 và Qwen3 Max.
Bây giờ bạn có thể nghĩ rằng "Chà, quả là một ý tưởng tuyệt vời!" và sẽ ngạc nhiên khi biết rằng tại thời điểm viết bài này, ba trong số năm AI đang thua lỗ, trong khi hai mô hình nguồn mở của Trung Quốc là Qwen3 và Deepseek đang dẫn đầu.

Đúng vậy, các trí tuệ nhân tạo độc quyền mạnh nhất từ phương Tây, do các gã khổng lồ như Google và OpenAI vận hành và không công khai mã nguồn, đã mất hơn 8.000 USD chỉ trong hơn một tuần, tương đương 80% vốn giao dịch tiền mã hóa ban đầu, trong khi các đối thủ nguồn mở đến từ phương Đông lại đang có lợi nhuận.
Giao dịch thành công nhất cho đến nay? Qwen3 duy trì lợi nhuận liên tục nhờ vào vị thế mua Bitcoin đơn giản với đòn bẩy 20 lần. Grok 4, không bất ngờ, đã dành phần lớn thời gian cuộc thi đặt cược mua Dogecoin với đòn bẩy 10 lần, từng cùng Deepseek dẫn đầu bảng xếp hạng nhưng hiện tại gần như thua lỗ 20%. Có lẽ Elon Musk nên đăng một biểu tượng cảm xúc về Dogecoin để giúp Grok thoát khỏi khó khăn.

Trong khi đó, Gemini của Google thì kiên định xu hướng giảm, bán khống tất cả các tài sản tiền mã hóa có thể giao dịch — một lập trường phản ánh chính sách tiền mã hóa tổng thể của họ trong suốt 15 năm qua.
Cuối cùng, nó đã thực hiện liên tiếp một tuần toàn những giao dịch sai lầm nghiêm trọng; để đạt được mức độ tệ hại như vậy cũng cần phải có kỹ năng, đặc biệt khi Qwen3 chỉ đơn thuần là mua Bitcoin. Nếu đây là đỉnh cao mà AI đóng nguồn có thể mang lại, thì có lẽ OpenAI nên tiếp tục giữ kín mã nguồn để tránh gây tổn thất cho chúng ta.
Một tiêu chuẩn mới cho AI
Ý tưởng đặt các mô hình AI đối đầu nhau trong sân chơi giao dịch tiền mã hóa mang lại một số hiểu biết sâu sắc. Trước tiên, AI không thể tìm thấy câu trả lời cho bài kiểm tra giao dịch tiền mã hóa trong quá trình huấn luyện trước vì lĩnh vực này hoàn toàn không thể dự đoán — điều mà các bài kiểm tra truyền thống thường gặp phải. Nói cách khác, nhiều mô hình AI đã được cung cấp sẵn câu trả lời cho một số bài kiểm tra trong quá trình huấn luyện, do đó tự nhiên đạt kết quả tốt khi kiểm tra. Tuy nhiên, một số nghiên cứu cho thấy chỉ cần thay đổi đôi chút cách đặt câu hỏi thì kết quả đánh giá AI cũng thay đổi rất lớn.
Tranh cãi này dẫn đến một câu hỏi: đâu là bài kiểm tra tối hậu của trí tuệ? Theo Elon Musk, người sáng tạo ra Grok 4 và là fan hâm mộ Iron Man, việc dự đoán tương lai chính là thước đo tối thượng của trí tuệ.

Và chúng ta phải thừa nhận rằng, không có điều gì trong tương lai khó dự đoán hơn giá ngắn hạn của tiền mã hóa. Như Azhang nói: "Mục tiêu của Alpha Arena là đưa các bài kiểm tra sát gần với thế giới thực hơn, và thị trường chính là môi trường hoàn hảo. Chúng biến động, đối kháng, mở và luôn không thể dự đoán. Chúng thách thức AI theo cách mà các bài kiểm tra tĩnh không thể làm được. Thị trường là bài kiểm tra tối hậu dành cho AI."
Suy nghĩ sâu sắc về thị trường này bắt rễ sâu trong các nguyên tắc tự do mà Bitcoin được sinh ra. Những nhà kinh tế học như Murray Rothbard và Milton Friedman đã chỉ ra từ hơn một thế kỷ trước rằng bản chất thị trường là điều mà chính phủ trung ương không thể dự đoán; chỉ khi những cá nhân thực sự chịu tổn thất đưa ra quyết định kinh tế, thì mới có thể thực hiện phép tính kinh tế hợp lý.
Nói cách khác, thị trường là thứ khó dự đoán nhất, bởi vì nó phụ thuộc vào quan điểm và quyết định cá nhân của hàng triệu cá thể thông minh trên toàn thế giới, do đó nó cũng là bài kiểm tra tốt nhất cho trí tuệ.
Azhang nhấn mạnh trong mô tả dự án rằng việc chỉ đạo AI giao dịch không chỉ nhằm mục đích lợi nhuận mà còn phải xem xét lợi nhuận đã điều chỉnh theo rủi ro. Khía cạnh rủi ro này cực kỳ quan trọng, vì một giao dịch tồi tệ có thể xóa sạch toàn bộ lợi nhuận tích lũy trước đó, như trường hợp sụp đổ danh mục đầu tư của Grok 4.
Cũng tồn tại một vấn đề khác: liệu các mô hình này có thực sự học hỏi từ trải nghiệm giao dịch tiền mã hóa của chính mình hay không — điều này về mặt kỹ thuật không dễ thực hiện, vì chi phí huấn luyện trước cho các mô hình AI rất cao. Chúng có thể được tinh chỉnh bằng lịch sử giao dịch của chính mình hoặc của người khác, thậm chí có thể lưu các giao dịch gần đây vào bộ nhớ ngắn hạn hoặc cửa sổ ngữ cảnh, nhưng điều đó chỉ giúp được một chừng mực. Cuối cùng, mô hình AI giao dịch đúng đắn có lẽ phải thực sự học hỏi từ chính trải nghiệm của bản thân — công nghệ này gần đây đã được giới thiệu trong giới học thuật, nhưng vẫn còn dài đường để trở thành sản phẩm. MIT gọi chúng là các mô hình AI tự thích nghi.
Làm sao để biết đây không chỉ là may mắn?
Một phân tích khác đối với dự án và kết quả hiện tại là nó có thể không phân biệt được với "chuyển động ngẫu nhiên". Chuyển động ngẫu nhiên giống như tung xúc xắc để ra quyết định mỗi lần. Trên biểu đồ, điều này sẽ trông như thế nào? Thực tế có một công cụ mô phỏng mà bạn có thể dùng để kiểm chứng — và kết quả thật sự không khác biệt nhiều.

Vấn đề may mắn trong thị trường cũng đã được các học giả như Nassim Taleb mô tả khá kỹ trong tác phẩm "Antifragile". Ông lập luận rằng về mặt thống kê, hoàn toàn bình thường và có thể xảy ra khi một nhà giao dịch, ví dụ như Qwen3, may mắn liên tục suốt cả tuần! — điều này khiến họ dường như sở hữu khả năng suy luận vượt trội. Quan điểm của Taleb đi xa hơn: ông cho rằng ở Phố Wall có đủ nhiều nhà giao dịch đến mức việc một người nào đó dễ dàng may mắn liên tục 20 năm, xây dựng danh tiếng như thần thánh, và khiến mọi người xung quanh tin rằng họ là thiên tài — cho đến khi may mắn cạn kiệt — là điều hoàn toàn có thể xảy ra.
Do đó, để Alpha Arena tạo ra dữ liệu có giá trị, nó thực sự cần phải chạy trong thời gian dài, và các mô hình, kết quả cũng cần được tái tạo độc lập, đồng thời phải liên quan đến rủi ro vốn thật, trước khi có thể khẳng định nó khác biệt với chuyển động ngẫu nhiên.
Tóm lại, cho đến nay, việc chứng kiến các mô hình nguồn mở, tiết kiệm chi phí như DeepSeek vượt trội so với các đối thủ đóng nguồn là điều đáng chú ý. Alpha Arena cho đến nay là một nguồn giải trí thú vị, khi đã lan truyền mạnh mẽ trên X.com tuần trước. Tương lai của nó thì không ai đoán trước được; chúng ta sẽ phải chờ xem canh bạc mà người sáng tạo ra nó đặt cược — trao 50.000 USD cho năm chatbot để đánh bạc vào tiền mã hóa — cuối cùng có được đền đáp hay không.
Chào mừng tham gia cộng đồng chính thức TechFlow
Nhóm Telegram:https://t.me/TechFlowDaily
Tài khoản Twitter chính thức:https://x.com/TechFlowPost
Tài khoản Twitter tiếng Anh:https://x.com/BlockFlow_News












