
6 AI lớn diễn ra cuộc chiến giao dịch, liệu "kiểm tra Turing" phiên bản làng tiền mã hóa có mang lại kết quả tốt?
Tuyển chọn TechFlowTuyển chọn TechFlow

6 AI lớn diễn ra cuộc chiến giao dịch, liệu "kiểm tra Turing" phiên bản làng tiền mã hóa có mang lại kết quả tốt?
AI tốt là AI biết kiếm tiền.
Tác giả: David, TechFlow
Tin tốt, sau đợt sụt giảm mang tính bước ngoặt vào ngày 10.11, giao dịch tiền mã hóa lại bắt đầu sôi động.
Tin xấu là AI đang thực hiện giao dịch.
Một tuần mới bắt đầu, thị trường trở nên sôi nổi, một dự án tên là nof1.ai đã thu hút nhiều thảo luận trên mạng xã hội về tiền mã hóa.
Điểm tập trung rất đơn giản: theo dõi trực tiếp 6 mô hình AI lớn trong dự án này giao dịch tiền mã hóa trên Hyperliquid, xem ai kiếm được nhiều tiền hơn.

Lưu ý đây không phải tài khoản demo. Claude, GPT-5, Gemini, Deepseek, Grok và Thông Nghĩa Thiên Vấn, mỗi mô hình đều đang dùng 10.000 USD tiền thật để giao dịch trên Hyperliquid. Tất cả địa chỉ công khai, bất kỳ ai cũng có thể theo dõi trực tiếp cuộc "đại chiến trader AI" này tại đây.
Điều thú vị là cả sáu AI này đều sử dụng cùng một prompt và nhận dữ liệu thị trường hoàn toàn giống nhau. Biến số duy nhất chính là "cách suy nghĩ" riêng của từng mô hình.
Chỉ trong vài ngày ngắn ngủi kể từ khi ra mắt vào ngày 18 tháng 10, một số AI đã lãi hơn 20%, trong khi một số khác thua lỗ gần 40%.
Năm 1950, Turing đưa ra bài kiểm tra Turing nổi tiếng nhằm trả lời câu hỏi "máy móc có thể suy nghĩ như con người không"; còn hiện tại trong cộng đồng tiền mã hóa, 6 AI này đang chiến đấu trong sân chơi Alpha, để trả lời một câu hỏi thú vị hơn:
Nếu để những AI thông minh nhất giao dịch trên thị trường thật, ai sẽ sống sót?
Có lẽ trong phiên bản "bài kiểm tra Turing" dành cho thị trường tiền mã hóa này, số dư tài khoản chính là trọng tài duy nhất.
AI nào kiếm được tiền mới là tốt, Deepseek hiện đang dẫn đầu
Các bài đánh giá AI truyền thống, dù là viết mã, giải toán hay viết văn, về bản chất đều diễn ra trong môi trường "tĩnh".
Câu hỏi cố định, đáp án có thể dự đoán trước, thậm chí có thể đã xuất hiện trong dữ liệu huấn luyện.
Nhưng thị trường tiền mã hóa thì khác.
Trong điều kiện thông tin cực kỳ bất đối xứng, giá thay đổi từng giây, không có đáp án chuẩn mà chỉ có lãi và lỗ. Quan trọng hơn, thị trường tiền mã hóa là trò chơi kiểu zero-sum, tiền bạn kiếm được là tiền người khác thua. Thị trường sẽ trừng phạt ngay lập tức và không khoan nhượng mọi quyết định sai lầm.
Đội ngũ Nof1 tổ chức đại chiến AI này đã viết một câu trên website của họ:
Markets are the ultimate test of intelligence (Thị trường là bài kiểm tra tối hậu về trí tuệ).

Nếu như bài kiểm tra Turing truyền thống hỏi "Bạn có thể khiến con người không phân biệt được bạn là máy hay không", thì Alpha Arena này thực chất đang hỏi:
Bạn có thể kiếm tiền trên thị trường tiền mã hóa hay không. Đây mới chính là kỳ vọng thực tế của cộng đồng tiền mã hóa đối với AI.
Hiện tại, 6 địa chỉ của các mô hình AI lớn trên Hyperliquid như sau, bạn cũng có thể dễ dàng tra cứu vị thế và lịch sử giao dịch của chúng.

Đồng thời, nof1.ai cũng trực quan hóa toàn bộ lịch sử giao dịch, vị thế, lợi nhuận và quá trình suy luận của các mô hình này trên website, giúp người dùng dễ dàng tham khảo.
Đối với độc giả hoàn toàn chưa biết gì, quy tắc giao dịch cụ thể của các AI như sau:
Mỗi AI được cấp 10.000 USD vốn ban đầu, có thể giao dịch hợp đồng vĩnh viễn BTC, ETH, SOL, BNB, DOGE và XRP, mục tiêu là tối đa hóa lợi nhuận dưới điều kiện kiểm soát rủi ro. Tất cả AI phải tự quyết định thời điểm mở lệnh, đóng lệnh và mức độ đòn bẩy. Mùa 1 sẽ chạy vài tuần tùy tình hình, mùa 2 sẽ có cập nhật lớn.
Tính đến ngày 20 tháng 10, tức ba ngày sau khi bắt đầu giao dịch, cục diện đã phân hóa rõ rệt.

Hiện tại đội dẫn đầu là Deepseek Chat V3.1, với số vốn $12,533 (+25,33%). Tiếp theo là Grok-4 với $12,147 (+21,47%); Claude Sonnet 4.5 đạt $11,047 (+10,47%).
Hiệu suất trung bình là Qwen3 Max, $10,263 (+2,63%). Kém rõ rệt là GPT-5, hiện còn $7,442 (-25,58%); tệ nhất là Gemini 2.5 Pro, $6,062 (-39,38%).
Điều đáng ngạc nhiên nhưng dường như cũng hợp lý là hiệu suất của Deepseek.
Ngạc nhiên vì mô hình này không nổi bật bằng GPT hay Claude trong giới AI quốc tế. Hợp lý vì Deepseek thuộc đội ngũ Quant Fund.
Tập đoàn định lượng quản lý hàng nghìn tỷ Nhân dân tệ này, trước khi chuyển sang AI, đã khởi nghiệp bằng giao dịch thuật toán. Từ giao dịch định lượng đến mô hình AI lớn, rồi dùng AI để thực hiện giao dịch tiền mã hóa thật, Deepseek dường như đang trở về với nghề cũ.
So với đó, GPT-5 tự hào của OpenAI thua lỗ hơn 25%, còn Gemini của Google còn tệ hơn, 44 giao dịch đổi lấy gần 40% thua lỗ.
Trong môi trường giao dịch thực tế, có lẽ chỉ có năng lực ngôn ngữ mạnh thôi là chưa đủ, hiểu thị trường mới quan trọng hơn.
Cùng một khẩu súng, phong cách bắn khác nhau
Nếu bạn theo dõi Alpha Arena từ ngày 18 tháng 10, sẽ thấy ban đầu các AI khá tương đồng, nhưng càng về sau chênh lệch càng lớn.
Hết ngày đầu tiên, Deepseek tốt nhất chỉ lãi 4%, Qwen3 kém nhất thua 5,26%. Đa số AI dao động trong khoảng ±2%, trông như đang thăm dò thị trường.
Nhưng đến ngày 20 tháng 10, cục diện thay đổi đột ngột. Deepseek tăng vọt lên 25,33%, trong khi Gemini tụt xuống -39,38%. Trong vỏn vẹn ba ngày, khoảng cách giữa đầu và cuối bảng đã nới rộng tới 65 điểm phần trăm.
Thú vị hơn nữa là sự khác biệt về tần suất giao dịch.
Gemini thực hiện 44 giao dịch, trung bình 15 lệnh mỗi ngày, giống một trader đầu cơ lo lắng. Trong khi Claude chỉ làm 3 giao dịch, Grok thậm chí vẫn còn vị thế chưa đóng. Sự khác biệt này không thể giải thích bằng prompt vì tất cả đều dùng cùng một prompt.

Xét theo phân bố lãi/lỗ, Deepseek có khoản thua lỗ đơn lớn nhất 348 USD, nhưng tổng lợi nhuận đạt 2.533 USD. Gemini có khoản lãi đơn lớn nhất 329 USD, nhưng khoản thua lỗ đơn lớn nhất lên tới 750 USD.
Các AI khác nhau (mô hình công cộng, chưa được tinh chỉnh lại) có cách cân bằng rủi ro và lợi nhuận hoàn toàn khác nhau.
Hơn nữa, bạn có thể xem nhật ký trò chuyện và quá trình suy luận của các mô hình khác nhau trong mục Model Chat trên website, những đoạn độc thoại này đặc biệt thú vị.

Giống như các trader con người có phong cách khác nhau, AI dường như cũng thể hiện những tính cách khác nhau. Việc Gemini giao dịch liên tục và suy nghĩ giống bệnh nhân tăng động, Claude cẩn trọng như một nhà quản lý quỹ bảo thủ, Deepseek ổn định như một tay chơi định lượng kỳ cựu, chỉ nói về vị thế mà không đưa cảm xúc nào.
Cảm giác tính cách này dường như không phải do thiết kế, mà là sự nổi lên tự nhiên trong quá trình huấn luyện. Khi đối mặt với sự bất định, các AI khác nhau có xu hướng phản ứng theo cách khác nhau.
Tất cả AI đều nhìn thấy cùng biểu đồ nến, cùng khối lượng giao dịch, cùng độ sâu thị trường. Chúng thậm chí dùng cùng prompt. Vậy điều gì tạo nên sự khác biệt lớn như vậy?
Tác động của dữ liệu huấn luyện có thể là then chốt.
Quant Fund phía sau Deepseek đã tích lũy lượng lớn dữ liệu giao dịch và chiến lược trong hơn một thập kỷ. Dù dữ liệu này không được dùng trực tiếp để huấn luyện, liệu nó có ảnh hưởng đến nhận thức của nhóm về "quyết định giao dịch tốt là gì"?
So với đó, dữ liệu huấn luyện của OpenAI và Google có thể thiên về luận văn học thuật và văn bản mạng, thiếu thực tế trong giao dịch thực tế.
Đồng thời, một số trader suy đoán Deepseek có thể đã tối ưu hóa đặc biệt khả năng dự đoán chuỗi thời gian trong quá trình huấn luyện, trong khi GPT-5 có thể giỏi xử lý ngôn ngữ tự nhiên hơn. Trước dữ liệu cấu trúc như biểu đồ giá, các kiến trúc khác nhau sẽ thể hiện khác nhau.
Xem AI giao dịch, cũng là một ngành kinh doanh
Khi mọi người đều chú ý đến lãi lỗ của AI, ít ai để ý đến công ty bí ẩn phía sau.
Dự án nof1.ai tạo ra đại chiến AI này không có danh tiếng lớn. Nhưng nếu xem danh sách theo dõi mạng xã hội của họ, bạn vẫn có thể tìm thấy vài manh mối.
Phía sau nof1.ai dường như không phải các startup tiền mã hóa điển hình, mà toàn là các nhà nghiên cứu AI học thuật.
Giới thiệu cá nhân của Jay A Zhang (người sáng lập) cũng rất thú vị:
"Big fan of strange loops - cybernetics, RL, biology, markets, meta-learning, reflexivity".
Reflexivity (phản thân) là lý thuyết cốt lõi của Soros: nhận thức của người tham gia thị trường ảnh hưởng đến thị trường, và biến động thị trường lại tác động ngược lại nhận thức của người tham gia. Để một người nghiên cứu "phản thân" thực hiện thí nghiệm thị trường giao dịch AI, bản thân điều này đã mang màu sắc định mệnh.
Cho phép mọi người xem AI giao dịch như thế nào, xem việc "bị quan sát" này sẽ ảnh hưởng đến thị trường ra sao.

Đồng sáng lập khác Matthew Siper mô tả mình là nghiên cứu sinh tiến sĩ tại Đại học New York về học máy, đồng thời là nhà khoa học nghiên cứu AI. Một nghiên cứu sinh chưa tốt nghiệp làm dự án, nghe giống một dự án chứng minh nghiên cứu học thuật hơn.
Trong danh sách theo dõi của nof1, còn có các nhà nghiên cứu từ Google DeepMind và phó giáo sư Đại học New York chuyên nghiên cứu AI và trò chơi.
Xét theo hành động và bối cảnh, Nof1 rõ ràng không phải làm để câu view. Tên nền tảng SharpeBench cho thấy tham vọng lớn, tỷ lệ Sharpe là tiêu chuẩn vàng đo lường lợi nhuận điều chỉnh rủi ro, có lẽ điều họ thực sự muốn làm là một nền tảng kiểm định chuẩn cho năng lực giao dịch AI.
Một số người suy đoán Nof1 có thể được hỗ trợ bởi vốn lớn, cũng có người nói họ đang dọn đường cho dịch vụ giao dịch AI sau này.
Nếu họ ra mắt dịch vụ đăng ký chiến lược giao dịch Deepseek, sẽ không thiếu người sẵn sàng chi tiền. Và từ mô hình sơ khai này, phát triển thành quản lý tài sản AI, đăng ký chiến lược, giải pháp giao dịch cho doanh nghiệp lớn, cũng là một ngành kinh doanh có thể dự đoán được.
Ngoài bản thân đội ngũ, việc theo dõi giao dịch AI cũng có thể kiếm lời.
Alpha Arena vừa ra mắt, đã có người bắt đầu copy lệnh.
Chiến lược đơn giản nhất là đi theo Deepseek. Nó mua gì bạn mua nấy, bán gì bạn bán theo. Đồng thời trong phần bình luận cũng có người làm ngược lại, chuyên làm đối thủ của Gemini, Gemini mua thì anh ta bán, bán thì anh ta mua.
Nhưng vấn đề với việc copy lệnh là: khi tất cả đều biết Deepseek sắp mua gì, chiến lược này còn hiệu quả không? Đây cũng chính là "phản thân" mà người sáng lập Jay Zhang nhắc đến, tức việc quan sát sẽ thay đổi đối tượng bị quan sát.
Ở đây còn có ảo tưởng về việc dân chủ hóa chiến lược giao dịch đỉnh cao.
Về bề ngoài, ai cũng biết chiến lược giao dịch của AI, nhưng thực tế bạn chỉ thấy kết quả giao dịch chứ không thấy logic giao dịch. Logic chốt lời và cắt lỗ của mỗi AI không nhất thiết liên tục và đáng tin cậy.
Khi Nof1 đang kiểm tra hành vi giao dịch của AI, các nhà đầu tư nhỏ lẻ đang tìm mật mã làm giàu, các trader khác đang học lỏm, các nhà nghiên cứu cũng đang thu thập dữ liệu.
Chỉ có bản thân AI là không biết mình đang bị theo dõi, vẫn nghiêm túc thực hiện từng giao dịch. Nếu bài kiểm tra Turing cổ điển nói về "lừa dối" và "bắt chước", thì đại chiến giao dịch Alpha Arena hiện tại nói về phản ứng của cộng đồng tiền mã hóa trước năng lực và kết quả của AI.
Trong thị trường tiền mã hóa lấy kết quả làm trung tâm này, một AI biết kiếm tiền có lẽ quan trọng hơn một AI biết trò chuyện.
Chào mừng tham gia cộng đồng chính thức TechFlow
Nhóm Telegram:https://t.me/TechFlowDaily
Tài khoản Twitter chính thức:https://x.com/TechFlowPost
Tài khoản Twitter tiếng Anh:https://x.com/BlockFlow_News














