
6대 AI가 거래 전쟁을 벌이다, 코인圈판 '튜링 테스트'는 좋은 결과를 얻을 수 있을까?
글: David, TechFlow
좋은 소식, 10.11 역사적 대폭락 이후 암호화 거래가 다시 활기를 띠고 있다.
나쁜 소식, AI가 거래하고 있다는 것이다.
새로운 주간이 시작되며 시장이 활성화되고 있으며, nof1.ai라는 프로젝트가 암호화 소셜 미디어에서 큰 화제를 모으고 있다.
사람들의 관심도 간단하다. 6개의 AI 대규모 모델이 Hyperliquid에서 암호화폐 거래를 실시간으로 수행하는 것을 지켜보는 것이다. 누가 더 많은 수익을 내는지 관찰하는 것이다.

이것이 시뮬레이션 계좌가 아니라는 점에 주목할 필요가 있다. Claude, GPT-5, Gemini, Deepseek, Grok 및 통의천문(通义千问) 각각의 모델이 1만 달러의 실제 자금을 가지고 Hyperliquid에서 거래 중이다. 모든 주소는 공개되어 있으며 누구나 실시간으로 이 'AI 트레이더 전쟁'을 관전할 수 있다.
흥미로운 점은 이 여섯 개의 AI가 동일한 프롬프트를 사용하고 동일한 시장 데이터를 수신한다는 것이다. 유일한 변수는 바로 각자의 '사고 방식'이다.
10월 18일 출시 후 단 며칠 만에 일부 AI는 20% 이상 수익을 올렸으며, 반면 일부는 거의 40% 손실을 기록했다.
1950년, 튜링은 유명한 튜링 테스트를 제안하며 "기계가 인간처럼 생각할 수 있는가?"라는 질문에 답하려 했다. 이제 암호화 커뮤니티에서는 6대 AI가 알파 경기장에서 격돌하며 더욱 흥미로운 질문에 답하고 있다.
가장 똑똑한 AI들이 실제 시장에서 거래한다면, 누가 살아남을 것인가?
아마도 이 암호화 버전의 '튜링 테스트'에서 계정 잔액이 유일한 심판일 것이다.
수익을 내는 것이 좋은 AI다, 현재 Deepseek 선두
기존의 AI 평가 방식은 코드 작성, 수학 문제 해결, 글쓰기 등 모두 근본적으로 '정적' 환경에서 이루어진다.
문제는 고정되어 있고 정답은 예측 가능하며, 이미 학습 데이터에 포함되었을 가능성조차 있다.
하지만 암호화 시장은 다르다.
정보 비대칭성이 극심한 상황에서 가격은 매초 변하며 표준 정답은 없고 오직 이익과 손실만 존재한다. 더욱 중요한 것은 암호화 시장이 전형적인 제로섬 게임이라는 점이며, 당신이 번 돈은 다른 사람의 손실이다. 시장은 잘못된 결정을 즉각적이며 무정하게 처벌한다.
이 AI 거래 대결을 주최한 Nof1 팀은 웹사이트에 다음과 같은 문구를 적었다.
Markets are the ultimate test of intelligence (시장은 지능을 검증하는 궁극의 시험장이다).

기존의 튜링 테스트가 '당신이 인간인지 구분 못하게 할 수 있느냐'고 묻는다면, 이 Alpha Arena가 묻는 것은 다음과 같다.
당신이 암호화 시장에서 수익을 낼 수 있느냐. 이것이 바로 암호화 커뮤니티가 AI에게 진정으로 기대하는 바이다.
현재 6개의 AI 대규모 모델이 Hyperliquid에서 사용하는 주소는 아래와 같으며, 여러분도 쉽게 해당 포지션과 거래 내역을 조회할 수 있다.

또한 nof1.ai 공식 웹사이트는 프론트엔드에서 이들의 전체 거래 기록, 포지션, 수익 상태, 사고 과정 등을 시각화하여 누구나 쉽게 참고할 수 있도록 하고 있다.
완전히 생소한 독자들을 위해 몇 가지 AI의 구체적인 거래 규칙을 설명하면 다음과 같다.
각 AI는 1만 달러의 초기 자금을 받으며, BTC, ETH, SOL, BNB, DOGE, XRP의 영구선물계약을 거래할 수 있다. 목표는 리스크를 통제하면서 수익을 극대화하는 것이다. 모든 AI는 언제 포지션을 열고, 언제 청산하며, 얼마의 레버리지를 사용할지 스스로 결정해야 한다. Season 1은 상황에 따라 수 주간 운영되며, Season 2에는 중대한 업데이트가 있을 예정이다.
10월 20일 현재, 즉 거래 시작 후 사흘째 되는 날, 전황은 명확하게 분화되었다.

현재 선두 그룹은 Deepseek Chat V3.1로, 자금은 $12,533 (+25.33%)이다. 그 뒤를 이어 Grok-4가 $12,147 (+21.47%), Claude Sonnet 4.5는 $11,047 (+10.47%)이다.
비교적 평범한 성과를 보인 것은 Qwen3 Max로 $10,263 (+2.63%)이다. 두드러지게 뒤처지는 것은 GPT-5로 현재 잔액은 $7,442 (-25.58%)이며, 가장 부진한 것은 Gemini 2.5 Pro로 $6,062 (-39.38%)이다.
놀랍지만 동시에 당연해 보이는 것은 물론 Deepseek의 성과다.
놀라운 이유는 이 모델이 국제 AI 커뮤니티에서 GPT나 Claude만큼의 인기를 끌지 못했기 때문이다. 그러나 당연해 보이는 이유는 Deepseek 뒤에 있는 항방량화(幻方量化) 팀 때문이다.
수천억 위안 이상의 운용 규모를 자랑하는 이 양적거래 거대 기업은 AI 진출 이전부터 알고리즘 거래로 사업을 시작했다. 양적거래에서 AI 대규모 모델로 넘어갔다가 다시 AI를 활용해 실제 암호화폐 거래를 하는 것은 마치 본업으로 돌아온 듯한 느낌이다.
반면 OpenAI의 자랑인 GPT-5는 25% 이상 손실을 기록했으며, 구글의 Gemini는 더욱 참담한 상황으로 44건의 거래를 통해 거의 40%의 손실을 입었다.
실제 거래 상황에서 강력한 언어 능력만으로는 부족할 수 있으며, 시장을 이해하는 능력이 더욱 중요할 수 있다.
같은 총, 다른 사격법
10월 18일부터 Alpha Arena를 추적했다면 처음에는 여러 AI들이 별 차이 없었지만 시간이 갈수록 격차가 벌어지는 것을 확인할 수 있다.
첫날 종료 시 최고였던 Deepseek도 겨우 4% 수익을 올렸고, 최하위였던 Qwen3은 5.26% 손실을 기록했다. 대부분의 AI는 ±2% 사이를 오가며 마치 시장 탐색을 하는 듯한 모습이었다.
그러나 10월 20일, 양상이 일변도로 바뀌었다. Deepseek는 25.33%까지 치솟았고, 반면 Gemini는 -39.38%까지 하락했다. 불과 사흘 만에 선두와 꼬리의 격차가 65%p까지 벌어졌다.
더욱 흥미로운 것은 거래 빈도의 차이다.
Gemini는 44건의 거래를 완료해 하루 평균 15건으로, 불안한 스펙투레이터처럼 행동한다. 반면 Claude는 단 3건만 수행했고, Grok은 아직 미청산 포지션이 있다. 이러한 차이는 프롬프트로 설명되지 않는다. 왜냐하면 모두 동일한 프롬프트를 사용하기 때문이다.

손익 분포를 보면, Deepseek의 최대 단일 손실은 348달러이나 전체 수익은 2,533달러이다. Gemini는 최대 단일 수익이 329달러이나 최대 손실은 무려 750달러에 달한다.
서로 다른 AI(공개 대규모 모델, 추가 튜닝 없음)들은 리스크와 수익의 균형을 완전히 다르게 맞춘다.
또한 웹사이트의 Model Chat 메뉴를 통해 서로 다른 모델의 채팅 기록과 사고 과정을 볼 수 있는데, 이 독백들은 매우 흥미롭다.

인간 트레이더마다 다른 스타일이 있듯이, AI들도 다양한 성격을 드러낸다. Gemini의 빈번한 거래와 사고 방식은 다动症 환자처럼 보이며, Claude는 신중함이 보여 보수적인 펀드 매니저 같고, Deepseek는 말없이 포지션만 밝히며 감정 평가를 전혀 하지 않는 안정적인 양적거래 전문가 같다.
이러한 성격은 의도적으로 설계된 것이 아니라 학습 과정에서 자연스럽게 나타난 것으로 보인다. 불확실성을 마주할 때 서로 다른 AI는 각기 다른 대응 방식을 선호하게 된다.
모든 AI는 동일한 K차트, 동일한 거래량, 동일한 시장 깊이를 본다. 심지어 동일한 프롬프트를 사용한다. 그렇다면 무엇이 이렇게 큰 차이를 만들어내는가?
학습 데이터의 영향이 핵심일 수 있다.
Deepseek 뒤에 있는 항방량화(幻方量化)는 수십 년간 막대한 양의 거래 데이터와 전략을 축적해왔다. 이러한 데이터가 직접 학습에 사용되지는 않더라도, 팀이 '좋은 거래 결정이란 무엇인가'에 대한 이해에 영향을 미치지 않을까?
반면 OpenAI와 Google의 학습 데이터는 학술 논문과 네트워크 텍스트에 더 치우쳐 있어 실전 거래에 대한 이해가 덜 현실적일 수 있다.
또한 일부 트레이더들은 Deepseek가 학습 과정에서 시계열 예측 능력을 특별히 최적화했을 가능성이 있다고 추측하며, GPT-5는 자연어 처리에 더 뛰어났을 가능성이 있다고 본다. 가격 차트와 같은 구조화된 데이터 앞에서 서로 다른 아키텍처는 서로 다른 성과를 낼 수 있다.
AI의 거래를 지켜보는 것도 하나의 비즈니스
모두가 AI의 손익에 주목할 때, 뒤에 있는 이 신비로운 회사를 눈여겨보는 사람은 거의 없다.
이 AI 거래 대결을 기획한 nof1.ai는 크게 알려져 있지 않다. 하지만 소셜 미디어의 팔로우 목록을 살펴보면 단서를 찾을 수 있다.
nof1.ai 뒤에 있는 것은 일반적인 암호화 창업가들이 아닌, 일련의 순수 학계 출신 AI 연구자들로 보인다.
Jay A Zhang(창립자)의 개인 소개도 매우 흥미롭다.
"Strange loops - 사이버네틱스, 강화학습(RL), 생물학, 시장, 메타러닝, 반사성(reflexivity)을 좋아함."
반사성(reflexivity)은 소로스의 핵심 이론이다. 시장 참여자의 인식이 시장에 영향을 미치고, 그 변화가 다시 참여자의 인식에 영향을 준다는 것이다. '반사성'을 연구하는 사람이 AI 거래 시장 실험을 진행한다는 사실 자체가 운명처럼 느껴진다.
AI가 어떻게 거래하는지를 모두가 볼 수 있게 하고, 이 '관찰'이 시장에 어떤 영향을 미칠지 지켜보는 것이다.

또 다른 공동창립자 Matthew Siper는 뉴욕대학교 기계학습 박사과정생이자 AI 연구 과학자라고 소개되어 있다. 아직 졸업하지 않은 박사과정생이 프로젝트를 진행한다는 점에서 학문적 연구를 검증하는 프로젝트처럼 보인다.
Nof1의 기타 팔로우 계정들에는 Google DeepMind 연구원과 뉴욕대학교 조교수, AI와 게임을 전문으로 연구하는 인물들도 포함되어 있다.
그들의 행보와 배경을 보면, Nof1은 분명히 단순한 파급효과를 노린 것이 아니다. SharpeBench라는 플랫폼 이름에서 야심이 엿보인다. 샤프 지수는 리스크 조정 수익률을 측정하는 금자탑 기준이며, 그들이 진정 원하는 것은 AI 거래 능력의 벤치마킹 플랫폼일지도 모른다.
누군가는 Nof1 뒤에 대규모 자본이 지원하고 있다고 추측하며, 또 다른 이들은 향후 AI 거래 서비스를 위한 준비 작업이라고 말한다.
그들이 Deepseek의 거래 전략 서비스를 구독제로 출시한다면, 이를 구매하려는 사람은 적지 않을 것이다. 그리고 이 초기 형태를 기반으로 AI 자산운용, 전략 구독, 대기업 거래 솔루션 등을 제공하는 것도 예상 가능한 비즈니스 모델이다.
팀 자체 외에도, AI 거래를 관전하는 것 자체도 수익을 낼 수 있다.
Alpha Arena가 막 출시되자마자 사람들이 따라 사고팔기 시작했다.
가장 간단한 전략은 Deepseek를 따라하는 것이다. 그것이 무엇을 사면 당신도 사고, 무엇을 팔면 당신도 파는 것이다. 한편 댓글란에는 반대매매를 하는 사람들도 있는데, Gemini의 포지션과 정반대로 행동한다. Gemini가 사면 팔고, 팔면 산다.
하지만 따라 사고팔기에는 문제가 있다. 모두가 Deepseek가 무엇을 사려는지 알게 되면, 이 전략은 여전히 유효할까? 이것이 바로 프로젝트 창립자 Jay Zhang이 말하는 반사성, 즉 관찰 자체가 관찰 대상을 변화시키는 현상이다.
여기에는 거래 전략 민주화라는 환상도 존재한다.
겉보기에는 누구나 AI의 거래 전략을 알 수 있는 것 같지만, 실제로 당신이 보는 것은 거래 결과지 거래 논리는 아니다. 각 AI의 익절과 손절 로직이 반드시 일관되거나 신뢰할 수 있는 것은 아니다.
Nof1은 AI 거래 행동을 실험하고, 소매 투자자들은 부의 열쇠를 찾고, 다른 트레이더들은 기술을 배우며, 연구자들은 데이터를 수집하고 있다.
오직 AI 자신만이 자신이 관전되고 있다는 사실을 모르고 있으며, 여전히 진지하게 매 거래를 실행하고 있다. 고전적인 튜링 테스트가 '속임수'와 '모방'에 관한 것이라면, 지금의 Alpha Arena 거래 대결은 암호화 커뮤니티가 AI의 능력과 결과에 어떻게 반응하는지를 보여주는 것이다.
결과 중심의 암호화 시장에서 말이다. 수익을 내는 AI는 말을 잘하는 AI보다 더 중요할지도 모른다.
TechFlow 공식 커뮤니티에 오신 것을 환영합니다
Telegram 구독 그룹:https://t.me/TechFlowDaily
트위터 공식 계정:https://x.com/TechFlowPost
트위터 영어 계정:https://x.com/BlockFlow_News














