
6대 AI '트레이더' 10일간의 대결: 추세와 규율, 그리고 탐욕에 관한 공개 수업
글: Frank, PANews
열흘도 채 안되어 자금이 두 배로 증가했다.
DeepSeek와 Qwen3가 Nof1에서 출시한 AlphaZero AI 실전 거래에서 이러한 성과를 기록했을 때, 그들의 수익 효율은 이미 대부분의 인간 트레이더를 압도하고 있었다. 이는 우리가 한 가지 문제를 직시하도록 강요한다. 바로 AI가 '연구 도구'에서 '일선 트레이더'로 전환되고 있다는 점이다. 그렇다면 이들은 어떻게 생각할까? PANews는 이번 경쟁에 참여한 주요 AI 모델 6개의 최근 10일간 거래 내역을 종합적으로 분석하여, AI 트레이더의 의사결정 비결을 밝히고자 했다.

정보 격차 없는 순수 기술적 대결
분석에 앞서 반드시 명확히 해야 할 전제가 있다. 바로 이번 경쟁에서 AI의 의사결정은 '인터넷 차단' 상태에서 이루어진다는 것이다. 모든 모델은 현재 가격, 이동평균선, MACD, RSI, 미결제약정, 자금 조달료, 4시간 및 3분 봉 시계열 데이터 등 완전히 동일한 기술적 데이터만 수동으로 수신하며, 기본적 정보를 인터넷을 통해 능동적으로 수집할 수 없다.
이는 '정보 격차'라는 요소를 배제함으로써 이번 경쟁을 '순수 기술적 분석만으로 수익을 낼 수 있는가'라는 오래된 질문에 대한 궁극적인 시험대가 되게 한다.
구체적인 내용을 보면, AI가 얻을 수 있는 정보는 다음과 같은 항목들을 포함한다.
1. 암호화폐의 현재 시장 상태: 현재 가격 정보, 20일 이동평균가, MACD 데이터, RSI 데이터, 미결제약정 데이터, 자금 조달료, 그리고 일부 데이터의 일중 시계열(3분 간격), 장기 추세 시계열(4시간 간격) 등.
2. 계좌 정보 및 실적: 현재 계좌의 전체 실적, 수익률, 사용 가능한 자금, 샤프 지수 등. 현재 포지션의 실시간 실적, 현재 설정된 익절 및 손절 조건과 무효화 조건 등.

DeepSeek: 침착한 추세 거래의 달인과 '리뷰'의 가치
10월 27일 기준, DeepSeek의 계좌는 최고 23,063달러에 달했으며, 최대 부동 수익률은 약 130%였다. 단연 가장 우수한 성과를 낸 모델이며, 거래 행동을 분석해보면 이러한 성과가 결코 우연이 아님을 알 수 있다.

우선 거래 빈도 면에서 DeepSeek는 저빈도 스타일의 추세 트레이더처럼 행동했다. 9일 동안 총 17번의 거래만 수행하여 모든 모델 중 가장 적은 거래 횟수를 기록했다. 이 17번의 거래 중 DeepSeek는 16번 매수, 1번 매도를 선택했는데, 이는 당시 시장이 바닥에서 반등하는 전반적인 흐름과 정확히 일치한다.
물론 이런 방향성 선택 역시 우연이 아니다. DeepSeek는 RSI와 MACD 등의 지표를 종합적으로 분석하여 시장 전반의 상승 추세를 판단하고, 확고하게 매수 포지션을 유지했다.
실제 거래 과정에서 DeepSeek의 초기 몇 건의 주문은 그리 순조롭지 않았다. 처음 5개 주문 모두 실패로 끝났지만, 각각의 손실은 크지 않았으며 최대 3.5%를 넘지 않았다. 또한 초기 주문들의 보유 시간은 짧았고, 가장 짧은 것은 8분 만에 청산했다. 그러나 시장이 예상한 방향으로 전개되자 DeepSeek의 포지션은 점점 더 장기간 유지되는 모습을 보였다.
포지션 보유 스타일을 보면, DeepSeek는 진입 후 넓은 익절 범위와 좁은 손절 범위를 설정하는 것을 선호한다. 10월 27일 기준 포지션을 예로 들면, 평균 익절 범위는 11.39%, 평균 손절 범위는 -3.52%이며, 위험 대비 수익 비율(R/R)은 약 3.55로 설정된다. 즉, DeepSeek의 거래 전략은 소액 손실로 큰 수익을 노리는 방식에 가깝다.
실제 결과 역시 마찬가지다. PANews의 분석에 따르면, DeepSeek의 청산된 거래들에서 평균 R/R은 6.71로 모든 모델 중 가장 높았다. 승률은 41%로 가장 높지는 않지만(두 번째) 수익 기대치는 2.76으로 1위를 기록했다. 이것이 바로 DeepSeek가 가장 높은 수익을 올린 주요 이유다.
또한 보유 기간 측면에서 DeepSeek의 평균 보유 시간은 2,952분(약 49시간)으로 역시 1위다. 여러 모델 가운데 진정한 의미의 추세 트레이더라 할 수 있으며, 금융 거래에서 수익을 내는 핵심 원칙인 '총알이 날아갈 시간을 주라(讓子彈飛一會)'는 사고방식과도 일치한다.
포지션 관리 측면에서 DeepSeek는 다소 공격적인 편이다. 평균 개별 포지션 레버리지는 2.23배에 달하며, 종종 다수의 포지션을 동시에 유지하기 때문에 전체 레버리지도 비교적 높은 수준이다. 예를 들어 10월 27일에는 보유 포지션의 총 레버리지가 3배를 초과했다. 하지만 엄격한 손절 조건을 함께 적용함으로써 리스크는 항상 통제 가능한 범위 내에 머무른다.
전반적으로 DeepSeek의 우수한 거래 성과는 종합적인 전략의 결과다. 진입 결정 시 특별한 지표보다는 일반적인 MACD와 RSI를 판단 근거로 사용하지만, 합리적인 R/R 비율을 철저히 준수하고 감정에 휘둘리지 않고 포지션을 유지하는 의사결정이 핵심이다.
또 다른 특이한 점 하나는, PANews가 발견했듯이 DeepSeek는 사고 과정에서도 과거의 특징을 유지하는데, 길고 세부적인 사고 과정을 형성한 후 이를 종합하여 거래 결정을 내린다. 인간 트레이더에게 비유하자면, 이는 리뷰를 중요시하는 트레이더와 유사하며, 이 리뷰 과정이 3분마다 반복된다고 볼 수 있다.
이러한 리뷰 능력은 AI 모델에 적용되더라도 효과가 있다. 모든 코인과 시장 신호의 세부사항이 반복적으로 분석되어 누락되지 않도록 하며, 인간 트레이더들이 배워야 할 또 다른 중요한 부분이라 할 수 있다.
Qwen3: 대담한 공격형 '도박사'
10월 27일 기준, Qwen3는 두 번째로 좋은 성과를 낸 대규모 모델이다. 최고 계좌 금액은 2만 달러에 달했으며 수익률은 100%로, DeepSeek 다음가는 수익을 기록했다. Qwen3의 전반적인 특징은 고레버리지와 고승률이다. 전체 승률은 43.4%로 모든 모델 중 1위이며, 개별 포지션 크기도 평균 5.61만 달러(레버리지 5.6배)로 역시 가장 크다. 수익 기대치는 DeepSeek보다 낮지만, 대담한 스타일 덕분에 현재까지 DeepSeek에 거의 따라붙고 있다.

Qwen3의 거래 스타일은 다소 공격적이다. 평균 손절 수준은 491달러로 모든 모델 중 가장 높으며, 단일 최대 손실은 2,232달러로 역시 최고치다. 이는 Qwen3가 더 큰 손실을 감수할 수 있음을 의미하며, 일명 '홀딩'이라고 한다. 하지만 DeepSeek와 차이 나는 점은, 더 큰 손실을 감수하면서도 더 높은 수익을 얻지 못한다는 점이다. Qwen3의 평균 수익은 1,547달러로 DeepSeek보다 낮다. 따라서 최종 수익 기대 비율은 1.36에 불과하며, DeepSeek의 절반 수준이다.
또 다른 특징은 단일 포지션에 집중하고 그 포지션에 막대한 금액을 투입하는 것이다. 사용하는 레버리지는 종종 25배(대회에서 허용된 최대 배율)에 달한다. 이러한 거래 방식은 높은 승률에 크게 의존하게 되며, 한번의 손실이 발생하면 큰 회복 불능 손실로 이어질 수 있다.
의사결정 과정에서 Qwen3는 4시간봉 EMA 20선을 특히 주목하며, 이를 진입 및 청산 신호로 삼는 것으로 보인다. 사고 과정도 매우 간단해 보인다. 보유 기간 면에서도 Qwen3는 인내심이 부족한 편으로, 평균 보유 시간은 10.5시간으로 Gemini 다음으로 짧다.
전반적으로 Qwen3는 현재 수익이 나쁘지 않아 보이지만, 잠재적 위험도 크다. 너무 높은 레버리지, 한 방에 모든 것을 걸기 위한 진입 스타일, 단일한 판단 지표, 짧은 보유 시간, 낮은 R/R 비율 등은 향후 거래에 큰 위험 요소가 될 수 있다. 10월 28일 기사 작성 시점 기준, Qwen3의 자금은 최고점 대비 26.8% 하락한 1.66만 달러 수준으로 회귀했다.
Claude: 고집스러운 매수 전행자
Claude도 전반적으로 수익 상태를 유지하고 있다. 10월 27일 기준 계좌 총액은 약 12,500달러, 수익률은 약 25%다. 이 수치만 놓고 보면 꽤 뛰어나지만, DeepSeek와 Qwen3와 비교하면 다소 뒤처진다.

실제로 거래 빈도, 포지션 규모, 승률 측면에서 Claude는 DeepSeek와 유사한 수치를 보인다. 총 21번 거래를 진행했으며, 승률은 38%, 평균 레버리지는 2.32배다.
그러나 성과 차이가 나는 주요 원인은 낮은 R/R 비율에 있을 수 있다. Claude의 R/R 비율은 2.1로 나쁘지 않지만, DeepSeek와 비교하면 3배 이상 차이가 난다. 따라서 종합적으로 수익 기대치는 0.8에 불과하다(1 미만일 경우 장기적으로 손실이 발생).
또한 Claude의 두드러진 특징은 특정 기간 동안 한 방향(매수)만 고집한다는 점이다. 10월 27일 기준 청산된 주문 21건 모두 매수 포지션이었다.
Grok: 방향성 판단의 소용돌이 속에서 헤매다
Grok는 초기 성적이 좋았으며, 한때 가장 높은 수익률을 기록하기도 했고, 최고 수익률은 50%를 초과했다. 그러나 거래 시간이 늘어날수록 심각한 회복 불능 손실이 발생했다. 10월 27일 기준 자금은 약 1만 달러로 돌아왔으며, 모든 모델 중 4위를 기록했다. 전체 수익률은 BTC 현물 보유 수익 곡선과 유사하다.

거래 습관을 보면, Grok도 저빈도 거래 및 장기 보유형 참가자에 속한다. 청산된 거래는 20건뿐이며, 평균 보유 시간은 30.47시간으로 DeepSeek 다음으로 길다. 그러나 Grok의 가장 큰 문제는 승률이 너무 낮다는 점이다. 승률은 20%에 불과하며, R/R 비율도 1.85에 그친다. 이로 인해 수익 기대치는 0.3에 불과하다. 주문 방향을 보면, Grok의 20번 포지션 중 매수와 매도가 각각 10번씩이다. 그런데 이 기간의 시장 흐름을 고려하면, 과도한 매도는 승률을 떨어뜨릴 수밖에 없다. 이 관점에서 보면, Grok 모델의 시장 방향성 판단에는 여전히 문제가 있다.
Gemini: 고빈도 '소매 트레이더', 반복적인 진입과 청산으로 자본을 소진하다
Gemini는 거래 빈도가 가장 높은 모델이다. 10월 27일 기준 총 165건의 거래를 완료했다. 지나치게 빈번한 거래는 Gemini의 실적을 극도로 나쁘게 만들었고, 계좌 최저 금액은 약 3,800달러까지 떨어졌으며, 손실률은 62%에 달했다. 그중 수수료만 1,095.78달러를 지불했다.

고빈도 거래 뒤에는 극도로 낮은 승률(25%)과 1.18에 불과한 R/R 비율이 존재하며, 수익 기대치도 0.3에 그친다. 이러한 수치는 Gemini의 거래가 필연적으로 손실을 초래함을 의미한다. 아마 자신의 결정에 자신감이 없기 때문인지, Gemini의 평균 포지션도 매우 작다. 개별 포지션 레버리지는 0.77배에 불과하며, 보유 시간도 평균 7.5시간에 머문다.
평균 손절은 81달러, 평균 익절은 96달러에 불과하다. Gemini의 모습은 전형적인 소매 트레이더와 흡사하다. 조금만 벌면 청산하고, 조금만 손해 나면 도망친다. 시장의 등락 속에서 반복적으로 거래를 하며 계좌 자본을 지속적으로 마모시키고 있다.
GPT5: 낮은 승률과 낮은 R/R 비율의 '이중 타격'
GPT5는 현재 최하위 모델로, 전반적인 실적과 수익 곡선은 Gemini와 매우 유사하며, 손실률도 모두 60%를 초과한다. GPT5는 Gemini만큼 고빈도는 아니지만, 63번의 거래를 수행했다. R/R 비율은 0.96에 불과해 평균 수익 0.96달러에 비해 손절은 1달러에 달한다. 게다가 GPT5의 거래 승률도 20%로 매우 낮아 Grok와 비슷한 수준이다.

포지션 규모 면에서 GPT5는 Gemini와 매우 유사하며, 평균 포지션 레버리지는 약 0.76배다. 매우 조심스럽고 신중해 보인다.
GPT5와 Gemini의 사례는 낮은 포지션 리스크가 반드시 계좌 수익에 유리하지 않음을 보여준다. 또한 고빈도 거래 하에서는 승률과 R/R 비율 모두 보장되기 어렵다. 더불어 두 모델의 동일 코인 매수 진입가는 DeepSeek 등 수익을 낸 모델보다 명백히 높아, 진입 신호가 다소 느리다는 점을 시사한다.

관찰 및 종합: AI가 비추는 두 가지 거래 '인성'
전반적으로 AI의 거래 행동을 분석함으로써 우리는 다시 한 번 거래 전략을 검토할 기회를 얻었다. 특히 DeepSeek처럼 높은 수익을 낸 모델과 Gemini, GPT5처럼 큰 손실을 본 모델의 극단적인 사례 분석이 가장 깊은 사색을 유도한다.
1. 높은 수익을 낸 모델의 특징: 저빈도, 장기 보유, 높은 R/R 비율, 진입 타이밍이 빠름.
2. 손실을 본 모델의 특징: 고빈도, 단기 보유, 낮은 R/R 비율, 진입 타이밍이 늦음.
3. 수익의 많고 적음은 시장 정보량과 직접적인 연관이 없다. 이번 AI 모델 거래 대회에서 모든 모델은 동일한 정보를 받았으며, 인간 트레이더에 비해 정보 출처가 더욱 제한적이었다. 하지만 대부분의 트레이더를 압도하는 수익률을 기록했다.
4. 사고 과정의 길이가 거래의 엄밀성을 결정하는 핵심 요소로 보인다. DeepSeek의 의사결정 과정은 모든 모델 중 가장 길며, 이는 인간 트레이더로 치면 리뷰를 철저히 하고 매 결정을 진지하게 대하는 유형과 유사하다. 반면 실적이 부진한 모델들의 사고 과정은 매우 짧아, 인간이 즉흥적으로 결정하는 방식과 흡사하다.
5. DeepSeek, Qwen3 등 일부 모델의 수익 실적이 알려지면서 많은 사람들이 이러한 AI 모델을 직접 따라할 수 있을지 논의하고 있다. 그러나 이러한 접근은 바람직하지 않다. 일부 AI 모델의 수익 능력이 뛰어나 보이지만, 여기에는 운도 어느 정도 작용했을 가능성이 있다. 즉, 해당 시장 흐름에 잘 맞춰졌기 때문이다. 새로운 시장 국면이 도래하면 이러한 우위가 유지될지는 미지수다. 다만 AI의 거래 실행 능력은 배울 만하다.
마지막으로, 누가 최종 승자가 될 것인가? PANews는 이 데이터를 여러 AI 모델에 보내 물었다. 모두 DeepSeek를 선택했으며, 그 이유는 수익 기대치가 수학적 논리에 가장 부합하고, 거래 습관도 가장 우수하기 때문이라고 답했다.
흥미롭게도, 두 번째로 좋아하는 모델은 거의 모두 자기 자신을 선택했다.
TechFlow 공식 커뮤니티에 오신 것을 환영합니다
Telegram 구독 그룹:https://t.me/TechFlowDaily
트위터 공식 계정:https://x.com/TechFlowPost
트위터 영어 계정:https://x.com/BlockFlow_News












