
연산력 경쟁에서 알고리즘 혁신으로: DeepSeek이 이끄는 AI의 새로운 패러다임
저자: BadBot, IOBC Capital
어제 밤, DeepSeek는 Hugging Face에 V3 버전인 DeepSeek-V3-0324를 공개했습니다. 모델 파라미터는 6850억 개이며, 코드 작성 능력, UI 설계, 추론 능력 등이 크게 향상되었습니다.
막 끝난 2025 GTC 컨퍼런스에서 황젠쉰(NVIDIA CEO)은 DeepSeek에 대해 높은 평가를 하며, 시장에서 그동안 DeepSeek의 고효율 모델로 인해 NVIDIA 칩 수요가 줄어들 것이라는 생각은 잘못됐다고 강조했습니다. 앞으로의 컴퓨팅 수요는 더 많아질 것이며, 절대 줄지 않을 것이라고 말했습니다.
알고리즘 혁신의 대표 주자인 DeepSeek와 NVIDIA의 컴퓨팅 공급 사이에는 어떤 관계가 있을까요? 저는 먼저 컴퓨팅 파워(산출량)와 알고리즘이 산업 발전에 미치는 의미부터 논의하고자 합니다.

산출량과 알고리즘의 공생적 진화
AI 분야에서 산출량의 향상은 더욱 복잡한 알고리즘의 실행 기반을 제공하여 모델이 방대한 데이터를 처리하고 더 복잡한 패턴을 학습할 수 있게 합니다. 반면, 알고리즘의 최적화는 산출량을 보다 효율적으로 활용해 컴퓨팅 자원의 사용 효율을 높입니다.
산출량과 알고리즘의 상호보완적 관계는 현재 AI 산업 구조를 재편하고 있습니다.
기술 경로의 분화: OpenAI 같은 기업들은 초대규모 산출량 클러스터 구축을 추구하는 반면, DeepSeek는 알고리즘 효율성 최적화에 집중하며 서로 다른 기술 흐름을 형성하고 있습니다.
산업 체인 재구성: NVIDIA는 CUDA 생태계를 통해 AI 산출량의 선도적 위치를 차지했으며, 클라우드 서비스 업체들은 탄력적인 산출량 서비스를 통해 배포 장벽을 낮추고 있습니다.
자원 배분 조정: 기업들은 하드웨어 인프라 투자와 고효율 알고리즘 개발 간 균형을 맞추기 위해 연구 역량을 조정하고 있습니다.
오픈소스 커뮤니티의 부상: DeepSeek, LLaMA 등의 오픈소스 모델은 알고리즘 혁신과 산출량 최적화 성과를 공유함으로써 기술의 반복과 확산 속도를 가속화하고 있습니다.
DeepSeek의 기술 혁신
DeepSeek의 돌풍은 그 기술 혁신 없이는 불가능했습니다. 누구나 이해할 수 있도록 쉬운 언어로 설명하겠습니다.
모델 아키텍처 최적화
DeepSeek는 Transformer + MoE(Mixture of Experts) 구조를 채택하고, 다중 헤드 잠재 어텐션(Multi-Head Latent Attention, MLA) 메커니즘을 도입했습니다. 이 구조는 마치 한 개의 슈퍼팀과 같습니다. 여기서 Transformer는 일반 작업을 담당하고, MoE는 각자의 전문 영역을 가진 전문가 그룹처럼 특정 문제가 발생하면 가장 잘 해결할 수 있는 전문가가 처리함으로써 전체 모델의 효율성과 정확성을 크게 높입니다. MLA 메커니즘은 정보 처리 시 중요한 세부 요소들을 유연하게 집중할 수 있게 해주어 모델 성능을 추가로 향상시킵니다.
훈련 방법 혁신
DeepSeek는 FP8 혼합 정밀도 훈련 프레임워크를 제안했습니다. 이 프레임워크는 지능형 자원 배분기와 같아서 훈련 과정의 각 단계별 요구에 따라 동적으로 적절한 계산 정밀도를 선택합니다. 고정밀 계산이 필요할 때는 높은 정밀도를 사용해 모델의 정확성을 보장하고, 낮은 정밀도로도 충분한 경우엔 정밀도를 낮춰 컴퓨팅 자원을 절약하며 훈련 속도를 높이고 메모리 사용을 줄입니다.
추론 효율 향상
추론 단계에서 DeepSeek는 멀티 토큰 예측(Multi-token Prediction, MTP) 기술을 도입했습니다. 기존 추론 방식은 하나씩 토큰을 예측하는 반면, MTP 기술은 여러 토큰을 동시에 예측해 추론 속도를 크게 빠르게 하고 비용을 낮춥니다.
강화 학습 알고리즘 돌파
DeepSeek의 새로운 강화 학습 알고리즘 GRPO(Generalized Reward-Penalized Optimization)는 모델 훈련 과정을 최적화했습니다. 강화 학습은 마치 모델에게 코치를 붙여주는 것과 같아, 보상과 벌점을 통해 모델이 더 나은 행동을 학습하도록 유도합니다. 기존 강화 학습 알고리즘은 많은 컴퓨팅 리소스를 소비하는 문제점이 있었지만, DeepSeek의 새 알고리즘은 모델 성능을 유지하면서 불필요한 계산을 줄여 성능과 비용의 균형을 실현합니다.
이러한 혁신은 고립된 기술 포인트가 아니라 훈련에서 추론까지 전 과정에 걸쳐 산출량 수요를 줄이는 통합 기술 체계를 형성하고 있습니다. 이제 일반 소비자용 그래픽카드에서도 강력한 AI 모델을 구동할 수 있게 되어 AI 애플리케이션 장벽이 크게 낮아졌고, 더 많은 개발자와 기업들이 AI 혁신에 참여할 수 있게 되었습니다.
NVIDIA에 미치는 영향
많은 사람들이 DeepSeek가 CUDA 계층을 우회해 NVIDIA에 대한 의존도를 벗어났다고 생각하지만, 실제로 DeepSeek는 NVIDIA의 PTX(Parallel Thread Execution) 계층을 직접 활용해 알고리즘을 최적화하고 있습니다. PTX는 고수준 CUDA 코드와 실제 GPU 명령어 사이의 중간 표현 언어로서, 이를 조작함으로써 DeepSeek는 더욱 정교한 성능 튜닝을 실현합니다.
이로 인해 NVIDIA에 미치는 영향은 양면적입니다. 한편으로 DeepSeek는 실제로 NVIDIA 하드웨어 및 CUDA 생태계와 더 깊이 결합되고 있으며, AI 애플리케이션 장벽의 낮아짐은 전체 시장 규모를 확대할 가능성이 있습니다. 다른 한편으로 DeepSeek의 알고리즘 최적화는 고급 칩 수요 구조를 변화시킬 수 있습니다. 기존에 H100과 같은 GPU에서만 실행 가능한 AI 모델들도 이제는 A100이나 소비자용 그래픽카드에서도 효율적으로 작동할 수 있게 되었습니다.
중국 AI 산업에 미치는 의미
DeepSeek의 알고리즘 최적화는 중국 AI 산업에 기술적 돌파구를 제공합니다. 고급 칩 수입 제한이라는 여건 아래서 "소프트웨어로 하드웨어 부족을 메꾼다"는 접근법은 최첨단 수입 칩에 대한 의존도를 줄이는 데 기여합니다.
상류에서는 고효율 알고리즘이 산출량 수요 압박을 완화해 컴퓨팅 서비스 제공업체가 소프트웨어 최적화를 통해 하드웨어 수명을 연장하고 투자 수익률을 높일 수 있습니다. 하류에서는 최적화된 오픈소스 모델이 AI 애플리케이션 개발 장벽을 낮춥니다. 다수의 중소기업들이 대규모 산출량 자원 없이도 DeepSeek 모델 기반으로 경쟁력 있는 애플리케이션을 개발할 수 있게 되어, 다양한 수직 분야의 AI 솔루션이 쏟아져 나올 것입니다.
Web3+AI에 미치는 심오한 영향
탈중앙화 AI 인프라
DeepSeek의 알고리즘 최적화는 Web3 AI 인프라에 새로운 동력을 제공합니다. 혁신적인 아키텍처, 고효율 알고리즘, 낮은 산출량 요구 덕분에 탈중앙화된 AI 추론이 가능해졌습니다. MoE 아키텍처는 본래 분산형 배포에 적합하여 서로 다른 노드가 각각 다른 전문가 네트워크를 보유함으로써 단일 노드가 전체 모델을 저장할 필요가 없어집니다. 이는 단일 노드의 저장 및 계산 요구를 크게 낮추어 모델의 유연성과 효율성을 높입니다.
FP8 훈련 프레임워크는 고성능 컴퓨팅 자원에 대한 요구를 더욱 낮춰 더 많은 컴퓨팅 자원이 노드 네트워크에 참여할 수 있게 합니다. 이는 탈중앙화 AI 컴퓨팅 참여 장벽을 낮출 뿐 아니라 전체 네트워크의 컴퓨팅 능력과 효율을 향상시킵니다.
멀티 에이전트 시스템(Multi-Agent System)
지능형 거래 전략 최적화: 실시간 시장 데이터 분석 에이전트, 단기 가격 변동 예측 에이전트, 체인상 거래 실행 에이전트, 거래 결과 감독 에이전트 등이 협업하여 사용자 수익을 극대화합니다.
스마트 계약 자동 실행: 스마트 계약 모니터링 에이전트, 스마트 계약 실행 에이전트, 실행 결과 감독 에이전트 등이 협력하여 더 복잡한 비즈니스 로직 자동화를 실현합니다.
맞춤형 투자 포트폴리오 관리: AI가 사용자의 리스크 선호도, 투자 목표, 재무 상태 등을 바탕으로 최적의 스테이킹 또는 유동성 제공 기회를 실시간으로 찾아줍니다.
"우리는 아주 짧은 미래까지만을 볼 수 있지만, 그곳에 할 일이 많다는 것을 알기에 충분하다." DeepSeek는 산출량 제약 속에서 알고리즘 혁신을 통해 돌파구를 찾았고, 중국 AI 산업에 차별화된 발전 경로를 열었습니다. 애플리케이션 장벽을 낮추고, Web3와 AI 융합을 추진하며, 고급 칩 의존도를 줄이고, 금융 혁신을 지원하는 이러한 영향력은 디지털 경제 구조를 재편하고 있습니다. 미래의 AI 발전은 더 이상 순수한 산출량 경쟁이 아닌, 산출량과 알고리즘의 공동 최적화 경쟁이 될 것입니다. 이 새로운 경주에서 DeepSeek와 같은 혁신자들이 중국의 지혜로 게임 룰을 다시 정의하고 있습니다.
TechFlow 공식 커뮤니티에 오신 것을 환영합니다
Telegram 구독 그룹:https://t.me/TechFlowDaily
트위터 공식 계정:https://x.com/TechFlowPost
트위터 영어 계정:https://x.com/BlockFlow_News












