TechFlow 보도에 따르면, 4월 24일 DeepSeek가 신규 모델 시리즈인 DeepSeek-V4의 프리뷰 버전을 정식 출시하고 동시에 오픈소스화했다. 이 모델은 두 가지 버전으로 제공되며, 먼저 DeepSeek-V4-Pro는 최고 수준의 폐쇄형 모델과 어깨를 나란히 하는 성능을 자랑하며, 에이전트 기능, 세계 지식, 수학 및 코드 추론 분야에서 오픈소스 모델 중 선도적인 수준을 달성했다. 또 다른 버전인 DeepSeek-V4-Flash는 파라미터 규모가 더 작아 보다 빠르고 경제적인 API 서비스를 제공한다. 두 모델 모두 100만 토큰(1M)의 초장기 상하문맥(context)을 지원하며, ‘사고 모드(thinking mode)’와 ‘비사고 모드(non-thinking mode)’를 동시에 지원한다.
기술적으로 DeepSeek-V4는 새로운 어텐션 메커니즘을 도입하였으며, DSA 희소 어텐션(DSA sparse attention)과 결합함으로써 계산량과 GPU 메모리 사용량을 대폭 감소시키면서도 전 세계적으로 선도적인 초장기 상하문맥 처리 능력을 실현하였다. API 측면에서는 모델 파라미터 이름이 각각 deepseek-v4-pro 및 deepseek-v4-flash로 지정되었으며, 기존 모델 이름인 deepseek-chat과 deepseek-reasoner는 2026년 7월 24일부로 사용이 종료될 예정이다.




