TechFlow 소식, 1월 21일 금십데이터 보도에 따르면 DeepSeek-R1 출시 1주년을 맞아 신규 모델 "MODEL1"이 공개되었다. DeepSeek는 GitHub에서 FlashMLA 코드를 업데이트하며 114개 파일 중 28곳에서 MODEL1을 언급하였으며, 이는 V32과 별개의 모델로 나타났다. 알려진 바에 따르면 V32은 DeepSeek-V3.2를 의미하므로, MODEL1은 새로운 아키텍처일 가능성이 크다. 코드상 구체적인 차이는 KV 캐시 레이아웃, 희소성 처리 및 FP8 디코딩 부분에서 드러나며 메모리 최적화 측면에서도 여러 차이점을 보였다. (퀀터비트)
Web3 심층 보도에 집중하고 흐름을 통찰
기고하고 싶어요
보도 요청
위험 고지: 본 사이트의 모든 콘텐츠는 투자 조언이 아니며, 어떠한 매매 신호·거래 유도 서비스도 제공하지 않습니다. 인민은행 등 10개 부처의 「가상화폐 거래·투기 위험 방지 및 처리에 관한 통지」에 따라 투자자 여러분의 리스크 인식을 높이시기 바랍니다. 문의 / support@techflowpost.com 琼ICP备2022009338号




