TechFlow annonce que, le 24 avril, la version préliminaire de la nouvelle série de modèles DeepSeek, DeepSeek-V4, est officiellement lancée et ouverte au public sous licence open source. Ce modèle se décline en deux versions : DeepSeek-V4-Pro, dont les performances égalent celles des meilleurs modèles fermés du marché et qui se distingue, dans le domaine open source, par ses capacités avancées d’agent, sa connaissance du monde ainsi que ses performances remarquables en raisonnement mathématique et en génération de code ; et DeepSeek-V4-Flash, un modèle plus léger en termes de paramètres, offrant des services API plus rapides et économiques. Les deux versions prennent en charge un contexte étendu de 1 million de tokens (1M) et fonctionnent aussi bien en mode « non réfléchi » qu’en mode « réfléchi ».
Au niveau technique, DeepSeek-V4 intègre un nouveau mécanisme d’attention combinant l’attention creuse DSA (DSA Sparse Attention), permettant ainsi de réduire considérablement les besoins en calcul et en mémoire vidéo tout en atteignant une capacité de traitement de contexte longue inégalée à l’échelle mondiale. Du point de vue des API, les paramètres model correspondants sont respectivement deepseek-v4-pro et deepseek-v4-flash. Les anciens noms de modèles deepseek-chat et deepseek-reasoner seront définitivement retirés le 24 juillet 2026.




