TechFlow đưa tin, ngày 24 tháng 4, phiên bản xem trước của loạt mô hình mới DeepSeek-V4 đã chính thức ra mắt và đồng thời được mã nguồn mở. Mô hình có hai phiên bản: DeepSeek-V4-Pro với hiệu năng ngang tầm các mô hình đóng hàng đầu, đạt trình độ dẫn đầu trong giới mã nguồn mở về khả năng Agent, kiến thức thế giới cũng như suy luận toán học và lập trình; còn DeepSeek-V4-Flash có số lượng tham số nhỏ hơn, cung cấp dịch vụ API nhanh chóng và tiết kiệm chi phí hơn. Cả hai mô hình đều hỗ trợ ngữ cảnh dài tới 1 triệu token (1M) và đồng thời hoạt động ở cả chế độ “không suy luận” lẫn chế độ “suy luận”.
Về mặt kỹ thuật, DeepSeek-V4 áp dụng một cơ chế chú ý hoàn toàn mới, kết hợp cơ chế chú ý thưa DSA (DSA Sparse Attention), giúp giảm đáng kể nhu cầu tính toán và bộ nhớ GPU mà vẫn đạt khả năng xử lý ngữ cảnh dài ở trình độ dẫn đầu toàn cầu. Về API, tham số model tương ứng lần lượt là deepseek-v4-pro và deepseek-v4-flash; các tên mô hình cũ deepseek-chat và deepseek-reasoner sẽ ngừng sử dụng vào ngày 24 tháng 7 năm 2026.




