Bản xem trước DeepSeek-V4 chính thức ra mắt và được mở nguồn

Chuyên sâu báo cáo Web3

Tôi muốn đăng bài

Yêu cầu phỏng vấn

Theo dõi chúng tôi

Cảnh báo rủi ro: mọi nội dung trên website này không cấu thành tư vấn đầu tư và chúng tôi không cung cấp bất kỳ dịch vụ tín hiệu hay dẫn dắt giao dịch nào. Theo thông báo của PBoC và 10 bộ ngành về việc tăng cường phòng ngừa rủi ro đầu cơ tiền mã hóa, xin hãy nâng cao ý thức rủi ro. Liên hệ: [email protected] Mã ICP: 琼ICP备2022009338号

TechFlow đưa tin, ngày 24 tháng 4, phiên bản xem trước của loạt mô hình mới DeepSeek-V4 đã chính thức ra mắt và đồng thời được mã nguồn mở. Mô hình có hai phiên bản: DeepSeek-V4-Pro với hiệu năng ngang tầm các mô hình đóng hàng đầu, đạt trình độ dẫn đầu trong giới mã nguồn mở về khả năng Agent, kiến thức thế giới cũng như suy luận toán học và lập trình; còn DeepSeek-V4-Flash có số lượng tham số nhỏ hơn, cung cấp dịch vụ API nhanh chóng và tiết kiệm chi phí hơn. Cả hai mô hình đều hỗ trợ ngữ cảnh dài tới 1 triệu token (1M) và đồng thời hoạt động ở cả chế độ “không suy luận” lẫn chế độ “suy luận”.

Về mặt kỹ thuật, DeepSeek-V4 áp dụng một cơ chế chú ý hoàn toàn mới, kết hợp cơ chế chú ý thưa DSA (DSA Sparse Attention), giúp giảm đáng kể nhu cầu tính toán và bộ nhớ GPU mà vẫn đạt khả năng xử lý ngữ cảnh dài ở trình độ dẫn đầu toàn cầu. Về API, tham số model tương ứng lần lượt là deepseek-v4-pro và deepseek-v4-flash; các tên mô hình cũ deepseek-chat và deepseek-reasoner sẽ ngừng sử dụng vào ngày 24 tháng 7 năm 2026.

Liên kết gốc

Thêm vào mục ưa thích

Chia sẻ lên mạng xã hội

Tin nhanh 7x24h

Tuyển chọn TechFlow

Bản xem trước DeepSeek-V4 chính thức ra mắt và được mở nguồn

7x24h Tin nhanh

Bản xem trước DeepSeek-V4 chính thức ra mắt và được mở nguồn