TechFlow đưa tin, ngày 14 tháng 3, theo tiết lộ từ Bạch Kinh Thí Nghiệm Thất, cả DeepSeek V4 và mô hình Hỗn Nguyên mới do nhà khoa học AI hàng đầu của Tencent – ông Diêu Thuận Vũ đứng đầu phát triển đều dự kiến ra mắt vào tháng 4.
Theo thông tin rò rỉ, DeepSeek-V4 – mô hình đa phương thức lớn do Lương Văn Phong dày công xây dựng trong thời gian dài – không chỉ nâng cấp mạnh mẽ khả năng lập trình (Coding), mà còn đạt được bước đột phá đáng kể về bộ nhớ dài hạn (LTM – Long Term Memory).
Gần đây, nền tảng OpenRouter vừa ra mắt hai mô hình bí ẩn: Healer Alpha và Hunter Alpha; hai mô hình này bị nghi là phiên bản DeepSeek V4, và người dùng tại Trung Quốc có thể truy cập trực tiếp hai mô hình lớn này thông qua địa chỉ IP nội địa.
Theo giới thiệu tự thuật của chính mô hình, Hunter Alpha là một mô hình lớn sở hữu 1 nghìn tỷ tham số và cửa sổ ngữ cảnh lên tới 1 triệu token, được thiết kế đặc biệt cho các luồng công việc tác tử thông minh (intelligent agent workflows), các nhiệm vụ phức tạp kéo dài trong thời gian dài và việc gọi sâu các công cụ hỗ trợ.
Healer Alpha là một mô hình tương tác đa phương thức toàn diện, với cửa sổ ngữ cảnh rộng 260.000 token, có khả năng cảm nhận natively đầu vào thị giác và âm thanh, suy luận liên phương thức (cross-modal reasoning), đồng thời thực hiện chính xác và đáng tin cậy các nhiệm vụ phức tạp gồm nhiều bước.
Tính đến thời điểm bài viết được đăng tải, chưa có bất kỳ tuyên bố chính thức nào xác nhận danh tính hai mô hình lớn nói trên.
Theo tiết lộ thêm từ Bạch Kinh Thí Nghiệm Thất, ông Diêu Thuận Vũ – Nhà khoa học AI trưởng của Tencent – cũng sẽ ra mắt mô hình Hỗn Nguyên mới vào tháng 4 (ở mức độ 30 tỷ tham số). Đây sẽ là sản phẩm trọng điểm đầu tiên do ông Diêu phát hành kể từ khi gia nhập Tencent vào tháng 12 năm ngoái, và đang được cộng đồng rất kỳ vọng.




