
Từ cuộc đua công suất tính toán đến đổi mới thuật toán: DeepSeek dẫn dắt phạm式 AI mới
Tuyển chọn TechFlowTuyển chọn TechFlow

Từ cuộc đua công suất tính toán đến đổi mới thuật toán: DeepSeek dẫn dắt phạm式 AI mới
“Chúng ta chỉ có thể nhìn thấy một tương lai rất ngắn, nhưng đủ để nhận ra rằng ở đó còn rất nhiều việc phải làm.”
Tác giả: BadBot, IOBC Capital
Đêm qua, DeepSeek đã công bố bản cập nhật phiên bản V3 trên Hugging Face – DeepSeek-V3-0324, với thông số mô hình lên tới 685 tỷ tham số, cải thiện đáng kể về khả năng lập trình, thiết kế giao diện người dùng và suy luận.
Tại hội nghị GTC 2025 vừa kết thúc, Huang Renxun đã đánh giá cao DeepSeek, đồng thời nhấn mạnh rằng nhận định trước đó của thị trường cho rằng các mô hình hiệu quả của DeepSeek sẽ làm giảm nhu cầu đối với chip NVIDIA là sai lầm. Nhu cầu tính toán trong tương lai chỉ có thể tăng chứ không thể giảm.
DeepSeek, như một sản phẩm tiêu biểu cho bước đột phá thuật toán, thực tế có mối quan hệ gì với nguồn cung cấp sức mạnh tính toán của NVIDIA? Trước tiên, tôi muốn thảo luận về ý nghĩa của tính toán và thuật toán đối với sự phát triển ngành.

Sự tiến hóa cộng sinh giữa sức mạnh tính toán và thuật toán
Trong lĩnh vực AI, việc nâng cao sức mạnh tính toán tạo nền tảng vận hành cho các thuật toán phức tạp hơn, giúp mô hình xử lý lượng dữ liệu lớn hơn, học được các mẫu hình phức tạp hơn; ngược lại, việc tối ưu hóa thuật toán giúp sử dụng hiệu quả hơn nguồn lực tính toán, nâng cao hiệu suất sử dụng tài nguyên.
Mối quan hệ cộng sinh giữa tính toán và thuật toán đang tái cấu trúc格局 ngành AI:
Phân nhánh đường hướng công nghệ: Các công ty như OpenAI theo đuổi xây dựng cụm tính toán siêu lớn, trong khi DeepSeek tập trung vào tối ưu hóa hiệu suất thuật toán, từ đó hình thành các phái công nghệ khác nhau.
Tái cấu trúc chuỗi ngành: NVIDIA trở thành nhà thống trị sức mạnh tính toán AI thông qua hệ sinh thái CUDA, trong khi các nhà cung cấp dịch vụ đám mây hạ thấp ngưỡng triển khai nhờ dịch vụ tính toán linh hoạt.
Điều chỉnh phân bổ tài nguyên: Các doanh nghiệp đang tìm kiếm sự cân bằng giữa đầu tư cơ sở hạ tầng phần cứng và nghiên cứu phát triển thuật toán hiệu quả.
Nổi dậy của cộng đồng mã nguồn mở: Các mô hình mã nguồn mở như DeepSeek, LLaMA giúp chia sẻ thành quả đổi mới thuật toán và tối ưu hóa tính toán, thúc đẩy nhanh chóng quá trình lặp lại và lan tỏa công nghệ.
Các đột phá công nghệ của DeepSeek
Thành công bùng nổ của DeepSeek chắc chắn gắn liền với những sáng tạo công nghệ của nó. Tôi sẽ giải thích bằng ngôn ngữ dễ hiểu để đa số mọi người đều có thể tiếp cận.
Tối ưu hóa kiến trúc mô hình
DeepSeek áp dụng kiến trúc kết hợp Transformer + MOE (Mixture of Experts), đồng thời giới thiệu cơ chế chú ý tiềm ẩn đa đầu (Multi-Head Latent Attention - MLA). Kiến trúc này giống như một đội ngũ siêu cấp, trong đó Transformer đảm nhiệm xử lý các tác vụ thông thường, còn MOE giống như nhóm chuyên gia bên trong đội, mỗi chuyên gia có thế mạnh riêng. Khi gặp vấn đề cụ thể, chuyên gia phù hợp nhất sẽ xử lý, từ đó nâng cao đáng kể hiệu suất và độ chính xác của mô hình. Cơ chế MLA giúp mô hình linh hoạt hơn trong việc chú ý đến các chi tiết quan trọng khác nhau khi xử lý thông tin, tiếp tục cải thiện hiệu năng.
Đổi mới phương pháp huấn luyện
DeepSeek đưa ra khung huấn luyện độ chính xác hỗn hợp FP8. Khung này giống như một bộ điều phối tài nguyên thông minh, có thể động lựa chọn độ chính xác tính toán phù hợp tùy theo nhu cầu ở từng giai đoạn huấn luyện. Khi cần tính toán độ chính xác cao, nó sử dụng độ chính xác cao để đảm bảo độ chuẩn xác mô hình; khi chấp nhận độ chính xác thấp hơn, nó giảm độ chính xác nhằm tiết kiệm tài nguyên tính toán, tăng tốc độ huấn luyện và giảm chiếm dụng bộ nhớ.
Nâng cao hiệu suất suy luận
Trong giai đoạn suy luận, DeepSeek giới thiệu công nghệ dự đoán đa token (Multi-token Prediction - MTP). Phương pháp suy luận truyền thống từng bước một, mỗi bước chỉ dự đoán một token. Trong khi đó, công nghệ MTP có thể dự đoán nhiều token cùng lúc, từ đó tăng tốc đáng kể quá trình suy luận, đồng thời giảm chi phí.
Đột phá thuật toán học tăng cường
Thuật toán học tăng cường mới GRPO (Generalized Reward-Penalized Optimization) của DeepSeek tối ưu hóa quá trình huấn luyện mô hình. Học tăng cường giống như trang bị một huấn luyện viên cho mô hình, người này hướng dẫn mô hình học các hành vi tốt hơn thông qua phần thưởng và hình phạt. Thuật toán học tăng cường truyền thống có thể tiêu tốn rất nhiều tài nguyên tính toán trong quá trình này, nhưng thuật toán mới của DeepSeek hiệu quả hơn, có thể duy trì cải thiện hiệu năng mô hình đồng thời giảm thiểu tính toán không cần thiết, đạt được sự cân bằng giữa hiệu suất và chi phí.
Những đổi mới này không phải là các điểm công nghệ đơn lẻ, mà tạo thành một hệ thống kỹ thuật hoàn chỉnh, toàn tuyến từ huấn luyện đến suy luận đều giảm nhu cầu về sức mạnh tính toán. Hiện nay, ngay cả card đồ họa tiêu dùng thông thường cũng có thể chạy các mô hình AI mạnh mẽ, làm giảm đáng kể ngưỡng ứng dụng AI, giúp nhiều nhà phát triển và doanh nghiệp hơn tham gia vào đổi mới AI.
Tác động đến NVIDIA
Nhiều người cho rằng DeepSeek đã vượt qua lớp CUDA, từ đó thoát khỏi sự phụ thuộc vào NVIDIA. Trên thực tế, DeepSeek trực tiếp tối ưu thuật toán thông qua lớp PTX (Parallel Thread Execution) của NVIDIA. PTX là một ngôn ngữ biểu diễn trung gian nằm giữa mã CUDA cấp cao và lệnh GPU thực tế. Bằng cách thao tác ở tầng này, DeepSeek có thể thực hiện điều chỉnh hiệu suất tinh vi hơn.
Tác động đến NVIDIA là hai mặt: một mặt, DeepSeek thực tế còn gắn bó sâu hơn với phần cứng và hệ sinh thái CUDA của NVIDIA, việc giảm ngưỡng ứng dụng AI có thể mở rộng quy mô thị trường tổng thể; mặt khác, việc tối ưu thuật toán của DeepSeek có thể thay đổi cấu trúc nhu cầu thị trường đối với chip cao cấp — một số mô hình AI trước đây cần GPU như H100 mới chạy được, nay có thể vận hành hiệu quả trên A100 hay thậm chí là card đồ họa tiêu dùng.
Ý nghĩa với ngành AI Trung Quốc
Tối ưu hóa thuật toán của DeepSeek cung cấp con đường đột phá công nghệ cho ngành AI Trung Quốc. Trong bối cảnh bị hạn chế tiếp cận chip cao cấp, tư duy "phần mềm bù phần cứng" giúp giảm nhẹ sự phụ thuộc vào chip nhập khẩu đỉnh cao.
Ở thượng nguồn, thuật toán hiệu quả làm giảm áp lực nhu cầu tính toán, giúp các nhà cung cấp dịch vụ tính toán kéo dài vòng đời phần cứng và nâng cao tỷ suất lợi nhuận nhờ tối ưu phần mềm. Ở hạ nguồn, các mô hình mã nguồn mở sau tối ưu hóa làm giảm ngưỡng phát triển ứng dụng AI. Nhiều doanh nghiệp vừa và nhỏ không cần sở hữu lượng lớn tài nguyên tính toán vẫn có thể phát triển các ứng dụng cạnh tranh dựa trên mô hình DeepSeek, từ đó thúc đẩy sự xuất hiện của nhiều giải pháp AI chuyên biệt theo ngành dọc.
Tác động sâu rộng đến Web3+AI
Cơ sở hạ tầng AI phi tập trung
Tối ưu hóa thuật toán của DeepSeek cung cấp động lực mới cho cơ sở hạ tầng AI Web3. Kiến trúc sáng tạo, thuật toán hiệu quả và nhu cầu tính toán thấp khiến việc suy luận AI phi tập trung trở nên khả thi. Kiến trúc MoE vốn dĩ phù hợp với triển khai phân tán, các nút khác nhau có thể nắm giữ các mạng chuyên gia khác nhau, không cần một nút nào lưu trữ toàn bộ mô hình, điều này làm giảm đáng kể yêu cầu lưu trữ và tính toán tại từng nút, từ đó nâng cao tính linh hoạt và hiệu quả mô hình.
Khung huấn luyện FP8 tiếp tục giảm nhu cầu về tài nguyên tính toán cao cấp, giúp nhiều tài nguyên tính toán hơn tham gia vào mạng nút. Điều này không chỉ hạ thấp ngưỡng tham gia vào tính toán AI phi tập trung mà còn nâng cao năng lực và hiệu suất tính toán toàn mạng.
Hệ thống đa tác nhân (Multi-Agent System)
Tối ưu hóa chiến lược giao dịch thông minh: Thông qua sự phối hợp vận hành của các tác nhân như phân tích dữ liệu thị trường thời gian thực, dự đoán biến động giá ngắn hạn, thực thi giao dịch trên chuỗi, giám sát kết quả giao dịch... giúp người dùng thu lợi nhuận cao hơn.
Tự động hóa thực thi hợp đồng thông minh: Các tác nhân như giám sát hợp đồng thông minh, thực thi hợp đồng thông minh, giám sát kết quả thực thi... phối hợp vận hành để tự động hóa các logic kinh doanh phức tạp hơn.
Quản lý danh mục đầu tư cá nhân hóa: AI dựa trên mức độ chấp nhận rủi ro, mục tiêu đầu tư và tình hình tài chính của người dùng, giúp họ tìm kiếm cơ hội đặt cược (staking) hoặc cung cấp thanh khoản tối ưu nhất theo thời gian thực.
"Chúng ta chỉ có thể nhìn thấy tương lai rất ngắn, nhưng đủ để nhận ra rằng ở đó còn rất nhiều việc phải làm." DeepSeek chính là tìm kiếm đột phá trong giới hạn tính toán thông qua đổi mới thuật toán, mở ra con đường phát triển khác biệt cho ngành AI Trung Quốc. Việc hạ thấp ngưỡng ứng dụng, thúc đẩy sự hòa hợp Web3 và AI, giảm phụ thuộc vào chip cao cấp, trao quyền đổi mới tài chính – những ảnh hưởng này đang tái cấu trúc格局 nền kinh tế số. Tương lai của AI không còn đơn thuần là cuộc đua sức mạnh tính toán, mà là cuộc đua tối ưu đồng bộ giữa tính toán và thuật toán. Trên con đường đua mới này, những người tiên phong như DeepSeek đang dùng trí tuệ Trung Hoa để định nghĩa lại luật chơi.
Chào mừng tham gia cộng đồng chính thức TechFlow
Nhóm Telegram:https://t.me/TechFlowDaily
Tài khoản Twitter chính thức:https://x.com/TechFlowPost
Tài khoản Twitter tiếng Anh:https://x.com/BlockFlow_News












