
Thị phần của NVIDIA tại Trung Quốc giảm xuống dưới 60%, trong khi các chip AI nội địa giao hàng 1,65 triệu chiếc/năm để chiếm lĩnh thị trường
Tuyển chọn TechFlowTuyển chọn TechFlow

Thị phần của NVIDIA tại Trung Quốc giảm xuống dưới 60%, trong khi các chip AI nội địa giao hàng 1,65 triệu chiếc/năm để chiếm lĩnh thị trường
Năm ngoái, vào tháng 11, Bắc Kinh đã ra lệnh thay thế hoàn toàn các trung tâm dữ liệu thuộc sở hữu nhà nước bằng thiết bị nội địa, qua đó đẩy nhanh quá trình tái cấu trúc cục diện thị trường.
Tác giả: TechFlow
Dẫn dắt bởi TechFlow: Dữ liệu từ IDC cho thấy tổng lượng thẻ tăng tốc AI tại Trung Quốc năm 2025 đạt khoảng 4 triệu chiếc; các nhà sản xuất trong nước cung cấp tổng cộng 1,65 triệu chiếc, chiếm 41% thị phần; thị phần của NVIDIA giảm từ mức khoảng 95% trước khi bị trừng phạt xuống còn 55%.
Huawei dẫn đầu các hãng nội địa với 812.000 chip, đồng thời vừa ra mắt thẻ tăng tốc Atlas 350 mới, tuyên bố hiệu năng suy luận (inference) đạt 2,87 lần so với phiên bản H20 dành riêng cho thị trường Trung Quốc của NVIDIA.
Tháng 11 năm ngoái, Bắc Kinh đã ra lệnh thay thế toàn bộ thiết bị chip AI bằng sản phẩm nội địa tại các trung tâm dữ liệu thuộc sở hữu nhà nước, đang đẩy nhanh quá trình tái cấu trúc cục diện thị trường.

Ba năm trước, NVIDIA gần như độc quyền thị trường chip AI Trung Quốc. Ngày nay, cục diện ấy đã hoàn toàn thay đổi.
Theo báo cáo của Reuters trích dẫn số liệu từ tổ chức nghiên cứu thị trường IDC, tổng lượng thẻ tăng tốc AI (chip tính toán chuyên dụng dùng trong máy chủ AI) được xuất xưởng tại Trung Quốc năm 2025 đạt khoảng 4 triệu chiếc. NVIDIA vẫn là nhà cung cấp đơn lẻ lớn nhất, với khoảng 2,2 triệu chiếc, chiếm 55% thị phần. Tuy nhiên, con số này đã giảm mạnh gần 40 điểm phần trăm so với mức thị phần khoảng 95% trước khi bị áp đặt trừng phạt. Đồng thời, các nhà sản xuất trong nước cung cấp tổng cộng khoảng 1,65 triệu chiếc, chiếm 41% thị phần. AMD đứng thứ ba với khoảng 160.000 chiếc, chiếm 4%.
Sự vươn lên của các nhà sản xuất nội địa vừa là hệ quả tất yếu do các biện pháp kiểm soát xuất khẩu của Hoa Kỳ, vừa là kết quả chủ động từ chính sách “thay thế bằng sản phẩm nội địa”.
Huawei dẫn đầu phe nội địa; Atlas 350 cạnh tranh trực tiếp với NVIDIA H20
Trong nhóm các nhà sản xuất chip AI nội địa, Huawei là bên giành lợi ích lớn nhất.
Số liệu từ IDC cho biết Huawei xuất xưởng khoảng 812.000 chip AI năm 2025, chiếm khoảng 20% thị phần toàn cầu và gần một nửa tổng lượng xuất xưởng của các nhà sản xuất nội địa. Bộ phận thiết kế chip T-Head thuộc Alibaba đứng thứ hai với khoảng 265.000 chiếc; Kunlunxin (thuộc Baidu) và Cambricon cùng xếp thứ ba với mỗi bên xuất xưởng khoảng 116.000 chiếc. Ngoài ra, Hygon, MetaX và Iluvatar CoreX lần lượt chiếm 5%, 4% và 3% thị phần của các nhà sản xuất nội địa.
Tháng trước, tại Hội nghị Đối tác Trung Quốc 2026 tổ chức tại Thâm Quyến, Huawei đã ra mắt thẻ tăng tốc AI thế hệ mới Atlas 350, tích hợp chip Ascend 950PR tự phát triển. Ông Trương Địch Huyên – người đứng đầu mảng tính toán Ascend của Huawei – cho biết tại buổi ra mắt rằng Atlas 350 đạt hiệu năng tính toán 1,56 PFLOPS (một nghìn tỷ phép tính/giây) ở độ chính xác thấp FP4, cao gấp 2,87 lần so với phiên bản H20 dành riêng cho thị trường Trung Quốc của NVIDIA. Thẻ này được trang bị 112 GB bộ nhớ băng thông cao tự phát triển HiBL 1.0, băng thông bộ nhớ đạt 1,4 TB/giây và công suất tiêu thụ 600 W.

Tuy nhiên, việc so sánh hiệu năng này có vấn đề về tiêu chuẩn đo lường. GPU kiến trúc Hopper của NVIDIA không hỗ trợ độ chính xác FP4 ngay từ gốc; Atlas 350 là thẻ tăng tốc nội địa đầu tiên được tối ưu hóa đặc biệt cho độ chính xác FP4, do đó hai sản phẩm không thể so sánh trực tiếp ở cùng một mức độ chính xác. Sức cạnh tranh thực sự của Huawei nằm ở khâu suy luận (inference): Atlas 350 được thiết kế dành riêng cho khối lượng công việc suy luận trong giai đoạn triển khai mô hình AI, chứ không phải huấn luyện mô hình ngôn ngữ lớn (LLM).
Bảy đối tác của Huawei đã ra mắt các dòng máy chủ hoàn chỉnh dựa trên nền tảng Atlas 350; iFLYTEK cũng công bố mô hình ngôn ngữ lớn Xinghuo thế hệ mới sẽ tương thích với nền tảng sức mạnh tính toán Ascend 910/950.
Cả hai yếu tố: kiểm soát xuất khẩu và chỉ thị thay thế nội địa đều thúc đẩy mạnh mẽ
Sự sụt giảm thị phần của NVIDIA tại Trung Quốc là kết quả kép từ việc Hoa Kỳ liên tục nâng cao các biện pháp kiểm soát xuất khẩu và chính sách “thay thế bằng sản phẩm nội địa” của Bắc Kinh.
Diễn biến theo thời gian như sau: Từ tháng 10/2022, Hoa Kỳ bắt đầu hạn chế xuất khẩu chip AI sang Trung Quốc; NVIDIA sau đó tung ra các phiên bản giảm thông số kỹ thuật tuân thủ quy định như H20 và A800/H800. Tháng 4/2025, chính quyền Trump cấm hoàn toàn xuất khẩu mọi loại GPU AI sang Trung Quốc; đến tháng 7 cùng năm, Hoa Kỳ khôi phục giấy phép xuất khẩu cho H20 và AMD MI308; tháng 10, ông Hoàng Nhân Huân – CEO NVIDIA – phát biểu công khai rằng thị phần của NVIDIA trong phân khúc thẻ tăng tốc AI tiên tiến tại Trung Quốc đã “giảm từ 95% xuống còn 0%”. Đến tháng 12, chính quyền Trump cho phép NVIDIA xuất khẩu H200 sang Trung Quốc, nhưng các doanh nghiệp Trung Quốc lại bị yêu cầu tạm dừng đặt hàng chip của NVIDIA.

Mặt khác, lực đẩy từ chính sách cũng rất mạnh mẽ. Theo báo cáo của Reuters tháng 11/2025, Bắc Kinh đã ban hành hướng dẫn đối với các trung tâm dữ liệu mới được xây dựng bằng vốn nhà nước, yêu cầu toàn bộ sử dụng chip AI nội địa. Các dự án chưa hoàn thành dưới 30% được yêu cầu tháo dỡ toàn bộ chip ngoại đã lắp đặt hoặc hủy bỏ kế hoạch mua sắm.
Theo thống kê của Reuters, kể từ năm 2021, các dự án trung tâm dữ liệu AI tại Trung Quốc đã nhận hơn 100 tỷ USD vốn nhà nước; đa số trung tâm dữ liệu tại Trung Quốc đều từng nhận được một hình thức hỗ trợ nào đó từ vốn nhà nước trong giai đoạn xây dựng, điều này hàm ý phạm vi ảnh hưởng của chính sách này là cực kỳ rộng lớn.
Trung tâm dữ liệu quy mô lớn do China Unicom xây dựng tại Thanh Hải được Reuters đưa làm ví dụ tiêu biểu cho chiến lược này: Dự án trị giá 390 triệu USD này sử dụng hoàn toàn chip AI nội địa do T-Head và các hãng khác cung cấp.
Khoảng cách kỹ thuật vẫn tồn tại, nhưng hiệu năng suy luận đã đạt ngưỡng “đủ dùng”
Sự gia tăng thị phần của chip nội địa không đồng nghĩa với việc khoảng cách kỹ thuật đã được thu hẹp.
Đa số nhà phân tích ngành ước tính chip AI nội địa vẫn tụt hậu so với NVIDIA từ 5 đến 10 năm về mặt huấn luyện mô hình tại trung tâm dữ liệu. Trong việc huấn luyện mô hình ngôn ngữ lớn (LLM) có hàng nghìn tỷ tham số, GPU cao cấp của NVIDIA vẫn là lựa chọn hàng đầu. Ví dụ điển hình là cụm 50.000 GPU kiến trúc Hopper mà DeepSeek sử dụng để huấn luyện mô hình R1.
Tuy nhiên, ở khâu suy luận, tình hình đã khác. Các quan sát viên ngành cho rằng, đối với tới 90% các ứng dụng thương mại (bao gồm nhận dạng hình ảnh, chatbot, xe tự lái...), chip nội địa đã đạt ngưỡng “đủ dùng” (good enough), khiến việc chuyển đổi từ giải pháp NVIDIA sang giải pháp nội địa trở thành một quyết định kinh doanh khả thi. Việc dự đoán ngày càng rõ ràng về các biện pháp trừng phạt mạnh hơn nữa càng thúc đẩy mạnh hơn xu hướng chuyển đổi này.
Thực tế, điểm nghẽn thực sự nằm ở hệ sinh thái phần mềm. Nền tảng CUDA của NVIDIA, sau hơn một thập kỷ tích lũy, đã trở thành tiêu chuẩn thực tế trong phát triển AI. Các nhà sản xuất chip nội địa đang đầu tư mạnh vào tính tương thích: MetaX thông báo loạt C500 của họ sẽ hỗ trợ tính tương thích với CUDA; Huawei đã mở mã nguồn hoàn toàn nền tảng CANN vào năm 2025 nhằm mở rộng hệ sinh thái nhà phát triển; Cambricon và Moore Threads cũng lần lượt xây dựng các công cụ dịch thuật từ CUDA sang ngôn ngữ lập trình riêng của mình. Tiến độ đuổi kịp hệ sinh thái sẽ quyết định trần thị phần tối đa mà chip nội địa có thể đạt được.
Các doanh nghiệp chip AI nội địa dồn dập tiến vào thị trường vốn
Sự chuyển dịch thị phần đang được phản ánh song hành trên thị trường vốn.
Từ đầu năm 2026, lĩnh vực GPU tại Trung Quốc chứng kiến làn sóng IPO rầm rộ. Biren Technology và MetaX đã niêm yết trên Sở Giao dịch Chứng khoán Khoa học và Công nghệ (STAR Market); Iluvatar CoreX đã niêm yết trên sàn chính của Sở Giao dịch Chứng khoán Hồng Kông; đơn xin niêm yết của燧原科技 (Soyeal Technology) trên STAR Market cũng đã được chấp thuận. Baidu công bố kế hoạch tách riêng Kunlunxin để niêm yết độc lập; theo nguồn tin thân cận, Alibaba cũng đang cân nhắc phương án tương tự đối với T-Head.
Năm 2025, Huawei chi 192,3 tỷ Nhân dân tệ cho nghiên cứu và phát triển, chiếm 22% doanh thu, tập trung vào chip, phần mềm và công cụ sản xuất nhằm giảm phụ thuộc sâu hơn vào công nghệ Hoa Kỳ. Ông Từ Trực Quân – Chủ tịch luân phiên của Huawei – phát biểu tại Hội chợ Di động Thế giới (MWC) 2026 rằng Huawei sẽ trở thành “phương án thay thế đảm bảo nguồn cung sức mạnh tính toán AI toàn cầu không bị gián đoạn”. Theo Reuters, chip Ascend 950PR thế hệ mới của Huawei đã thu hút sự quan tâm đặt hàng từ các “gã khổng lồ” như ByteDance và Alibaba; mục tiêu xuất xưởng năm 2026 là khoảng 750.000 chiếc, và sản xuất hàng loạt quy mô lớn sẽ bắt đầu vào nửa cuối năm.
Với NVIDIA, dù H200 đã được cấp phép xuất khẩu sang Trung Quốc, nhưng lòng tin cơ bản đã bị xói mòn. Chính sách kiểm soát chủ động và tự chủ của Bắc Kinh giờ đây không còn là viễn cảnh xa vời, mà đã trở thành hiện thực hiển nhiên – hiện thực được tạo nên bởi từng chiếc chip nội địa đang vận hành trong các trung tâm dữ liệu. Khi số liệu thị phần năm 2026 được công bố, con số 55% này sẽ tăng trở lại hay tiếp tục giảm, sẽ phụ thuộc vào việc chính sách xuất khẩu của Washington có thay đổi thêm lần nào nữa hay không, cũng như tốc độ thu hẹp khoảng cách của chip nội địa trong lĩnh vực huấn luyện mô hình.
Chào mừng tham gia cộng đồng chính thức TechFlow
Nhóm Telegram:https://t.me/TechFlowDaily
Tài khoản Twitter chính thức:https://x.com/TechFlowPost
Tài khoản Twitter tiếng Anh:https://x.com/BlockFlow_News











