
Dưới ánh vinh quang của DeepSeek: Những "sáu chú rồng nhỏ" cô đơn
Tuyển chọn TechFlowTuyển chọn TechFlow

Dưới ánh vinh quang của DeepSeek: Những "sáu chú rồng nhỏ" cô đơn
Dưới ánh sáng của DeepSeek liên tục gây bùng nổ, cuộc tái cấu trúc "sáu chú rồng nhỏ" vốn đã phân hóa sẽ tiếp tục diễn ra nhanh chóng.
Tác giả: Ngô Thiên Ngữ
Chuyện vui buồn của con người không相通 nhau. Từ năm 2016 khi mở ra năm đầu tiên của trí tuệ nhân tạo, ngành AI đã trải qua nhiều lần tái cơ cấu. Nhờ đà ChatGPT, DeepSeek như con cá trê khuấy động toàn bộ thị trường mô hình lớn, trong khi các công ty khởi nghiệp mô hình lớn khác được giới chuyên môn gọi là "sáu long tử" lại có hoàn cảnh đối lập như mặt trời mọc ở phương đông, mưa rơi ở phương tây.
Sau khi DeepSeek gây chấn động giới với việc ra mắt DeepSeek-V3 vào dịp Tết Nguyên đán – mô hình chi phí thấp, hiệu năng sánh ngang GPT-4o – công ty tiếp tục phát hành mô hình R1 vào ngày 20 tháng 1, chỉ sau 6 ngày đã vươn lên vị trí số một về lượt tải trên App Store toàn cầu của Apple, và đạt hơn 110 triệu lượt tải tích lũy trong vòng một tháng. Trong thời gian này, các nhà cung cấp điện toán đám mây nhanh chóng đưa phiên bản mã nguồn mở V3 và R1 lên nền tảng, các sản phẩm như tìm kiếm Baidu, WeChat cũng tích cực đón nhận DeepSeek.
Trong khi đó, các mô hình học tăng cường toàn cầu Kimi k1.5 và mô hình suy luận bước nhảy Step R-mini được ra mắt cùng thời điểm với DeepSeek, dù khả năng mô hình ở nhiều khía cạnh gần bằng o1 nhưng vẫn bị淹没 giữa làn sóng dư luận nóng rực xung quanh DeepSeek.
So với sự ồn ào của DeepSeek, "sáu long tử" liên tiếp xuất hiện tin xấu: Zero One Everything tiếp tục phân chia, Moonshot chưa giải quyết xong vụ kiện trọng tài, MiniMax lại có thêm một lãnh đạo cấp cao nghỉ việc...
Và phía sau đó còn là những nhà VC thất vọng: Các dự án được họ đầu tư tiền thật, không dự án nào đạt được độ nóng như DeepSeek. Hiện tại, trong "sáu long tử", đã có 4 công ty hơn nửa năm không có thông tin gọi vốn. Năm 2024 giới chuyên môn cho rằng đã có hai trong "sáu long tử" tụt hậu, vậy năm 2025, ai sẽ là người tiếp theo?
Chỉ còn ba công ty tiếp tục bám trụ mô hình lớn
Thành công bùng nổ của DeepSeek không phải không có dấu hiệu báo trước. Kể từ khi ra mắt mô hình đầu tiên DeepSeek Coder vào ngày 2 tháng 11 năm 2023, trong hơn một năm, công ty đã ra mắt hơn 10 phiên bản mô hình khác nhau. Trong đó, mô hình V2 ra mắt hồi tháng 5 năm ngoái có hiệu năng ngang GPT-4 Turbo nhưng giá chỉ bằng 1% so với GPT-4, do đó DeepSeek được mệnh danh là "kẻ giết giá", "Pinduoduo của giới AI", đồng thời khơi mào làn sóng giảm giá đầu tiên trong ngành mô hình lớn.
Ngày 27 tháng 1 năm 2025, DeepSeek vượt mặt ChatGPT, đứng đầu bảng xếp hạng ứng dụng miễn phí của Apple App Store tại khu vực Trung Quốc và Mỹ, thu hút sự chú ý toàn cầu. Động lực giúp DeepSeek đạt thành tựu này chính là mô hình suy luận lớn DeepSeek-R1. Theo thông tin công bố từ DeepSeek, R1 đạt điểm số gần bằng phiên bản chính thức o1 trong nhiều bài kiểm tra uy tín, thậm chí vượt o1 ở một số bài kiểm tra nhất định.
Bên cạnh bảng xếp hạng, tổ hợp "mã nguồn mở + hiệu quả chi phí" là cú đấm nối khiến DeepSeek thu hút lượng nhiệt khổng lồ. Trước sức ép từ DeepSeek, Lý Ngạn Hoằng – người sáng lập Baidu, từng trung thành với mô hình đóng mã – cũng tuyên bố gia nhập hàng ngũ mã nguồn mở; Sam Altman, người sáng lập OpenAI cũng thừa nhận công ty mình luôn ở "phía sai" trong chiến lược mã nguồn mở.
MiniMax trong "sáu long tử" đã ra mắt mô hình mã nguồn mở đầu tiên vào ngày 15 tháng 1, người sáng lập Viêm Tuấn Kiệt trong cuộc phỏng vấn với WanDian cũng nói rằng: “Lần đầu khởi nghiệp thiếu nhiều kinh nghiệm, nếu được chọn lại, chắc chắn sẽ mở mã ngay từ ngày đầu.” Trong số năm công ty còn lại, chỉ có Zhipu là sớm đi theo hướng vừa đóng mã vừa mở mã. Sau gần hai năm vật lộn, hướng đi của "sáu long tử" giờ đây đã hoàn toàn khác biệt.
Zero One Everything là công ty mô hình nền tảng đầu tiên công khai điều chỉnh lớn: trước tiên cắt giảm đội thuật toán huấn luyện trước (pre-training) và đội Infra, một số nhân sự chuyển sang Alibaba dưới dạng nhảy việc, sau đó tuyên bố hợp tác với Alibaba Cloud và Khu phát triển công nghệ cao Tô Châu để thành lập phòng thí nghiệm và cơ sở mô hình lớn công nghiệp.
Về nhân sự, Hoàng Văn Hạo phụ trách huấn luyện mô hình, Lam Vũ Xuyên phụ trách nền tảng API mô hình lớn, Tào Đại Bằng phụ trách sản phẩm năng suất đều lần lượt rời đi. Dù cố gắng duy trì chỗ ngồi, Zero One Everything không che giấu được sự suy yếu trong cuộc đua mô hình lớn lần này.
Baichuan Intelligence thì vào năm 2024 xác định rõ đi theo赛道 y tế, gần đây đã ra mắt "bác sĩ nhi khoa AI" đầu tiên. Trong thương mại hóa B2B, Baichuan dường như không thuận lợi, Hồng Đào – đồng sáng lập và phụ trách thương mại hóa – đã nghỉ việc trước Tết. Một nhân viên Baichuan xác nhận kết quả thực tế không đạt kỳ vọng: “Giờ có thêm DeepSeek rồi, áp lực năm nay chỉ tăng chứ không giảm.”
Người phụ trách thương mại hóa B2B cũng rời khỏi MiniMax là Ngụy Vĩ. Trước đó, Ngụy Vĩ từng nói trong phỏng vấn rằng nhiều khách hàng B không dễ dàng chi tiền để hỗ trợ doanh thu cho các công ty mô hình lớn, mà chỉ có thể dựa vào năng lực nghiên cứu phát triển, thuật toán để giúp khách hàng đạt được kết quả mong muốn trong các tình huống thực tế, điều này cũng chứng minh thương mại hóa mô hình lớn không hề dễ dàng.
Nhìn chung, chỉ còn lại Moonshot, Zhipu và StepFun đang tập trung vào đổi mới công nghệ mô hình lớn và theo đuổi AGI. Chịu ảnh hưởng từ DeepSeek, StepFun cũng gia nhập hàng ngũ mã nguồn mở, tuy nhiên khác với DeepSeek tập trung vào mô hình văn bản, StepFun mới đây công bố mã nguồn mở hai mô hình đa phương tiện: Step-Video-T2V và Step-Audio.
Rạng sáng ngày 23 tháng 2, Moonshot công bố bài báo mới nhất Muon is Scalable for LLM Training, đồng thời công bố mã nguồn mở mô hình MoE tên Moonlight, với tham số kích hoạt chỉ cần 3 tỷ. Nhiều chuyên gia trong ngành cho rằng đây là hành động "đi đêm trước tuần công bố mã nguồn", bởi trước đó DeepSeek tuyên bố sẽ liên tục công bố 5 dự án mã nguồn mở trong 5 ngày.
Đối với Moonshot, điều cấp bách hơn cả có lẽ là sản phẩm Kimi – nơi họ đầu tư mạnh vào quảng cáo.
Đốt tiền quảng cáo khó thành số một
Cũng như "sáu long tử" trong ngành mô hình lớn, DeepSeek cũng có sản phẩm C2C cùng tên, nhưng trong tuần đầu ra mắt không thu hút nhiều sự chú ý trên thị trường. Theo dữ liệu do QuestMobile tiết lộ với truyền thông, từ ngày 13 đến 19 tháng 1 năm 2025, lượng tải hàng tuần của ứng dụng DeepSeek chỉ đạt 285.000, xa thấp hơn Douyin (4,52 triệu) và Kimi (1,557 triệu).
Tuy nhiên, sau khi ra mắt R1 vào ngày 20 tháng 1 năm 2025, lượng tải DeepSeek bắt đầu tăng trưởng theo đường dốc đứng. Nghiên cứu từ Sensor Tower cho thấy, trong 18 ngày sau buổi ra mắt, lượng tải DeepSeek vượt 16 triệu lần, gần gấp đôi mức 9 triệu lần của ChatGPT khi OpenAI lần đầu công bố.
Lượng truy cập tăng vọt khiến DeepSeek一度 sập hệ thống, nhưng dù vậy, đà tăng trưởng vẫn rất mạnh mẽ, lượng tải hàng tháng vượt 110 triệu. Ánh hào quang của DeepSeek giờ đây không ai có thể làm ngơ. Tại cuộc họp nội bộ toàn công ty ByteDance ngày 13 tháng 2, CEO Lương Như Ba nhắc đến DeepSeek và thừa nhận tốc độ phản ứng chưa đủ nhanh, năm nay phải theo đuổi ra mắt thông minh.
WeChat của Tencent thử nghiệm tích hợp tìm kiếm AI DeepSeek, sau khi lưu lượng sử dụng vượt dự kiến đã huy động ứng dụng AI Yuanbao hỗ trợ tìm kiếm WeChat. Ngày 22 tháng 2, Tencent Yuanbao vượt Douyin của ByteDance vươn lên vị trí thứ hai trên bảng xếp hạng ứng dụng miễn phí của Apple tại Trung Quốc, DeepSeek tiếp tục giữ vững vị trí số một.
"Hai anh cả" thay đổi vị trí trong vòng một tháng ngắn ngủi buộc Douyin và Kimi – những bên từng đốt tiền đổi tăng trưởng – không còn thế mạnh. Điểm khác biệt là, bên trước sinh ra đã ngậm "chìa khóa vàng", còn bên sau là "quý tộc khởi nghiệp". Trước đó, một số truyền thông tính toán riêng trên kênh iPhone, Kimi chi khoảng 200 nghìn mỗi ngày, còn Douyin lên tới 2,48 triệu.
Dưới ảnh hưởng của DeepSeek, Moonshot gần đây bị lộ thông tin cắt giảm mạnh ngân sách quảng cáo sản phẩm, bao gồm tạm dừng quảng cáo trên nhiều kênh Android và ngừng hợp tác với các nền tảng quảng cáo bên thứ ba. Theo một nguồn tin nội bộ tiết lộ với AI Guangnian: “Quả thực đã điều chỉnh chiến lược quảng bá, có tăng trưởng tự nhiên nhưng không thể so sánh với đà tăng của DeepSeek.”
Kimi hiện tại còn phiền não hơn thế: «An Yong Waves» độc quyền biết được, vụ kiện trọng tài Kimi bị đình hoãn lâu nay không như kỳ vọng đạt được hòa giải, mà đã bước vào quy trình tiếp theo. Theo người trong cuộc tiết lộ, hai bên trong vụ kiện trọng tài Kimi – cổ đông cũ của Xuanyun Zhineng và Dương Trực Lân cùng cộng sự – đã lần lượt hoàn tất thanh toán phí tại HKIAC (Trung tâm Trọng tài Quốc tế Hồng Kông) vào cuối tháng 1 và cuối tháng 2, hiện nay hội đồng trọng tài đã được thành lập. Và nhân vật chủ chốt hơn cả trong sự việc này là Trương Dự Đồng, có thể sẽ bị khởi kiện riêng biệt.
MiniMax cũng đặt nhiều kỳ vọng vào sản phẩm C2C, lý do là sản phẩm nổi bật Talkie từng trở thành ứng dụng AI có lượng tải cao thứ tư tại Mỹ trong nửa đầu năm 2024, giúp họ nếm được trái ngọt. Nhưng cảnh đẹp chẳng kéo dài, giữa tháng 12, Talkie lặng lẽ biến mất khỏi cửa hàng ứng dụng Apple tại thị trường Mỹ, dù nền tảng Android không bị ảnh hưởng.
StepFun, Zero One Everything, Zhipu AI và Baichuan Intelligence cũng đều có sản phẩm ứng dụng AI riêng, nhưng theo bảng xếp hạng sản phẩm AI, trong top 20 ứng dụng AI có lượng người dùng hoạt động hàng tháng cao nhất vào tháng 1 năm 2025 không có bất kỳ sản phẩm nào thuộc về bốn hãng này. Trước đó, một nhân viên Baichuan Intelligence từng nói với AI Guangnian: “Việc người dùng BaiXiaoYing giữ chân và tăng trưởng kém cũng không có gì ngạc nhiên, chúng tôi hầu như không chạy quảng cáo, cứ để các bên khác đốt tiền giáo dục người dùng trước.”
Hiện tại, DeepSeek, Tencent Yuanbao và ByteDance Douyin đang chiếm ba vị trí đầu bảng xếp hạng ứng dụng miễn phí trên App Store của Apple. Muốn lọt榜, "sáu long tử" sẽ phải đối mặt với cạnh tranh khốc liệt hơn, hiện tại Nanos tìm kiếm ở vị trí thứ bảy, Chu Hồng Nghị đang đích thân xuống sân "bán hàng".
Một đối thủ không thể xem nhẹ khác là Alibaba: Sau khi ứng dụng AI Tongyi sáp nhập vào nhóm thông tin thông minh Alibaba, gần đây mảng kinh doanh AI C2C của Alibaba đã mở đợt tuyển dụng quy mô lớn với hàng trăm vị trí, tập trung vào các vị trí phát triển sản phẩm và kỹ thuật liên quan mô hình lớn AI. Trước sói sau hổ – đúng như hoàn cảnh thực tế hiện nay của "sáu long tử" trong ngành mô hình lớn.
Khi câu chuyện công nghệ không còn lãng mạn, thương mại hóa không đạt kỳ vọng, tăng trưởng người dùng hoạt động hàng tháng không tương xứng với đầu tư, "sáu long tử" trong ngành mô hình lớn – lý tưởng đầy đặn, hiện thực xương xẩu.
Ngưỡng gọi vốn vòng tiếp theo tăng cao
Chi phí khổng lồ cho việc huấn luyện trước mô hình lớn là điều được công nhận. Lý Khai Phục từng tiết lộ, chi phí một lần huấn luyện trước dao động khoảng 3-4 triệu USD. Ngay cả Yi-Lightning với chi phí thấp hơn cũng tiêu tốn 2.000 GPU trong một tháng rưỡi, mất hơn 3 triệu USD.
Ngay cả DeepSeek – dù gắn mác chi phí thấp – thì khoản đầu tư ban đầu cũng khó lượng hóa. Cơ quan nghiên cứu bên thứ ba SemiAnalysis ước tính DeepSeek thực tế sở hữu lượng dự trữ năng lực tính toán khổng lồ: tổng cộng lắp ráp 60.000 card GPU Nvidia, bao gồm 10.000 A100, 10.000 H100, 10.000 H800 "phiên bản đặc biệt" và 30.000 H20 "phiên bản đặc biệt".
“Chi phí huấn luyện mô hình lớn phổ thông, chúng tôi ước tính khoảng 1 tỷ USD, đây chỉ là phần năng lực tính toán, chưa kể hai phần tốn kém khác là dữ liệu và chi phí nhân lực. Nhân tài trong lĩnh vực mô hình lớn toàn cầu hiện nay cực kỳ khan hiếm,” Tiến sĩ Đỗ Phong – sáng lập viên công ty đầu tư Jumei Ventures, cựu giám đốc Microsoft Ventures khu vực Trung Hoa – từng nói với tác giả.
Do cần đầu tư quá lớn, trong một thời gian dài giới trong nghề lan truyền một quan điểm: vé vào sân đầu tư doanh nghiệp mô hình lớn là 100 triệu USD. Thông điệp ẩn sau câu nói này là: một công ty khởi nghiệp mô hình lớn nếu không gọi được vốn sẽ khó lòng sống sót.
Sau khi cuộc chiến "trăm mô hình" bùng nổ năm 2023, gần như mỗi tháng đều có tin gọi vốn, nhưng khi luận điệu bong bóng AI lan rộng, từ tháng 9 năm 2024 trở đi, trong một thời gian dài không còn dòng tiền hàng trăm triệu đô la đổ vào "sáu long tử". Mãi đến trước Tết 2025, Zhipu và StepFun lần lượt công bố đã nhận được "tiền qua đông": Zhipu hoàn tất vòng gọi vốn mới trị giá 3 tỷ Nhân dân tệ, StepFun hoàn tất vòng B gọi vốn hàng trăm triệu USD.
Trong "sáu long tử", 4 công ty còn lại đã hơn nửa năm không có động thái gọi vốn mới: MiniMax công bố hoàn tất vòng B gọi vốn 600 triệu USD vào tháng 3 năm ngoái, Baichuan Intelligence nhận được 5 tỷ Nhân dân tệ vòng A vào tháng 7 năm ngoái, Zero One Everything hoàn tất vòng gọi vốn hàng trăm triệu USD vào tháng 8 năm ngoái, Moonshot gọi vốn 300 triệu USD vào tháng 8 năm ngoái.
Trong dịp Tết Nguyên đán, DeepSeek bùng nổ toàn cầu, dư luận hết lời khen ngợi DeepSeek và người sáng lập Lương Văn Phong. Trong giới đầu tư khởi nghiệp, gần đây liên tục lan truyền tin tức về việc DeepSeek có thể gọi vốn, định giá bao nhiêu.
Trước đó có tin đồn Alibaba sẽ đầu tư 1 tỷ USD, chiếm 10% cổ phần với định giá 10 tỷ USD. Phó chủ tịch Alibaba Nhan Kiều nhanh chóng phủ nhận trên mạng xã hội: “Thông tin Alibaba đầu tư DeepSeek đang lan truyền ngoài xã hội là tin giả.” Sau đó truyền thông nước ngoài đưa tin “DeepSeek lần đầu cân nhắc gọi vốn bên ngoài”, đại diện DeepSeek bác bỏ, khẳng định mọi tin tức gọi vốn đều là tin đồn.
“Nhiều nhà đầu tư trực tiếp hoặc nhờ mối quan hệ hẹn gặp Lương Văn Phong. Tôi dự đoán định giá của họ chắc chắn vượt xa mức hiện tại của 'sáu long tử mô hình lớn'”, một nhà đầu tư từ CICC Capital cho biết, “DeepSeek đã trở thành chuẩn mực so sánh, để 'sáu long tử' gọi được vốn mới trên thị trường sơ cấp, ngưỡng hiện nay rõ ràng cao hơn nhiều.”
Thực tế, kể từ khi làn sóng khởi nghiệp mô hình lớn bùng nổ, giới trong ngành ít người tin rằng cả "sáu long tử" cuối cùng đều có thể tồn tại như những “công ty mô hình lớn độc lập”. Một số người sáng lập trong "sáu long tử" cũng từng bày tỏ quan điểm tương tự tại các diễn đàn công khai, ví dụ như Viêm Tuấn Kiệt – người sáng lập MiniMax – cho rằng tương lai toàn cầu chỉ còn lại 5 doanh nghiệp mô hình lớn.
“Trung Quốc chắc chắn sẽ có ChatGPT của riêng mình. Cũng giống như công cụ tìm kiếm, chúng ta có yêu cầu tuân thủ riêng. Nhưng ChatGPT Trung Quốc chỉ có thể xuất hiện trong 5 công ty: BAT + ByteDance + Huawei,” Thành Hạo – người sáng lập Xunlei, nhà đầu tư Yuanwang Capital – từng nói với tác giả.
Dưới sức nóng liên tục, "sáu long tử" vốn đã phân hóa sẽ càng nhanh chóng tái cơ cấu.
Chào mừng tham gia cộng đồng chính thức TechFlow
Nhóm Telegram:https://t.me/TechFlowDaily
Tài khoản Twitter chính thức:https://x.com/TechFlowPost
Tài khoản Twitter tiếng Anh:https://x.com/BlockFlow_News














