
Meta: Mua được sức mạnh tính toán trị giá hàng trăm tỷ đô la, nhưng lại không giữ được những nhân sự then chốt
Tuyển chọn TechFlowTuyển chọn TechFlow

Meta: Mua được sức mạnh tính toán trị giá hàng trăm tỷ đô la, nhưng lại không giữ được những nhân sự then chốt
Cuộc chạy đua vũ trang AI tại Thung lũng Silicon không bao giờ thiếu những người mua siêu giàu sẵn sàng vung séc, nhưng lại thiếu những người biết cách sử dụng sức mạnh tính toán này để rèn luyện ra tương lai.
Bài viết: Ada, TechFlow
Pang Ruoming chưa kịp ngồi ấm chỗ làm việc tại Meta thì đã rời đi.
Tháng 7 năm 2025, Mark Zuckerberg đã giành được kỹ sư người Hoa hàng đầu trong lĩnh vực hạ tầng AI này từ tay Apple bằng một gói thù lao dài hạn trị giá hơn 200 triệu USD. Pang Ruoming được bổ nhiệm vào Phòng Thí nghiệm Trí tuệ Siêu việt của Meta để phụ trách xây dựng hạ tầng cho thế hệ mô hình AI tiếp theo.
Chỉ bảy tháng sau, OpenAI đã “đào tạo” anh ấy đi.
Theo báo cáo của The Information, OpenAI đã tiến hành chiến dịch tuyển dụng kéo dài nhiều tháng nhằm lôi kéo Pang Ruoming. Dù trước đó anh từng chia sẻ với đồng nghiệp rằng “mình đang làm việc rất vui vẻ tại Meta”, cuối cùng anh vẫn quyết định ra đi. Theo Bloomberg, gói thù lao của anh tại Meta gắn với các mốc thành tựu cụ thể; việc rời đi sớm đồng nghĩa với việc từ bỏ phần lớn cổ phần chưa được thực hiện.
200 triệu USD không mua nổi lòng trung thành trong bảy tháng.
Đây không chỉ đơn thuần là một câu chuyện nhảy việc.
Sự ra đi của một người – tín hiệu cảnh báo cho cả tập thể
Pang Ruoming không phải người đầu tiên rời đi.
Tuần trước, Mat Velloso – Trưởng bộ phận nền tảng nhà phát triển thuộc Phòng Thí nghiệm Trí tuệ Siêu việt của Meta – cũng tuyên bố từ chức. Người này gia nhập Meta vào tháng 7 năm ngoái sau khi rời Google DeepMind, và chỉ làm việc tại đây chưa đầy 8 tháng. Trước đó nữa, vào tháng 11 năm 2025, Yann LeCun – nhà khoa học AI hàng đầu kiêm chủ nhân giải Turing, người đã gắn bó với Meta suốt 12 năm – thông báo rời công ty để khởi nghiệp, theo đuổi dự án “mô hình thế giới” mà ông luôn kiên trì cổ xướng. Russ Salakhutdinov – Phó Chủ tịch phụ trách nghiên cứu AI sinh tổng hợp của Meta, đồng thời là học trò cốt cán của Geoffrey Hinton – cũng vừa chính thức công bố rời đi.
Để hiểu được tình trạng chảy máu chất xám tại Meta AI, trước hết cần hiểu rõ mức độ tổn thương nghiêm trọng mà Llama 4 gây ra.
Tháng 4 năm 2025, Meta tung ra hoành tráng loạt mô hình Llama 4 gồm Scout và Maverick. Các con số trên giấy tờ do công ty công bố thật sự ấn tượng: khẳng định vượt trội hoàn toàn so với GPT-4.5 và Claude Sonnet 3.7 trên các bộ kiểm thử chuẩn cốt lõi như MATH-500 và GPQA Diamond.
Tuy nhiên, mô hình kỳ vọng mang tính biểu tượng này của Meta nhanh chóng “lộ nguyên hình” trong các bài kiểm tra độc lập, mù (blind test) do cộng đồng mã nguồn mở thực hiện. Khả năng suy luận và khái quát hóa thực tế của nó chênh lệch một cách thảm hại so với những gì được quảng bá. Trước làn sóng phản bác mạnh mẽ từ cộng đồng, nhà khoa học AI hàng đầu của Meta – Yann LeCun – cuối cùng thừa nhận nhóm đã “sử dụng các phiên bản mô hình khác nhau để chạy trên các bộ kiểm thử khác nhau nhằm tối ưu hóa điểm số cuối cùng”.
Trong giới học thuật và kỹ thuật AI nghiêm túc, điều này chạm tới ranh giới không thể dung thứ. Nói cách khác, nhóm đã huấn luyện Llama 4 thành một “học sinh luyện đề” chỉ biết làm các đề thi năm ngoái, chứ không phải một “học sinh xuất sắc” thực sự sở hữu trí tuệ tiên phong. Thi toán thì đưa ra “thần đồng toán học”, thi lập trình thì đưa ra “thần đồng lập trình”: mỗi bài kiểm tra riêng lẻ đều đạt kết quả cao, nhưng thực chất đây không phải cùng một mô hình.
Trong giới học thuật AI, hiện tượng này gọi là “chọn quả ngọt” (cherry-picking); trong hệ thống giáo dục thi cử, nó gọi là “thay người thi”.
Với Meta – vốn tự hào là “ngọn hải đăng mã nguồn mở” – vụ bê bối này trực tiếp phá hủy tài sản quý giá nhất trong hệ sinh thái nhà phát triển: niềm tin. Hệ quả trực tiếp là Zuckerberg hoàn toàn “mất niềm tin vào nền tảng kỹ thuật ban đầu của đội GenAI”, từ đó mở màn cho loạt thay đổi nhân sự cấp cao được bổ nhiệm từ bên ngoài và việc tước quyền lực dần dần của các bộ phận hạ tầng cốt lõi.
Ông chi 14,3–15 tỷ USD để mua 49% cổ phần công ty gán nhãn dữ liệu Scale AI, đồng thời bổ nhiệm CEO 28 tuổi của Scale AI – Alexandr Wang – làm Giám đốc AI của Meta và thành lập Phòng Thí nghiệm Trí tuệ Siêu việt (MSL). Ngay trong cấu trúc tổ chức mới, nhà khoa học giải Turing LeCun phải báo cáo trực tiếp cho chàng trai trẻ 28 tuổi này. Đến tháng 10, Meta sa thải khoảng 600 vị trí trong MSL, bao gồm cả các thành viên thuộc phòng nghiên cứu FAIR do chính LeCun sáng lập.
Còn mô hình kỳ vọng Llama 4 Behemoth dự kiến ra mắt vào mùa hè năm 2025 thì liên tục bị hoãn: từ mùa hè sang mùa thu, rồi cuối cùng bị đình hoãn vô thời hạn.
Meta chuyển sang phát triển mô hình văn bản thế hệ tiếp theo mang mã nội bộ “Avocado” và mô hình ảnh/video mang mã nội bộ “Mango”. Theo báo cáo, mục tiêu của Avocado là cạnh tranh trực tiếp với GPT-5 và Gemini 3 Ultra. Dự kiến bàn giao cuối năm 2025, nhưng do hiệu suất kiểm thử và tối ưu huấn luyện không đạt yêu cầu, tiến độ bị dời sang quý I năm 2026. Meta thậm chí đang cân nhắc phát hành Avocado dưới dạng đóng nguồn, từ bỏ truyền thống mã nguồn mở vốn có của dòng Llama.
Meta đã phạm hai sai lầm chết người trong lĩnh vực mô hình AI. Thứ nhất là gian lận trên các bộ kiểm thử (benchmark), điều này trực tiếp phá hủy niềm tin từ cộng đồng nhà phát triển; thứ hai là ép buộc FAIR – một phòng nghiên cứu cơ bản đòi hỏi mười năm rèn giũa – vào một tổ chức sản phẩm chỉ chú trọng KPI theo quý. Hai sai lầm này cộng lại chính là nguyên nhân gốc rễ dẫn đến tình trạng chảy máu nhân tài hiện nay.
Chip tự研: Một chân khác cũng gãy
Nhân tài đang bỏ chạy, chip cũng gặp vấn đề.
Theo The Information, tuần trước Meta đã hủy bỏ dự án phát triển chip huấn luyện AI tiên tiến nhất đang được triển khai nội bộ.
Kế hoạch chip tự研 của Meta mang tên MTIA (Meta Training and Inference Accelerator). Lộ trình ban đầu của công ty đầy tham vọng: MTIA phiên bản 4 mang mã nội bộ “Santa Barbara”, phiên bản 5 mang mã “Olympus”, phiên bản 6 mang mã “Universal Core”, dự kiến lần lượt ra mắt trong giai đoạn 2026–2028. Trong đó, Olympus được thiết kế là chip đầu tiên của Meta dựa trên kiến trúc chiplet 2nm, hướng tới mục tiêu phục vụ đồng thời cả huấn luyện mô hình cao cấp và suy luận thời gian thực, cuối cùng thay thế vai trò của NVIDIA trong các cụm huấn luyện của Meta.
Giờ đây, chip huấn luyện tiên tiến nhất này đã bị hủy.
Meta không hoàn toàn thất bại: chip suy luận MTIA v3 mang mã nội bộ “Iris” đã được triển khai quy mô lớn tại các trung tâm dữ liệu của Meta, chủ yếu phục vụ hệ thống đề xuất cho Facebook Reels và Instagram, giúp giảm 40–44% tổng chi phí sở hữu (TCO). Nhưng suy luận và huấn luyện là hai chuyện hoàn toàn khác nhau. Suy luận là chạy mô hình, huấn luyện là đào tạo mô hình. Meta có thể tự làm chip suy luận, nhưng không thể chế tạo chip huấn luyện đủ sức cạnh tranh trực diện với NVIDIA.
Lịch sử đã từng chứng kiến điều này. Năm 2022, Meta từng thử nghiệm chip suy luận tự研, nhưng sau thất bại trong triển khai quy mô nhỏ, công ty lập tức từ bỏ và chuyển sang đặt hàng lớn từ NVIDIA.
Sự thất bại trong phát triển chip tự研 trực tiếp đẩy nhanh làn sóng mua sắm chip từ bên ngoài của Meta.
Mua sắm hoảng loạn trị giá 135 tỷ USD
Tháng 1 năm 2026, Meta công bố ngân sách chi tiêu vốn năm nay ở mức 115–135 tỷ USD, gần gấp đôi mức 72,2 tỷ USD của năm ngoái. Phần lớn khoản tiền này sẽ dành cho chip.
Chỉ trong vòng 10 ngày, ba hợp đồng lớn liên tiếp được ký:
Ngày 17 tháng 2, Meta ký thỏa thuận hợp tác chiến lược dài hạn, đa thế hệ với NVIDIA. Meta sẽ triển khai “hàng triệu” GPU Blackwell và thế hệ GPU Vera Rubin mới của NVIDIA, kèm theo CPU độc lập Grace. Các nhà phân tích ước tính giá trị giao dịch lên tới hàng chục tỷ USD, khiến Meta trở thành khách hàng siêu máy tính đầu tiên trên thế giới triển khai quy mô lớn CPU độc lập Grace của NVIDIA.
Ngày 24 tháng 2, Meta ký thỏa thuận chip dài hạn trị giá 60–100 tỷ USD với AMD. Meta sẽ mua GPU thế hệ MI450 mới nhất và CPU EPYC thế hệ thứ sáu của AMD. Như một phần của thỏa thuận, AMD phát hành cho Meta chứng quyền mua cổ phần phổ thông tối đa 160 triệu cổ phiếu, tương đương khoảng 10% cổ phần AMD, với giá 0,01 USD/cổ phiếu, được thực hiện theo từng mốc bàn giao.
Ngày 26 tháng 2, theo The Information, Meta ký thỏa thuận dài hạn trị giá hàng tỷ USD với Google để thuê chip TPU của Google Cloud nhằm huấn luyện và vận hành thế hệ mô hình ngôn ngữ lớn tiếp theo. Đồng thời, hai bên cũng đang thảo luận khả năng Meta sẽ mua trực tiếp chip TPU từ năm 2027 để triển khai tại các trung tâm dữ liệu riêng.
Một công ty mạng xã hội, trong vòng 10 ngày, đã ký ba hợp đồng mua sắm chip với ba nhà cung cấp khác nhau, tổng giá trị có thể vượt quá 1000 tỷ USD.
Đây không phải chiến lược đa dạng hóa. Đây là hành động mua sắm hoảng loạn.
Ba lớp logic đằng sau nỗi lo về năng lực tính toán
Tại sao Meta lại vội vàng đến vậy?
Thứ nhất, không còn trông cậy được vào chip tự研. Việc hủy bỏ dự án chip huấn luyện tiên tiến nhất đồng nghĩa với việc trong tương lai gần, Meta chỉ có thể đáp ứng nhu cầu huấn luyện AI bằng cách mua sắm từ bên ngoài. Chip suy luận MTIA có thể xử lý các nghiệp vụ đã trưởng thành như hệ thống đề xuất, nhưng để huấn luyện mô hình tiên phong như Avocado – đối thủ cạnh tranh trực tiếp với GPT-5 – bắt buộc phải dùng phần cứng cấp độ NVIDIA hoặc tương đương.
Thứ hai, đối thủ sẽ không chờ đợi. OpenAI đã nắm trong tay nguồn lực khổng lồ từ Microsoft, SoftBank và các quỹ chủ quyền UAE. Anthropic đã đảm bảo nguồn cung 1 triệu chip TPU và Trainium từ Google và Amazon. Gemini 3 của Google hoàn toàn được huấn luyện trên TPU. Nếu Meta không có đủ năng lực tính toán, ngay cả tấm vé vào cuộc đua cũng không giữ được.
Thứ ba – có thể là yếu tố căn bản nhất – Zuckerberg đang dùng “sức mua” để bù đắp cho sự thiếu hụt “năng lực nghiên cứu”. Sự thất bại của Llama 4, tình trạng chảy máu nhân tài cốt lõi và thất bại trong phát triển chip tự研 đã khiến câu chuyện AI của Meta trở nên mong manh trước thị trường chứng khoán. Lúc này, ký ba hợp đồng lớn với NVIDIA, AMD và Google ít nhất gửi đi một tín hiệu rõ ràng: Chúng tôi có tiền, chúng tôi đang mua, và chúng tôi chưa từ bỏ.
Chiến lược hiện tại của Meta là: nếu không làm chủ được phần mềm thì đổ tiền vào phần cứng; nếu không giữ được người thì mua chip. Nhưng cuộc đua AI không phải trò chơi chỉ cần viết séc là thắng. Năng lực tính toán là điều kiện cần, chứ không phải điều kiện đủ. Không có đội ngũ mô hình hàng đầu và lộ trình công nghệ rõ ràng, dù có nhiều chip đến đâu cũng chỉ là hàng tồn kho đắt đỏ trong kho.
Nỗi khổ của người mua
Nhìn lại ba thỏa thuận của Meta trong tháng Hai, một chi tiết thú vị thường bị đa số mọi người bỏ qua.
Meta mua từ NVIDIA là GPU Blackwell hiện tại và GPU Vera Rubin thế hệ tiếp theo; thỏa thuận với AMD là GPU MI450 và MI455X thế hệ tiếp theo; còn thuê từ Google là TPU Ironwood hiện tại, và dự kiến mua trực tiếp vào năm sau.
Ba nhà cung cấp, ba kiến trúc phần cứng và hệ sinh thái phần mềm hoàn toàn khác biệt.
Điều này đồng nghĩa với việc Meta phải liên tục “nhảy cóc” giữa ba hệ sinh thái nền tảng hoàn toàn khác nhau: CUDA của NVIDIA, ROCm của AMD và XLA/JAX của Google. Chiến lược đa nhà cung cấp tất nhiên giúp phân tán rủi ro chuỗi cung ứng và kìm hãm mức phí mua sắm phần cứng, nhưng đồng thời cũng làm độ phức tạp kỹ thuật tăng theo cấp số mũ.
Đây chính là điểm yếu chí mạng nhất hiện tại của Meta: để một mô hình nghìn tỷ tham số có thể huấn luyện hiệu quả trên ba nền tảng phần cứng có mô hình lập trình nền tảng hoàn toàn khác nhau, cần không chỉ các kỹ sư am hiểu CUDA, mà là những kiến trúc sư có khả năng xây dựng từ đầu một khuôn khổ huấn luyện đa nền tảng.
Loại người này trên toàn thế giới có lẽ không quá 100 người. Và Pang Ruoming là một trong số đó.
Chi 1000 tỷ USD để mua tổ hợp phần cứng phức tạp nhất thế giới, đồng thời lại đang mất đi những bộ não duy nhất có thể vận hành chúng – đó mới chính là hình ảnh kỳ lạ nhất trong canh bạc lớn của Zuckerberg.
Canh bạc của Zuckerberg
Nếu lùi xa hơn để nhìn toàn cảnh, con đường hành động của Zuckerberg trong lĩnh vực AI trong 18 tháng qua mang nhịp điệu đáng kinh ngạc giống với thời kỳ ông “đặt cược toàn bộ” vào metaverse:
Nhận ra xu hướng → đầu tư mạnh tay → tuyển dụng ào ạt → gặp khó khăn → chuyển hướng chiến lược → lại đầu tư mạnh tay.
Giai đoạn 2021–2023 là metaverse, kết quả là mỗi năm lỗ hàng chục tỷ USD, và giá cổ phiếu từ đỉnh 380 USD tụt xuống còn 88 USD. Giai đoạn 2024–2026 là AI, cũng với cách làm “không tiếc tiền”, tái cấu trúc tổ chức liên tục, và cùng với đó là câu chuyện kể mang tính tuyên ngôn: “Hãy tin tôi, tôi có tầm nhìn”.
Khác biệt nằm ở chỗ, lần này luồng gió AI thực tế hơn hẳn so với metaverse. Và Meta có tiền để đốt: hoạt động quảng cáo tạo ra dòng tiền mặt dồi dào; quý IV năm 2025, doanh thu của Meta đạt 59,9 tỷ USD, tăng 24% so với cùng kỳ năm trước.
Vấn đề nằm ở chỗ: tiền có thể mua được chip, mua được năng lực tính toán, thậm chí mua được cả một chỗ ngồi trong văn phòng – nhưng không thể mua được người ở lại.
Pang Ruoming chọn OpenAI, Russ Salakhutdinov chọn ra đi, LeCun chọn khởi nghiệp.
Cược hiện tại của Zuckerberg là: chỉ cần mua đủ nhiều chip, xây đủ lớn các trung tâm dữ liệu và chi đủ nhiều tiền, thì cuối cùng sẽ tìm được hoặc đào tạo được những người có thể vận dụng các nguồn lực này.
Cược này có thể thành công. Meta vẫn là một trong những công ty công nghệ giàu nhất thế giới, với dòng tiền từ hoạt động trên 100 tỷ USD – đó là hào thành vững chắc nhất của họ. Từ OpenAI đến Anthropic, từ Google đến các đối thủ khác, Meta đều đang liên tục “đào tạo” nhân tài. Theo QuantumBit, trong số 44 thành viên của đội Trí tuệ Siêu việt của Meta, gần 40% đến từ OpenAI.
Nhưng sự tàn khốc của cuộc đua AI nằm ở chỗ: dự trữ năng lực tính toán, danh sách nhân tài và hiệu suất mô hình đều là những thông tin công khai. Sự kiện gian lận benchmark của Llama 4 đã chứng minh rằng, trong ngành này, bạn không thể duy trì vị thế dẫn đầu chỉ bằng slide thuyết trình và hoạt động quan hệ công chúng.
Thị trường cuối cùng chỉ công nhận một thứ duy nhất: mô hình của bạn có đủ tốt hay không.
Vị trí trong chuỗi thức ăn
Khi cuộc chạy đua vũ trang AI bước sang năm 2026, thứ hạng trong “chuỗi thức ăn” đã phần nào rõ ràng:
Đỉnh cao là OpenAI và Google. OpenAI sở hữu mô hình mạnh nhất, cơ sở người dùng lớn nhất và huy động vốn mạnh mẽ nhất. Google sở hữu chip tự研, mô hình tự研 và cơ sở hạ tầng điện toán đám mây tự研 – một hệ sinh thái tích hợp dọc hoàn chỉnh. Anthropic đứng sát phía sau, dựa vào năng lực sản phẩm của mô hình Claude và nguồn cung năng lực tính toán kép từ Google và Amazon, vững vàng ở hàng đầu tiên.
Còn Meta? Công ty đã chi nhiều tiền nhất, ký nhiều hợp đồng chip nhất, và tiến hành tái cấu trúc tổ chức thường xuyên nhất – nhưng đến nay vẫn chưa trình làng một mô hình tiên phong nào đủ sức thuyết phục thị trường.
Câu chuyện AI của Meta có phần giống Yahoo năm 2005. Lúc đó, Yahoo cũng là một trong những công ty internet giàu nhất, cũng đang mua sắm và chi tiêu điên cuồng – nhưng vẫn không thể tạo ra một công cụ tìm kiếm như Google. Tiền không phải là vạn năng. Zuckerberg cần suy nghĩ rõ ràng: Meta thực sự muốn làm gì trong lĩnh vực AI – chứ không phải thấy cái gì “hot” thì mua cái đó.
Dĩ nhiên, viết bản cáo phó cho Meta lúc này vẫn còn quá sớm. 3,58 tỷ người dùng hoạt động hàng tháng, doanh thu quý 59,9 tỷ USD và bộ dữ liệu xã hội lớn nhất thế giới – đây là những tài sản mà bất kỳ đối thủ nào cũng khó lòng sao chép.
Nếu mô hình thế hệ tiếp theo mang mã nội bộ Avocado có thể ra mắt đúng hạn vào năm 2026 và quay trở lại hàng đầu, thì mọi khoản chi tiêu và tái cấu trúc của Zuckerberg sẽ được đóng gói thành “dũng khí chiến lược xoay chuyển cục diện”. Nhưng nếu một lần nữa không đạt kỳ vọng, thì 135 tỷ USD này sẽ chỉ đổi lấy những kho chứa silicon được cấp điện và nóng lên.
Dẫu sao, cuộc chạy đua vũ trang AI tại Thung lũng Silicon chưa bao giờ thiếu những “người mua siêu cấp” vung séc. Điều thiếu là những người biết cách dùng năng lực tính toán ấy để luyện ra tương lai.
Chào mừng tham gia cộng đồng chính thức TechFlow
Nhóm Telegram:https://t.me/TechFlowDaily
Tài khoản Twitter chính thức:https://x.com/TechFlowPost
Tài khoản Twitter tiếng Anh:https://x.com/BlockFlow_News














