
Hóa đơn chi phí suy luận AI tăng vọt, Shopify và Roblox cảnh báo: Tiền tiết kiệm được từ việc sa thải nhân sự không đủ để chi trả cho chi phí chip
Tuyển chọn TechFlowTuyển chọn TechFlow

Hóa đơn chi phí suy luận AI tăng vọt, Shopify và Roblox cảnh báo: Tiền tiết kiệm được từ việc sa thải nhân sự không đủ để chi trả cho chi phí chip
Hai mặt của lợi ích AI — tiết kiệm lao động và tiêu thụ năng lực tính toán — lần đầu tiên được trình bày song song trong cùng một báo cáo tài chính, với mức tiêu thụ năng lực tính toán rõ ràng vượt trội hơn.
Tác giả: Claude, TechFlow
Giới thiệu của TechFlow: Mùa báo cáo tài chính quý I năm 2026 của các tập đoàn công nghệ hàng đầu đã phơi bày một hiện tượng mới: Trí tuệ nhân tạo (AI) vừa giúp doanh nghiệp “đóng băng” tuyển dụng và cắt giảm vị trí việc làm, đồng thời chi phí tiêu thụ token và khấu hao GPU của chính AI lại đang ngược chiều “ăn mòn” biên lợi nhuận gộp. Chi phí mô hình ngôn ngữ lớn (LLM) đang kìm hãm biên lợi nhuận gộp từ dịch vụ đăng ký của Shopify; khoảng một phần tư mức điều chỉnh giảm dự báo lợi nhuận cả năm của Roblox được quy trực tiếp cho khoản đầu tư gia tăng vào AI; bốn công ty—Amazon, Meta, Microsoft và Google—dự kiến chi tổng cộng 725 tỷ USD cho AI trong năm 2026, tăng 77% so với năm trước. Lợi ích kép từ AI—tiết kiệm lao động và tiêu tốn năng lực tính toán—lần đầu tiên cùng xuất hiện song hành trên cùng một báo cáo tài chính, và phía tiêu tốn năng lực tính toán rõ ràng chiếm ưu thế hơn.
Mùa báo cáo tài chính quý I đang dần “hiệu chỉnh lại” câu chuyện đơn giản hóa rằng “AI thay thế lao động”.
Một loạt công ty công nghệ, vừa trình bày thành tích “đóng băng tuyển dụng” và đẩy nhanh tốc độ đổi mới sản phẩm, vừa buộc phải giải trình với nhà đầu tư một vấn đề nan giải hơn: chi phí khấu hao chip AI tăng vọt và chi phí token không thể dự đoán được đang “ăn ngược” khoản tiền tiết kiệm được từ việc sa thải nhân sự.
Harley Finkelstein, Chủ tịch Shopify, phát biểu tại hội nghị báo cáo tài chính ngày 5 tháng 5 năm 2026 rằng hiện nay AI đảm nhận hơn 50% khối lượng viết mã của công ty, đồng thời hỗ trợ Shopify tung ra hơn 300 sản phẩm và tính năng mới trong khi số lượng nhân sự giữ ổn định. Tuy nhiên, ngay tại hội nghị báo cáo tài chính này, ban lãnh đạo công ty cũng thừa nhận biên lợi nhuận gộp từ giải pháp đăng ký đang bị chi phí mô hình ngôn ngữ lớn (LLM) “bù trừ một phần”, và xu hướng này sẽ kéo dài.
Shopify: “Hố đen chi phí LLM” đằng sau biên lợi nhuận gộp 80%
Biên lợi nhuận gộp từ giải pháp đăng ký của Shopify trong quý I đạt 80%, bằng với cùng kỳ năm ngoái, nhưng chi phí duy trì con số này đang thay đổi.
Theo hồ sơ 10-Q mà Shopify nộp lên Ủy ban Chứng khoán Mỹ (SEC), chi phí cho giải pháp đăng ký trong quý I năm 2026 tăng 20% so với cùng kỳ, lên mức 148 triệu USD (so với 123 triệu USD cùng kỳ năm 2025). Trong đó, riêng chi phí điện toán đám mây và cơ sở hạ tầng (bao gồm chi phí sử dụng AI) tăng thêm 22 triệu USD, là yếu tố chủ chốt thúc đẩy tổng chi phí tăng. Giám đốc Tài chính (CFO) của Shopify, ông Jeff Hoffmeister, phát biểu tại hội nghị báo cáo tài chính rằng “các hiệu ứng quy mô và cải thiện hiệu suất hỗ trợ đã bị phần nào bù trừ bởi chi phí LLM gia tăng—chủ yếu do việc thương gia sử dụng trợ lý AI Sidekick—và xu hướng này dự kiến sẽ tiếp tục”.
Sidekick là trợ lý AI được tích hợp sẵn vào nền tảng Shopify. Trong quý này, số lượng cửa hàng hoạt động tuần trên Sidekick tăng 385% so với cùng kỳ; thương gia sử dụng Sidekick để xây dựng hơn 12.000 ứng dụng tùy chỉnh, tăng hơn 200% so với quý trước; gần một nửa tổng số luồng tự động (Shopify Flows) được tạo ra bởi AI. Lưu lượng truy cập vào cửa hàng do AI thúc đẩy tăng gấp 8 lần; đơn đặt hàng phát sinh từ tìm kiếm bằng AI tăng gần 13 lần.
Nhưng sự bùng nổ về mức độ sử dụng này đồng nghĩa với việc số lần gọi suy luận (inference) từ AI tăng theo cấp số mũ. Mỗi tương tác giữa thương gia với Sidekick, mỗi đề xuất chủ động được tạo bởi tính năng Pulse, đều tương ứng với một hóa đơn thanh toán token gửi lên nhà cung cấp mô hình ở thượng nguồn.
Shopify phân tách rõ ràng hai hạng mục chi phí “AI nội bộ” và “AI bên ngoài” để trình bày với nhà đầu tư: Việc dùng AI nội bộ để viết mã và cắt giảm chi phí nhân sự là chiến thắng trong “trò chơi chi phí”; còn việc cung cấp sản phẩm AI cho thương gia là lựa chọn chiến lược nhằm “liên kết chặt chẽ chi phí cơ sở hạ tầng với mức độ sử dụng thực tế của thương gia”. Finkelstein khái quát logic này trong hội nghị báo cáo tài chính như sau: “AI là một lợi thế cấu trúc, chứ không chỉ là một khoản chi phí”.
Roblox: Một phần tư mức điều chỉnh giảm lợi nhuận đến trực tiếp từ AI
Naveen Chopra, Giám đốc Tài chính (CFO) của Roblox, tiết lộ rõ ràng tại hội nghị báo cáo tài chính quý I năm 2026 ngày 30 tháng 4 rằng khoảng một phần tư mức điều chỉnh giảm dự báo lợi nhuận cả năm so với hướng dẫn trước đó bắt nguồn từ khoản đầu tư gia tăng vào AI và điều chỉnh tỷ lệ chia sẻ doanh thu dành cho nhà phát triển (DevEx) đối với nhóm người dùng Mỹ từ 18 tuổi trở lên.
Hiện nay, Roblox đang vận hành hơn 400 mô hình AI trên GPU thuộc sở hữu nội bộ và trên nền tảng điện toán đám mây, xử lý 1,5 triệu lần suy luận mỗi giây, phục vụ đa dạng lĩnh vực như đề xuất khám phá nội dung, an ninh truyền thông, đề xuất thị trường và tạo mô hình 3D.
Ban lãnh đạo công ty đang thử nghiệm điều chỉnh mô hình kinh doanh nhằm phân bổ chi phí suy luận. David Baszucki, Đồng sáng lập kiêm CEO của Roblox, phát biểu tại hội nghị báo cáo tài chính rằng dự án sắp ra mắt mang tên “Roblox Reality”—một công nghệ có khả năng chạy mô hình video mô phỏng thời gian thực độ phân giải 2K ở tần số làm tươi 60Hz—sẽ không được cung cấp miễn phí. “Công nghệ này sẽ sử dụng tài nguyên điện toán đám mây. Chúng tôi sẽ áp dụng một cơ chế đăng ký hoặc trả phí nhất định, nhờ đó chúng tôi kỳ vọng có thể bù đắp chi phí cho phần suy luận thời gian thực.” Baszucki giải thích.
Chopra bổ sung rằng dự báo chi tiêu vốn (capex) của công ty trong năm 2026 vẫn giữ nguyên, chủ yếu dựa vào việc triển khai GPU tại các trung tâm dữ liệu nội bộ để đáp ứng nhu cầu suy luận trong năm; một số tác vụ huấn luyện vẫn được thực hiện trên nền tảng điện toán đám mây. Trước đó, Roblox từng tiết lộ rằng đến cuối năm 2025, việc di dời một phần tải suy luận AI từ các nền tảng điện toán đám mây bên thứ ba sang trung tâm dữ liệu nội bộ đã giúp công ty đạt được mức cải thiện hiệu suất tới 10 lần trên các tác vụ cụ thể như kiểm tra an ninh và khám phá nội dung.
Tuy nhiên, dự báo toàn năm của Roblox trong quý này chịu nhiều áp lực đồng thời: khoản đầu tư gia tăng vào AI nêu trên, việc giảm kỳ vọng về quy mô đặt hàng dẫn đến mất đòn bẩy chi phí cố định, và việc nâng tỷ lệ chia sẻ doanh thu dành cho nhà sáng tạo nội dung người lớn (18+) lên mức 37,8%. Tất cả những yếu tố này cùng góp phần khiến thị trường phải định giá lại lợi nhuận toàn năm của công ty.
Sổ sách ngành: 725 tỷ USD chi tiêu vốn đối đầu với 2,7 tỷ USD tiết kiệm lương
Các ví dụ vi mô từ Shopify và Roblox nằm trong một bất cân xứng cấu trúc vĩ mô lớn hơn.
Theo dữ liệu được trích dẫn bởi 24/7 Wall St., bốn công ty—Amazon, Meta, Microsoft và Google—dự kiến chi tổng cộng 725 tỷ USD cho AI trong năm 2026, tăng 77% so với năm trước. Trong đó, Meta đưa ra dự báo chi tiêu vốn cả năm ở mức từ 125–145 tỷ USD, tương đương mức chi 370 triệu USD mỗi ngày chỉ riêng cho việc xây dựng trung tâm dữ liệu; Microsoft dự kiến chi 190 tỷ USD cho năm dương lịch 2026, trong khi Amazon cam kết mức 200 tỷ USD.
Tỷ lệ giữa khoản chi này và chi phí nhân sự là vô cùng chênh lệch. Tổng chi phí lương, phúc lợi và cổ phiếu khuyến khích của toàn bộ nhân sự Meta vào khoảng 27 tỷ USD. Ngay cả khi Meta sa thải toàn bộ nhân viên vào ngày mai, khoản tiết kiệm được cũng chỉ tương đương chưa đến một phần năm chi phí cơ sở hạ tầng năm 2026 của công ty.
Dan Ives, nhà phân tích của Wedbush Securities, ước tính trong báo cáo nghiên cứu ngày 25 tháng 4 rằng việc sa thải 8.000 nhân sự sắp tới của Meta sẽ giúp giải phóng khoảng 2,4 tỷ USD chi phí hoạt động mỗi năm—chỉ đủ bù đắp khoảng 12% áp lực từ khoản khấu hao gia tăng trong năm 2026. Nói cách khác, để bù đắp đầy đủ áp lực tài chính từ mỗi đô la chi cho năng lực tính toán AI, cần tới gần mười đô la tiết kiệm từ chi phí nhân sự.
Susan Li, Giám đốc Tài chính (CFO) của Meta, tại hội nghị báo cáo tài chính quý IV năm 2025, xác định việc cắt giảm nhân sự của Meta là “xây dựng một mô hình vận hành gọn nhẹ hơn nhằm hỗ trợ bù đắp cho các khoản đầu tư quy mô lớn mà chúng tôi đang tiến hành”. Phát biểu này rõ ràng định vị việc sa thải nhân sự như một công cụ tài chính phục vụ chi tiêu vốn cho AI, chứ không phải là hệ quả phụ của việc nâng cao năng suất.

Chiến thắng của nhà cung cấp mô hình, bài toán nan giải của lớp ứng dụng
Người hưởng lợi lớn nhất từ cuộc “đối đầu sổ sách” này là các nhà cung cấp mô hình và năng lực tính toán nền tảng. Biên lợi nhuận gộp của Microsoft Cloud duy trì ở mức 69% dù chịu áp lực mở rộng cơ sở hạ tầng AI; biên lợi nhuận của OpenAI được ước tính bên ngoài ở mức khoảng 50%, Anthropic khoảng 60%; Nvidia tiếp tục đạt biên lợi nhuận khoảng 70% trong năm tài chính 2026.
Trong khi đó, các công ty ở lớp ứng dụng—đặc biệt là các nhà cung cấp phần mềm theo mô hình SaaS vừa tiêu thụ AI, vừa đóng gói năng lực AI thành sản phẩm đăng ký để bán—đang đối mặt với một cấu trúc tài chính mới: Doanh thu ngày càng phụ thuộc mạnh vào mức độ sử dụng AI, nhưng đường cong chi phí lại do nhà cung cấp mô hình ở thượng nguồn định giá, và mỗi lần nâng cấp mô hình đều có thể kéo theo chi phí token mới.
Tanay Jaipuria, trong phân tích về biên lợi nhuận gộp từ AI, chỉ ra rằng mặc dù chi phí suy luận cho một mô hình đơn lẻ đang giảm với tốc độ 80–90% mỗi năm, giá của các mô hình tiên tiến lại duy trì ổn định hoặc thậm chí tăng lên; nếu các công ty lớp ứng dụng kiên quyết gọi mô hình mạnh nhất cho mỗi yêu cầu, thì chi phí hàng bán (COGS) thực tế của họ sẽ hoàn toàn phụ thuộc vào bảng giá do nhà cung cấp mô hình thiết lập.
Giải pháp của Shopify là định vị sản phẩm AI như một “cửa ngõ chiến lược” gắn kết sâu sắc lưu lượng truy cập và thương gia, biến sự gia tăng chi phí suy luận thành chỉ số đại diện cho “độ sâu tích hợp nền tảng”; còn giải pháp của Roblox là tách trải nghiệm AI cao cấp ra khỏi phiên bản miễn phí, bắt buộc người dùng phải trả tiền trực tiếp cho chi phí suy luận. Hai hướng đi khác nhau này đều xuất phát từ một đồng thuận chung: Về mặt toán học, việc chỉ dựa vào sa thải nhân sự để bù đắp hóa đơn năng lực tính toán AI là hoàn toàn không khả thi.
Chào mừng tham gia cộng đồng chính thức TechFlow
Nhóm Telegram:https://t.me/TechFlowDaily
Tài khoản Twitter chính thức:https://x.com/TechFlowPost
Tài khoản Twitter tiếng Anh:https://x.com/BlockFlow_News














