
Giá thuê GPU giảm 30% trong ba tuần, chuỗi giá trị AI đang “di cư lớn” từ NVIDIA sang chip bộ nhớ
Tuyển chọn TechFlowTuyển chọn TechFlow

Giá thuê GPU giảm 30% trong ba tuần, chuỗi giá trị AI đang “di cư lớn” từ NVIDIA sang chip bộ nhớ
Đối với những người nắm giữ cổ phiếu NVIDIA hoặc đang xem xét đầu tư vào cơ sở hạ tầng AI, một câu hỏi then chốt đã nổi lên: Tiền dành cho AI không hề giảm đi, mà chỉ chuyển sang nơi khác.
Tác giả: Claude, TechFlow
Dẫn dắt bởi TechFlow: Giá thuê chip B200 của NVIDIA đã giảm từ mức cao nhất 6,11 USD/giờ vào cuối tháng Năm xuống còn 4,22 USD/giờ, tương đương mức sụt khoảng 30% trong vòng ba tuần. Đồng thời, ngành bán dẫn đang chứng kiến sự phân hóa hiếm thấy: Quỹ ETF bán dẫn SMH tăng 15% trong tháng qua; Micron và SanDisk đều tăng mạnh gần 60%; trong khi NVIDIA lại giảm 3% cùng kỳ. Đối với những nhà đầu tư nắm giữ cổ phiếu NVIDIA hoặc đang cân nhắc đầu tư vào cơ sở hạ tầng AI, một câu hỏi then chốt nổi lên: Tiền cho AI không hề ít đi, mà chỉ chuyển sang nơi khác.
NVIDIA vẫn tăng khoảng 12% trong năm nay, nhưng hiện tại sự chú ý của thị trường dường như đã rời khỏi công ty này.
Trong tháng qua, Quỹ ETF bán dẫn VanEck (SMH) tăng mạnh 15%, Micron Technology và SanDisk mỗi hãng đều tăng gần 60%. Trong khi đó, NVIDIA không những không theo kịp đà tăng này mà còn ngược chiều giảm khoảng 3%. Một minh chứng rõ ràng hơn nữa là chỉ số cốt lõi định giá NVIDIA—giá thuê chip B200 trên nền tảng điện toán đám mây—cũng đồng loạt suy yếu.
Theo dữ liệu từ nền tảng định giá sức mạnh tính toán GPU Ornn, giá thuê chip B200 mỗi giờ đạt đỉnh ba tháng mới đây là 6,11 USD vào ngày 30/5, sau đó liên tục giảm và đến cuối tuần trước đã xuống còn 4,22 USD, tương đương mức giảm khoảng 30%. Ông Rich Privorotsky, Trưởng bộ phận giao dịch One-Delta của Goldman Sachs, tuần trước đã thẳng thắn nhận định: Thần thoại về “sự khan hiếm sức mạnh tính toán AI” có thể đang dần sụp đổ.
Giá thuê B200 giảm 30% trong ba tuần, luận điểm “khan hiếm sức mạnh tính toán” chịu áp lực
Chip B200 của NVIDIA hiện là linh kiện xử lý chính trong các trung tâm dữ liệu quy mô siêu lớn, và giá thuê chip này được xem là “đồng hồ đo” cung–cầu cơ sở hạ tầng AI. Dữ liệu từ nhiều nền tảng theo dõi độc lập đều cho thấy giá B200 đang suy yếu.
Số liệu từ Ornn cho thấy giá thuê B200 mỗi giờ đã giảm liên tục từ mức cao 6,11 USD vào ngày 30/5 xuống còn 4,22 USD vào cuối tuần trước. Chỉ số giá hàng tháng do AIMultiple tổng hợp từ 63 nhà cung cấp dịch vụ điện toán đám mây cho biết mức giá trung vị của B200 là 6,11 USD/giờ, tuy nhiên mức giá thấp nhất từ các nhà cung cấp “đám mây mới” (neocloud) đã giảm xuống chỉ còn 3,44 USD. Dữ liệu từ GetDeploying theo dõi 26 nhà cung cấp dịch vụ đám mây sử dụng B200 thậm chí còn cực đoan hơn: giá trung bình là 4,99 USD/giờ, mức giá thấp nhất chỉ 2,25 USD/giờ (theo hợp đồng đặt trước dài hạn ba năm).

Có ba yếu tố thúc đẩy xu hướng giảm giá này: (1) Tỷ lệ sản xuất thành công (yield) của quy trình 4NP do TSMC đảm nhiệm cải thiện, giúp chi phí xuất xưởng chip B200 giảm; (2) Nguồn cung HBM3e từ SK Hynix và Micron rõ ràng trở nên dồi dào hơn trong quý II/2026; (3) Nhiều nhà cung cấp “đám mây mới” đã tiếp cận được hàng tồn kho B200, các nền tảng như RunPod, Lambda, Nebius và Spheron đều đã niêm yết sản phẩm sẵn có, khiến cạnh tranh gia tăng và kéo chung toàn bộ mặt bằng giá xuống.
Áp lực sẽ còn gia tăng mạnh hơn trong nửa cuối năm. Khi thế hệ chip Blackwell Ultra B300 kế tiếp của NVIDIA bắt đầu xuất hiện trên thị trường sẵn có, một phần năng lực sản xuất B200 sẽ chuyển từ mô hình thanh toán theo nhu cầu sang mô hình đấu giá (spot). Hiện giá đấu giá (spot) của B300 đã từng xuống thấp tới 2,45 USD/giờ—thấp hơn cả mức giá niêm yết thấp nhất của B200. Các tổ chức như Spheron và Thunder Compute dự báo giá thanh toán theo nhu cầu của B200 có thể ổn định ở mức 2,50–3,00 USD/giờ vào quý IV/2026.
Với các nhà đầu tư nắm giữ cổ phiếu NVIDIA, việc giá thuê suy yếu đồng nghĩa với việc biên lợi nhuận của khách hàng hạ nguồn (các nhà cung cấp dịch vụ đám mây, các nền tảng “đám mây mới”) bị thu hẹp, trong khi chính những khách hàng này quyết định trực tiếp nhịp độ đơn đặt hàng dành cho NVIDIA.
Sự phân hóa mạnh mẽ trong ngành bán dẫn: Bộ nhớ tăng vọt, NVIDIA bị bỏ lại phía sau
Mức độ phân hóa trong đợt này thực sự gây sốc.
NVIDIA tăng khoảng 12% tính từ đầu năm 2026, nhưng giảm khoảng 3% trong tháng qua. Cùng kỳ, Quỹ ETF bán dẫn SMH tăng 84% kể từ đầu năm và tăng 15% trong tháng qua. Micron tăng gần 60% trong tháng qua, giá cổ phiếu đạt mức cao kỷ lục khoảng 1.089 USD, tăng tích lũy hơn 700% kể từ đầu năm và vốn hóa vượt mốc 1,2 nghìn tỷ USD. SanDisk cũng tăng gần 60% trong tháng qua, và tăng hơn 4.400% trong 52 tuần vừa qua.
Có lẽ thị trường không phải mất niềm tin vào AI, mà chỉ đang nghĩ rằng điểm nghẽn trong chuỗi giá trị AI đang chuyển dịch.
Lập luận trước đây là: “GPU khan hiếm → NVIDIA nắm quyền định giá → khâu thượng nguồn hưởng lợi tối đa”. Lập luận hiện tại đã thay đổi: nguồn cung GPU đang trở nên dồi dào hơn, trong khi nhu cầu của các mô hình AI đối với bộ nhớ băng thông cao (HBM) và dung lượng lưu trữ đang tăng vọt—bộ nhớ giờ đây trở thành điểm nghẽn mới.
Báo cáo tài chính quý gần nhất của Micron (quý II/2026) ghi nhận doanh thu 23,8 tỷ USD, tăng gần gấp ba lần so với cùng kỳ năm ngoái (8 tỷ USD); sau khi tách khỏi Western Digital, SanDisk đạt doanh thu quý III/2026 là 5,95 tỷ USD, tăng 97% so với cùng kỳ.
Dữ liệu công bố ngày 16/6 của TrendForce cho thấy giá hợp đồng bộ nhớ trong nửa đầu năm 2026 tăng hơn 100%, tình trạng thiếu hụt mang tính cấu trúc dự kiến kéo dài sang nửa cuối năm. CEO Apple Tim Cook tuần trước thừa nhận trong cuộc phỏng vấn rằng Apple không còn khả năng tiếp tục hấp thụ áp lực tăng giá bộ nhớ. Khi ngay cả Apple—nhà mua có sức mạnh thương lượng mạnh nhất—cũng công khai tuyên bố “không chịu nổi nữa”, thì quyền định giá của các nhà sản xuất bộ nhớ rõ ràng đã rất lớn.
Micron sẽ công bố báo cáo tài chính quý III sau giờ giao dịch ngày mai (24/6), và thị trường phổ biến kỳ vọng kết quả sẽ lại lập kỷ lục mới. Báo cáo này sẽ là yếu tố kiểm chứng then chốt cho việc “chu kỳ siêu tăng trưởng của bộ nhớ” có thể tiếp tục hay không.
Trưởng bộ phận giao dịch Goldman Sachs: Chỉ số cốt lõi là giá thuê
Tuần trước, ông Rich Privorotsky, Trưởng bộ phận giao dịch One-Delta của Goldman Sachs, đã đưa ra một khuôn khổ đánh giá rõ ràng:
Nếu nguồn lực tính toán thực sự khan hiếm, giá thuê phải duy trì vững chắc, và các khoản chi tiêu vốn liên tục sẽ có cơ sở hợp lý. Nhưng nếu nguồn cung tăng và giá thuê tiếp tục giảm, thì giả định cốt lõi làm nền tảng định giá toàn bộ chuỗi phần cứng AI—“sự thiếu hụt sức mạnh tính toán”—sẽ bị lung lay.
Ông nhấn mạnh thêm rằng áp lực này đầu tiên sẽ biểu hiện rõ ở khâu phần cứng. Những bên thực sự hưởng lợi là các công ty bán hệ thống hoàn chỉnh và kiếm tiền dựa trên mức độ sử dụng, chứ không phải các nhà cung cấp “cuốc và xẻng” ở thượng nguồn. Rủi ro lớn hơn nằm ở các khâu thượng nguồn trong chuỗi phần cứng và cơ sở hạ tầng, bởi vì định giá của họ vẫn dựa trên giả định “thiếu hụt liên tục”.
Đoạn văn trên hàm ý rất rõ: Mô hình kinh doanh của NVIDIA là bán chip (cuốc và xẻng), chứ không tính phí theo mức độ sử dụng. Nếu giá thuê của khách hàng hạ nguồn đang giảm trong khi giá bán chip của NVIDIA không giảm, điều này sẽ tạo ra áp lực thu hẹp biên lợi nhuận, và cuối cùng phản ánh qua việc chậm lại trong đơn đặt hàng.
Báo cáo “Tokenomics” gần đây của Citadel Securities cũng khẳng định quan điểm tương tự: Rào cản cốt lõi trong việc áp dụng AI đã chuyển từ “khả năng mô hình” sang “chi phí và sự khan hiếm sức mạnh tính toán”, người dùng đang nhanh chóng chuyển sang các mô hình rẻ hơn. Chỉ số giá token đã giảm liên tiếp bảy ngày, lập chuỗi giảm dài nhất kể từ đầu năm nay.
Giáo sư Tài chính Đại học Santa Clara Seoyoung Kim diễn giải còn trực diện hơn: Phần lớn người mua không biết mình sẽ cần bao nhiêu sức mạnh tính toán vào năm sau, nhà cung cấp không biết nên đặt hàng bao nhiêu GPU, và NVIDIA cũng không biết nên sản xuất bao nhiêu. Cả ba bên đều đang đoán—và khi hướng dự đoán đồng loạt chuyển từ “không đủ dùng” sang “có thể dư thừa”, giá cả sẽ chịu áp lực.
Hợp đồng thiên văn trị giá 30 tỷ USD giữa SpaceX–Google: Thị trường hợp đồng dài hạn vẫn sôi động
Giá thị trường sẵn có (spot) đang giảm, nhưng thị trường hợp đồng dài hạn lại kể một câu chuyện khác.
Theo hồ sơ nộp lên Ủy ban Chứng khoán Mỹ (SEC) ngày 5/6 của SpaceX, Google đồng ý trả cho SpaceX 920 triệu USD/tháng từ tháng 10/2026 đến tháng 6/2029 để thuê khoảng 110.000 chip GPU của NVIDIA cùng các bộ xử lý, bộ nhớ và thành phần khác đi kèm. Tổng giá trị hợp đồng khoảng 30 tỷ USD. Trước đó vào tháng Năm, Anthropic cũng đã ký thỏa thuận tương tự với SpaceX, trả 1,25 tỷ USD/tháng để thuê toàn bộ công suất tính toán khả dụng tại trung tâm dữ liệu Colossus 1 của SpaceX tại Memphis, với tổng giá trị gần 45 tỷ USD.
Hai hợp đồng này diễn ra trong bối cảnh SpaceX, sau khi hoàn tất sáp nhập với xAI vào tháng Hai/2026, đã chuyển đổi cụm siêu máy tính Colossus do xAI xây dựng trước đây thành tài sản thương mại cho thuê ngoài, nhằm đảm bảo dòng thu lớn trước khi IPO (định giá mục tiêu 1,75 nghìn tỷ USD).
Với NVIDIA, đây là một tín hiệu mâu thuẫn. Về một mặt, hợp đồng dài hạn cho 110.000 chip GPU chứng tỏ các khách hàng lớn vẫn đang tích cực khóa khối lượng tính toán quy mô lớn; sau khi công bố giao dịch, RBC Capital Markets đánh giá NVIDIA “ở vị thế thuận lợi nhất trong số các đối thủ”, cho rằng các thỏa thuận thuê GPU này ít nhất trong ngắn hạn có thể loại bỏ lo ngại của thị trường về nguy cơ ASIC chiếm thị phần của NVIDIA.
Về mặt khác, việc Google phải thuê sức mạnh tính toán từ SpaceX chính là do năng lực tự xây dựng của họ không theo kịp nhu cầu. Chi tiêu vốn của Google trong năm 2026 dao động từ 180–190 tỷ USD; khoản thanh toán 920 triệu USD/tháng cho SpaceX chưa chiếm tới 6% ngân sách hàng năm—về bản chất đây là một giải pháp “công suất tạm thời”. Khi các trung tâm dữ liệu nội bộ của những khách hàng siêu lớn này lần lượt đi vào hoạt động trong giai đoạn 2027–2028, nhu cầu thuê ngoài có thể duy trì ở mức hiện tại hay không vẫn là một dấu hỏi.
Hợp đồng còn kèm theo điều khoản chấm dứt sớm với thời hạn thông báo 90 ngày. Đây không phải là điều khoản thường thấy trong các hợp đồng ký kết trong bối cảnh “sức mạnh tính toán cực kỳ khan hiếm”, mà giống như một lối thoát được người mua chủ động để lại.
Rủi ro của NVIDIA: Không nằm ở nhu cầu, mà ở quyền định giá
Kết nối tất cả các manh mối trên lại, vấn đề NVIDIA đang đối mặt là sự phân bổ lợi nhuận trong chuỗi giá trị AI đang thay đổi.
Về phía cung GPU: tỷ lệ sản xuất thành công của TSMC tăng, nhiều nhà cung cấp hơn tiếp cận được hàng tồn kho, và B300 sắp được tung ra thị trường đại trà—ba yếu tố này đang làm dịu tình trạng thiếu hụt cực đoan trong giai đoạn 2024–2025. Về phía cầu: các khách hàng siêu lớn vẫn tiếp tục mua sắm quy mô lớn, nhưng cách thức mua đang chuyển từ “chặt chém bất chấp giá” sang “so sánh giá, ký hợp đồng dài hạn để khóa khối lượng, đồng thời giữ quyền rút lui”. Về mặt lợi nhuận: giá thuê của các nhà cung cấp đám mây hạ nguồn đã giảm; nếu NVIDIA không giảm giá bán chip tương ứng, áp lực thu hẹp biên lợi nhuận ở khâu trung gian cuối cùng sẽ phản tác động ngược lại khối lượng đơn đặt hàng.
Việc chip bộ nhớ trở thành “ngôi sao mới” chính là mặt khác của quá trình di chuyển chuỗi giá trị.
Mô hình AI càng lớn, tác vụ suy luận càng nhiều, thì nhu cầu về bộ nhớ băng thông cao càng trở nên bắt buộc. GPU có thể nâng cao hiệu suất thông qua cải tiến kiến trúc (ví dụ độ chính xác FP4 của B200 giúp giảm một nửa số byte trên mỗi tham số), nhưng băng thông bộ nhớ là giới hạn vật lý—không có con đường tắt nào. Công suất HBM của Micron đã được bán hết cho toàn bộ năm 2026, tình trạng “có tiền cũng không mua được” này tương phản rõ rệt với việc giá thuê B200 đang suy yếu.
Báo cáo tài chính của Micron ngày mai sẽ cung cấp dữ liệu then chốt tiếp theo. Nếu doanh thu và định hướng triển vọng tiếp tục vượt kỳ vọng, luận điểm “chuỗi giá trị AI đang dịch chuyển từ GPU sang bộ nhớ” sẽ được củng cố mạnh hơn nữa.Đối với nhà đầu tư, đây không phải là tín hiệu bi quan về AI, mà là lời nhắc cần suy ngẫm lại: Trong chuỗi giá trị AI, ai đang tăng cường quyền định giá, và ai đang đánh mất nó.
Chào mừng tham gia cộng đồng chính thức TechFlow
Nhóm Telegram:https://t.me/TechFlowDaily
Tài khoản Twitter chính thức:https://x.com/TechFlowPost
Tài khoản Twitter tiếng Anh:https://x.com/BlockFlow_News













