
Phân tích báo cáo nghiên cứu của JPMorgan Chase: Lượng sử dụng LLM tăng vọt 70%, giá thuê GPU tăng liên tiếp 7 tháng, nhu cầu phần cứng AI chưa hạ nhiệt
Tuyển chọn TechFlowTuyển chọn TechFlow

Phân tích báo cáo nghiên cứu của JPMorgan Chase: Lượng sử dụng LLM tăng vọt 70%, giá thuê GPU tăng liên tiếp 7 tháng, nhu cầu phần cứng AI chưa hạ nhiệt
Nhu cầu sức mạnh tính toán AI vẫn còn lâu mới đạt đỉnh.
Tác giả: Rita
TechFlow Dẫn Đọc
Báo cáo quan sát trung tâm dữ liệu được JP Morgan phát hành vào ngày 1 tháng 7 đã theo dõi ba chỉ số cốt lõi về nhu cầu cơ sở hạ tầng AI: khối lượng và giá token LLM, giá thuê GPU, giá giao ngay chip lưu trữ. Kết luận rất rõ ràng: Môi trường nhu cầu AI vẫn tích cực.
Khối lượng token LLM trên OpenRouter tăng vọt 70% theo tháng vào tháng 6, tăng 20 lần theo năm. Giá thuê GPU tăng liên tiếp bảy tháng, giá B200 đã gấp đôi H100. Giá giao ngay DRAM tăng hơn 8 lần theo năm. Ba bộ dữ liệu xác minh chéo nhau, nhu cầu sức mạnh tính toán AI còn lâu mới đạt đỉnh.
Khối lượng LLM tăng 70%, giá chỉ giảm 5%, hãy cùng tính toán cho các nhà cung cấp mô hình
Dữ liệu trên nền tảng OpenRouter vào tháng 6 đang tăng tốc toàn diện. Khối lượng token tăng 70% theo tháng, tăng 20 lần theo năm. Giá mỗi lần gọi tăng nhẹ theo tháng, chỉ giảm 5% theo năm, trong khi định giá của các mô hình nội địa Mỹ thậm chí đang tăng theo năm. Tổng chi tiêu tăng 70% theo tháng, tăng 16 lần theo năm.
Khi đặt ba con số này cạnh nhau, kết luận rất rõ ràng: Tốc độ tăng khối lượng áp đảo mức giảm giá. Ngay cả khi giả sử giá token tiếp tục giảm với tốc độ 5% đến 10% mỗi năm, miễn là khối lượng duy trì nhịp độ tăng gấp đôi, doanh thu suy luận của các nhà cung cấp mô hình vẫn sẽ bùng nổ. Nhận định của JP Morgan là hướng đi của kinh tế học token có lợi cho các nhà cung cấp mô hình.
Dữ liệu thị phần còn thú vị hơn. Các mô hình Mỹ chỉ chiếm 35% về khối lượng, nhưng lại chiếm hơn 85% tổng chi tiêu. Claude Opus 4.7 của Anthropic là mô hình duy nhất lọt vào top 5 về cả khối lượng và chi tiêu, quyền định giá nằm trong tay người Mỹ.
Giá thuê GPU tăng liên tiếp bảy tháng, giá B200 gấp đôi H100
Giá thuê GPU của các nhà cung cấp đám mây không thuộc nhóm siêu lớn đều tăng theo tháng trong tháng 6. A100 tăng 6.3%, tăng liên tiếp năm tháng; H100 tăng 3.7%, tăng liên tiếp bảy tháng; B200 tăng 2.7%, tăng liên tục kể từ khi ra mắt chín tháng trước.
Chênh lệch giá giữa ba dòng GPU đang thu hẹp. Mức phí bảo hiểm của H100 so với A100 giảm từ 1.77 lần vào tháng 4 xuống 1.67 lần vào tháng 6, mức phí bảo hiểm của B200 so với H100 giảm từ 2.58 lần xuống 1.96 lần. Sự khan hiếm của sức mạnh tính toán cao cấp đang giảm bớt, nhưng giá vẫn tăng, cho thấy tăng trưởng nhu cầu đang bắt kịp với việc giải phóng nguồn cung.
Việc A100 tăng mạnh nhất đáng được đề cập riêng. Giá chip thế hệ trước không giảm mà lại tăng, có nghĩa là các khách hàng bị hạn chế ngân sách đang săn lùng sức mạnh tính toán hiệu quả về chi phí. Đây không phải là tín hiệu của cung vượt quá cầu.
DRAM tăng NAND giảm, hai ông lớn lưu trữ đi theo hướng ngược nhau
Giá giao ngay DRAM tăng 10% theo tháng lên 43.14 USD vào tháng 6, tăng 740% theo năm, tăng liên tiếp ba tháng. Giá giao ngay NAND giảm nhẹ 0.3% theo tháng xuống 27.03 USD, giảm nhẹ liên tiếp ba tháng, nhưng vẫn tăng 518% theo năm.
740% và 518%, hai con số này cho thấy tổng thể lưu trữ vẫn ở mức cao lịch sử. Sự phân hóa hướng đi cũng rất rõ ràng: DRAM vẫn đang tăng, NAND bắt đầu nới lỏng.
Quy luật lịch sử là khi chu kỳ lưu trữ đạt đỉnh, NAND nới lỏng trước, DRAM nới lỏng sau. NAND liên tiếp ba tháng suy yếu là tín hiệu cho thấy chu kỳ đang bước vào giai đoạn sau. JP Morgan không trực tiếp đưa ra nhận định này trong báo cáo, nhưng bản thân dữ liệu sẽ lên tiếng.
Câu chuyện về cơ sở hạ tầng AI vẫn còn, nhưng logic đang thay đổi
Khối lượng LLM tăng 70%, giá thuê GPU tăng liên tiếp bảy tháng, DRAM tăng 740% theo năm, ba bộ dữ liệu đều chỉ về cùng một kết luận: Nhu cầu cơ sở hạ tầng AI còn lâu mới đạt đỉnh.
Nhưng cấu trúc đang thay đổi. Các mô hình Mỹ chiếm 85% tổng chi tiêu, quyền định giá nằm ở Mỹ. Mức phí bảo hiểm của B200 so với H100 giảm từ 2.58 lần xuống 1.96 lần, sự khan hiếm sức mạnh tính toán cao cấp đang giảm bớt. NAND bắt đầu nới lỏng, chu kỳ lưu trữ đang thay đổi.
Lợi ích là bền vững, logic là năng động.
Góc Nhìn TechFlow
Điểm mù lớn nhất của báo cáo này nằm ở sự sai lệch của nguồn dữ liệu. OpenRouter chủ yếu hướng tới các nhà phát triển, công ty khởi nghiệp và các kịch bản lập trình tác nhân AI, không bao gồm lưu lượng API trực tiếp từ OpenAI và Anthropic, cũng như không bao gồm khối lượng triển khai nội bộ của các nhà cung cấp đám mây siêu lớn. Điều này có nghĩa là báo cáo nắm bắt "nhu cầu AI đuôi dài", không phải "nhu cầu AI toàn bộ". Nếu đuôi dài đang tăng vọt, phần đầu sẽ còn nóng hơn, nhưng cũng có thể phần đầu đã hạ nhiệt trong khi đuôi dài đang bù đắp mức tăng — ý nghĩa đầu tư của hai điều này hoàn toàn khác nhau.
Giá thuê GPU theo dõi dung lượng bên thứ ba của các nhà cung cấp đám mây không thuộc nhóm siêu lớn, không bao gồm giá thuê chính thức của AWS, Azure, GCP. Bên thứ ba đều đang tăng, cho thấy sự thiếu hụt sức mạnh tính toán đã tràn từ phần đầu xuống đuôi dài, điều này về hướng đi là tích cực cho phần cứng AI, nhưng không thể đánh giá tỷ lệ sử dụng của chính các nhà cung cấp siêu lớn. Nếu sức mạnh tính toán tự dùng của họ đã dư thừa, chỉ là chưa tung ra thị trường cho thuê, thì tình trạng thực tế của cung cầu sẽ yếu hơn so với những gì báo cáo trình bày.
Tín hiệu phân hóa giá lưu trữ đáng được tách riêng để phân tích. NAND liên tiếp ba tháng suy yếu, DRAM vẫn đang tăng, điều này phù hợp với đặc điểm điển hình của giai đoạn sau chu kỳ lưu trữ. Nếu giá NAND tiếp tục giảm, kỳ vọng doanh thu của các nhà sản xuất chip lưu trữ sẽ bị điều chỉnh giảm, từ đó ảnh hưởng đến kỳ vọng chi tiêu vốn cho toàn bộ thiết bị bán dẫn.

Tuyên bố miễn trừ trách nhiệm
Bài viết này là sự tổng hợp và diễn giải của Nghiên cứu TechFlow đối với báo cáo nghiên cứu của công ty chứng khoán bên thứ ba. Các xếp hạng, giá mục tiêu, dự báo lợi nhuận và các phán đoán liên quan được trích dẫn trong bài đều là quan điểm của các nhà phân tích của công ty chứng khoán đó, chỉ đại diện cho lập trường của tổ chức thuộc về họ, không đại diện cho quan điểm của Nghiên cứu TechFlow, cũng không cấu thành bất kỳ lời khuyên đầu tư nào.
Thị trường có rủi ro, quyết định cần độc lập. Bài viết này không nên được sử dụng làm cơ sở để mua bán bất kỳ chứng khoán nào.
Chào mừng tham gia cộng đồng chính thức TechFlow
Nhóm Telegram:https://t.me/TechFlowDaily
Tài khoản Twitter chính thức:https://x.com/TechFlowPost
Tài khoản Twitter tiếng Anh:https://x.com/BlockFlow_News











