
Phân tích triết lý đầu tư của Gavin Baker – nhà đầu tư sớm vào NVIDIA: Mua vào các điểm nghẽn trong cơ sở hạ tầng AI, bán khống rủi ro thị trường tổng thể
Tuyển chọn TechFlowTuyển chọn TechFlow

Phân tích triết lý đầu tư của Gavin Baker – nhà đầu tư sớm vào NVIDIA: Mua vào các điểm nghẽn trong cơ sở hạ tầng AI, bán khống rủi ro thị trường tổng thể
“AI không nằm trong bong bóng; trái lại, nó đang ở giữa một chu kỳ siêu tăng trưởng.”
Biên dịch & Tổng hợp: TechFlow

Người dẫn chương trình: Ejaaz Ahamadeen (EJ), Josh Kale (Josh)
Tựa đề gốc: What The Best AI Investors Are Buying Right Now
Nguồn podcast: Limitless Podcast
Ngày phát hành: 28 tháng 5 năm 2026
Lời giới thiệu biên tập
Chương trình podcast kỳ này chủ yếu thảo luận về triết lý đầu tư của Gavin Baker – người sáng lập Atreides Management, một nhà đầu tư kiên định đặt cược vào Nvidia và Cerebras trong dài hạn. Nhận định cốt lõi của ông là: AI không phải là bong bóng, mà là một siêu chu kỳ cơ sở hạ tầng do điện năng, đĩa bán dẫn (wafer) và công suất tính toán cùng thúc đẩy; lợi nhuận vượt trội thực sự không nằm ở các mô hình ngôn ngữ lớn (LLM) hay các chatbot, mà ở những khâu “bán xẻng” như kết nối GPU, bộ nhớ, chip suy luận (inference chip), quy trình sản xuất tiên tiến và nguồn cung điện.
Gavin Baker vừa sử dụng quyền chọn bán QQQ để phòng vệ trước khả năng điều chỉnh chung của thị trường, vừa tập trung đầu tư mạnh vào các tài sản vật lý gặp nghẽn trong lĩnh vực AI như Astera Labs, Unity, Micron, Nvidia, Cerebras và Positron. Ông đưa cuộc tranh luận về “bong bóng AI” từ bình diện cảm xúc trở lại giới hạn cung – cầu, cho rằng miễn là TSMC, ASML, bộ nhớ băng thông rộng (HBM) và hệ thống lưới điện chưa thể nhanh chóng dư thừa, thì chi tiêu vốn (capex) cho AI chưa chắc đã là bản sao của bong bóng internet năm 2000.
Những trích dẫn nổi bật
AI là bong bóng hay siêu chu kỳ?
- “AI không đang trong bong bóng; ngược lại, nó đang ở giữa một siêu chu kỳ.”
- “Lợi nhuận lớn nhất không nằm ở SaaS, cũng không nằm ở các chatbot như OpenAI hay Anthropic, mà ở điện năng, công suất tính toán và sản xuất silicon.”
- “Đây không phải là bong bóng internet, bởi vì người mua chủ yếu là những công ty thông minh nhất và có dòng tiền mạnh nhất toàn cầu — họ không dùng đòn bẩy nợ để mua công suất tính toán.”
- “Nếu toàn bộ thị trường không thể bị cung ứng quá mức, thì rất khó để nó sụp đổ đột ngột như các bong bóng truyền thống.”
Những điểm nghẽn thực sự: Điện năng, đĩa bán dẫn và token
- “Lý thuyết của Gavin rất đơn giản: chỉ cần nhìn vào các điểm nghẽn ở lớp cơ sở hạ tầng AI — ai nâng cao được hiệu suất trên mỗi watt và giảm được chi phí mỗi token, người đó sẽ có giá trị.”
- “Các phòng thí nghiệm AI hiện ngày càng quan tâm đến một vấn đề duy nhất: mỗi watt điện tạo ra được bao nhiêu token.”
- “Điện năng và đĩa bán dẫn giống như hai bức tường gạch — đồng thời cũng là hai ràng buộc then chốt làm chậm tốc độ tăng trưởng quá nhanh của AI.”
Từ huấn luyện sơ bộ sang suy luận và huấn luyện sau
- “Một mô hình sau khi hoàn tất huấn luyện sơ bộ (pre-training) không có nghĩa là nó mãi mãi là một thiên tài; nó vẫn cần hấp thụ thông tin mới trong giai đoạn huấn luyện sau (post-training).”
- “Suy luận về bản chất đòi hỏi lượng tính toán khổng lồ — đây cũng chính là lý do vì sao chip suy luận và cơ sở hạ tầng suy luận sẽ trở thành trọng tâm giai đoạn tiếp theo.”
- “Chỉ riêng chi phí hoặc cơ hội doanh thu từ suy luận có thể đạt 5–10 lần so với chi phí đầu tư vào công suất tính toán dành cho huấn luyện sơ bộ.”
Các mô hình nhỏ chuyên biệt, mô hình chạy cục bộ (on-device) và cơ sở hạ tầng chủ quyền
- “Trong tương lai, bạn chưa chắc đã phải tương tác hàng ngày với Claude; điều bạn thực sự cần có thể là một đại lý AI cá nhân hóa, được huấn luyện trên dữ liệu riêng của bạn.”
- “Tốc độ triển khai cơ sở hạ tầng chính là hào sâu bảo vệ — tốc độ đổi mới trong thế giới số nhanh hơn nhiều so với tốc độ xây dựng cơ sở hạ tầng vật lý.”
“Ai có thể nén thời gian triển khai vật lý — vốn thường mất vài tháng hoặc vài năm — xuống còn vài tuần, người đó sẽ có thể bán giá rất cao cho cơ sở hạ tầng AI.”
Cách thức đầu tư của Gavin: Mua vào các điểm nghẽn, bán khống rủi ro thị trường chung
- “Ông ấy tin chắc rằng các ‘người chiến thắng’ trong lĩnh vực AI sẽ xuất hiện, nhưng điều đó không đồng nghĩa với việc ông lạc quan đối với toàn bộ thị trường; quyền chọn bán QQQ là cách ông phòng vệ trước rủi ro đi xuống chung.”
- “TSMC thực tế đang kiểm soát tốc độ bùng nổ của bong bóng; miễn là công suất sản xuất chip không thể mở rộng tức thì, chi tiêu vốn sẽ khó rơi vào trạng thái mất kiểm soát.”
- “Gavin giống như một phiên bản già dặn hơn, ổn định hơn và có hồ sơ vượt chu kỳ tốt hơn của Leopold: thành công của người trước được tính bằng thập kỷ, còn người sau hiện tại chủ yếu được đo theo quý.”

Các tài sản đáng đầu tư trong siêu chu kỳ AI
EJ: Gavin Baker là một nhà đầu tư AI cực kỳ năng suất nhưng gần như vô danh đối với đại chúng. Trong 20 năm qua, ông đã bắt đầu đầu tư vào một số công ty AI sau này trở nên nổi tiếng toàn cầu — ngay từ khi chúng còn chưa được biết đến. Ông từng sớm nhận diện và đầu tư vào Nvidia (nhà cung cấp GPU và giải pháp tính toán tăng tốc cho AI), cũng như Cerebras (công ty thiết kế chip AI), đồng thời luôn khẳng định rõ ràng: AI không phải là bong bóng, trái lại, đó là một siêu chu kỳ.
Theo ông, chỉ cần quan sát ba yếu tố nền tảng — watts (điện năng), wafers (đĩa bán dẫn) và token (đơn vị sinh ra và tính toán của mô hình) — ta sẽ xác định được các điểm nghẽn và ràng buộc then chốt trong cơ sở hạ tầng AI. Kết luận của ông rất đơn giản: lợi nhuận lớn nhất trong lĩnh vực AI đến từ điện năng, năng lượng và sản xuất silicon — ít liên quan đến phần mềm dịch vụ (SaaS), cũng chẳng gắn bó với các chatbot như Anthropic hay OpenAI. Toàn bộ ngành cuối cùng đều sẽ lan tỏa xuống lớp bán dẫn — tức là các tài sản “bán xẻng” (picks and shovels) làm nền tảng cho toàn bộ ngành AI.
Khi đa số cho rằng ngành AI đã trở thành bong bóng, ông lại cho rằng đây chính là cơ hội mua vào mang tính thế hệ — đặc biệt là cơ sở hạ tầng AI. Ông thể hiện quan điểm này thông qua danh mục đầu tư trị giá khoảng 4,1 tỷ USD.
Nếu bạn nghe ông nói về những ràng buộc này — đặc biệt là cơ sở hạ tầng AI — bạn sẽ thấy lý thuyết này rất quen thuộc. Trước đây, chúng tôi đã nhiều lần đề cập trong chương trình về một nhà đầu tư khác tên là Leopold Aschenbrenner, người cũng phân bổ tài sản theo hướng tương tự. Điểm khác biệt nằm ở chỗ Leopold mới hoạt động khoảng 3 năm, trong khi Gavin đã làm điều này hơn 20 năm.
Quy mô tài sản quản lý (AUM) của Leopold khoảng gấp ba lần Gavin, nhưng nhà sản xuất chương trình Luke từng đưa ra một nhận xét rất hay: “Bạn có thể vượt mặt Warren Buffett trong một năm, nhưng liệu bạn có thể vượt mặt ông ấy liên tục trong vài chục năm?” Hồ sơ lịch sử của Gavin Baker cho thấy ông có thể nắm giữ góc nhìn khác biệt về lý thuyết đầu tư này.
Với những ai chưa biết Gavin Baker, hãy biết rằng ông là người sáng lập Atreides Management (một quỹ đầu tư), và trong suốt 20 năm qua, ông luôn đầu tư vào Nvidia. Việc bạn vẫn còn làm việc sau 20 năm nắm giữ cổ phiếu Nvidia vốn đã phi thường — bởi lẽ điều đó hẳn đã mang lại lợi nhuận cực kỳ ấn tượng.
Một số thành công gần đây của ông bao gồm Cerebras và Astera Labs (công ty thiết kế chip kết nối trung tâm dữ liệu AI). Cerebras là một công ty chip AI; trong chương trình, người ta nhắc tới việc định giá IPO của công ty này cao đến kinh ngạc. Ngoài ra còn có một số công ty bạn có thể chưa từng nghe tên — chúng ta sẽ cùng khám phá trong tập này, dựa trên danh mục và lập luận của ông, để hiểu rõ nơi ông cho rằng cơ hội đầu tư AI thực sự nằm ở đâu.
Vấn đề lúc này trở thành: Ông đã đầu tư vào cái gì, và vì sao? Nếu xem báo cáo 13F gần đây nhất (tài liệu tiết lộ danh mục nắm giữ quý của các nhà đầu tư tổ chức Mỹ) của Atreides Management, ta thấy quỹ này có AUM khoảng 4 tỷ USD. Khi phân tích các vị thế lớn nhất, ta nhận ra tất cả đều nhắm thẳng vào những điểm nghẽn trong phát triển AI mà Gavin nhiều lần đề cập.
Ông nắm giữ vị thế lớn trong một số công ty không mấy hấp dẫn, thậm chí nhiều người còn chưa từng nghe tên. Ví dụ, Astera Labs chiếm khoảng 9–10% danh mục. Bạn có thể hiểu Astera Labs như một lớp kết nối giữa các GPU. Hãy tưởng tượng trung tâm dữ liệu như một hệ thống, trong đó GPU là động cơ chịu trách nhiệm cho huấn luyện sơ bộ (pre-training), huấn luyện sau (post-training) và suy luận (inference). Nhưng để GPU vận hành, chúng phải truyền tải lượng dữ liệu khổng lồ lẫn nhau và truy cập các chip bộ nhớ (memory chips) lưu trữ dữ liệu.
Để thực hiện điều này, ta cần một “hệ thống ống dẫn”. Tôi nói ở mức khái quát vì tôi không giả vờ hiểu hết mọi chi tiết kỹ thuật nền tảng. Astera Labs chính là công ty giải quyết vấn đề này. Khi cụm AI mở rộng lên hàng chục vạn chip, điểm nghẽn không còn chỉ nằm ở bản thân GPU nữa, mà nằm ở cửa sổ truyền dữ liệu — tức là khả năng gửi đúng dữ liệu, truy cập đúng dữ liệu vào đúng thời điểm. Astera Labs chính là công ty xây dựng hệ thống ống dẫn như vậy.
Trước khi nghiên cứu cho tập này, tôi cũng chưa từng nghe tên Astera Labs. Nhưng tôi nhớ rõ Cerebras cũng từng ở tình cảnh tương tự. Cách đây khoảng sáu tháng, Gavin từng đề cập đến Cerebras — và nếu tính theo thang đo thời gian của AI, sáu tháng là một khoảng thời gian khá dài. Sau đó, công ty này đã IPO với định giá khoảng 60 tỷ USD và tăng thêm 40% ngay sau IPO. Điều này cho thấy Astera Labs cũng có thể là một cái tên quan trọng trong xu hướng tương tự.
Josh: Cerebras là một trong những khoản đầu tư sớm nhất của ông. Ông đã tham gia vào Cerebras từ rất sớm trong vòng đời công ty — tức là ông đã đặt niềm tin vào lý thuyết này trong nhiều năm. Ngoài ra còn có một số công ty khác cũng được ông đầu tư dài hạn, trong đó nổi bật nhất đương nhiên là Nvidia.
Việc tham gia vào Nvidia hơn 20 năm và duy trì niềm tin vững chắc (conviction) xuyên suốt là điều rất đáng khâm phục. Gần đây tôi đã nghe hai podcast mà Gavin tham gia, trong đó ông bày tỏ rõ ràng quan điểm về vị thế Nvidia: ông tin rằng Nvidia sẽ tiếp tục duy trì mức lợi nhuận hiện tại cũng như nhu cầu mạnh mẽ. Điều này hàm ý rằng ông cho rằng Nvidia có tiềm năng đạt mức vốn hóa gần 10.000 tỷ USD — hiện tại con số này mới chỉ đạt khoảng một nửa.
Một công ty khác đáng chú ý là Micron (Micron Technology, một trong những nhà sản xuất chip bộ nhớ hàng đầu toàn cầu). Ở tập trước, chúng tôi đã bàn về “stack đầu tư AI” và vị trí của các công ty trong đó — rất khuyến khích các bạn quay lại nghe lại. Micron là một trong những nhà sản xuất bộ nhớ (memory makers) lớn nhất. Chương trình đề cập đến một con số gây kinh ngạc: cách đây một năm, vốn hóa thị trường của Micron còn chưa tới 100 tỷ USD, nhưng tại thời điểm ghi âm, vốn hóa đã vượt mốc 1.000 tỷ USD — tăng gấp 10 lần chỉ trong một năm. Điều này cho thấy “vấn đề bộ nhớ” (memory problem) quan trọng đến mức nào.
Còn một số công ty ít nổi bật hơn nhưng rất thú vị. EJ, tôi đặc biệt muốn nhắc đến một công ty: Unity Software. Những ai quen thuộc với ngành trò chơi đều biết Unity — một “động cơ trò chơi” (game engine), và rất nhiều trò chơi nổi tiếng được xây dựng bằng phần mềm render 3D này.
Vậy tại sao một nhà đầu tư AI lại đầu tư vào Unity — thứ “dùng để làm trò chơi điện tử”? Câu trả lời nằm ở động cơ trò chơi 3D. Unity là một “người xây dựng mô hình thế giới” (world model builder), với hiểu biết sâu sắc về vật lý, cách vận hành của thế giới, chất liệu và ánh sáng. Khi các công ty AI xây dựng AGI (trí tuệ nhân tạo tổng quát) và robot hình người (humanoid robots), một bước quan trọng là mô phỏng môi trường ảo và tập dữ liệu ảo để huấn luyện robot bên trong. Unity chính là một trong những công cụ mạnh nhất cho mục đích này. Vì vậy, với tư cách là một “người ủng hộ cuồng nhiệt mô hình thế giới” (world model maxi), bạn sẽ rất thích ví dụ này: một công ty nổi tiếng nhờ động cơ trò chơi, nhưng lại có lộ trình rõ ràng để trở thành một người chơi then chốt trong thế giới AI.
Lý thuyết và chiến lược đầu tư của Gavin
EJ: Lý thuyết “mô hình thế giới” (world models) rất đơn giản: Các mô hình AI hoặc LLM hiện tại chủ yếu hiểu thế giới thông qua văn bản và sách vở — giống như một học sinh ngồi trong thư viện, nhưng lại thiếu kinh nghiệm thực tế trong thế giới thật. Mô hình thế giới nhằm giải phóng điều này: đặt một nhân vật trò chơi vào môi trường mô phỏng để giúp nó hiểu cách vận hành của thực tại vật lý. Ví dụ, nếu tôi thả điện thoại xuống đất hoặc đá một quả bóng, chuyện gì sẽ xảy ra? Các bước tiếp theo là gì? Bạn nên làm gì? Chính mô hình thế giới giải quyết vấn đề này.
Hiện nay, số lượng công ty có khả năng tạo ra loại năng lực này ở quy mô lớn là rất ít. Hiện dẫn đầu có thể là Google, với các dự án như Genie 3 (dự án mô hình thế giới tương tác sinh tổng hợp của Google). Chương trình cũng đề cập đến việc Google gần đây ra mắt Gemini Omni, nhưng các mô hình dạng này vẫn chưa thực sự bước vào “khoảnh khắc ChatGPT” (ChatGPT moment) của riêng mình.
Điều tôi thích ở Gavin là danh mục của ông giống như một chiến lược “đòn tạ” (barbell). Một đầu rất truyền thống: mọi người đều cần GPU và bộ nhớ, nên ông đầu tư vào các “ông lớn” nhất là Micron và Nvidia. Đầu còn lại rất tiên phong: ông tin rằng “quả bóng” (puck) sẽ lăn về hướng đó, nên đầu tư vào Cerebras vì ông cho rằng suy luận sẽ cực kỳ quan trọng; và đầu tư vào Unity vì ông tin rằng mô hình thế giới sẽ là phương thức huấn luyện robot và thế hệ LLM tiếp theo.
Danh mục của ông còn bao gồm Positron — công ty chuyên sản xuất chip suy luận (inference chips). Nếu điều này nghe có vẻ giống Cerebras, thì đúng vậy — cả hai đều tập trung vào suy luận. Gần đây, Gavin liên tục nhấn mạnh một xu hướng trong các cuộc phỏng vấn: “stack cơ sở hạ tầng” cho mô hình AI — đặc biệt là stack huấn luyện — đang chuyển dịch từ huấn luyện sơ bộ sang trọng tâm ngày càng lớn hơn vào huấn luyện sau.
Nếu bạn hoạt động trong ngành AI, bạn sẽ biết xu hướng này đã diễn ra. Gavin đặc biệt tập trung vào vấn đề này. Một mô hình vẫn cần hiểu thông tin và dữ liệu mới, cần tự cập nhật. Không thể vì nó đã hoàn tất huấn luyện sơ bộ trên một tập dữ liệu nào đó mà cho rằng nó mãi mãi là một thiên tài. Nó vẫn cần học thông tin mới — điều này xảy ra ở lớp huấn luyện sau, và đòi hỏi lượng tính toán khổng lồ.
Thứ hai, nếu bạn muốn mô hình AI thực sự suy luận vấn đề — giống như khi chúng ta tiếp nhận thông tin mới rồi tự hỏi: góc nhìn này có hợp lý không? Có lý thuyết nào khác giải thích được không? Đó chính là “suy luận” (reasoning). Và suy luận cũng đòi hỏi lượng tính toán khổng lồ. Ước tính hiện tại cho thấy chỉ riêng chi phí hoặc cơ hội doanh thu từ suy luận có thể đạt 5–10 lần chi phí đầu tư vào công suất tính toán dành cho huấn luyện sơ bộ.
Vì vậy, cả các phòng thí nghiệm AI (AI labs) lẫn các nhà sản xuất chip (chip makers) đều đang có sự chuyển dịch lớn. Bạn đã thấy Nvidia tung ra nhiều GPU hướng đến suy luận để hỗ trợ các ứng dụng dạng “đại lý” (agentic). Gavin cũng thể hiện niềm tin vào suy luận thông qua loạt đầu tư này.
Một điểm cuối cùng tôi thấy rất thú vị là Gavin nói về Trung Quốc. Trong cuộc đua AI, câu chuyện kể luôn là “Trung Quốc so với Hoa Kỳ”. Trung Quốc có một cấu hình đặc biệt: nguồn năng lượng tương đối dồi dào và khả năng mở rộng sản xuất chip. Hiện tại, Hoa Kỳ đang gặp khó khăn ở khía cạnh này — đó cũng là lý do vì sao nhiều khâu được giao khoán cho TSMC ở Đài Loan (nhà sản xuất đĩa bán dẫn tiên tiến quan trọng nhất toàn cầu).
Giải thích của ông là: Trung Quốc có cơ hội độc đáo để tạo ra một loại cơ sở hạ tầng AI hoặc chip rất khác biệt so với Hoa Kỳ — bởi vì chúng sẽ tập trung mạnh vào suy luận. Bạn có thể nói rằng Gavin đang dẫn đầu việc đặt cược vào việc xây dựng cơ sở hạ tầng suy luận tại Hoa Kỳ thông qua các khoản đầu tư của mình tại đây. Theo tôi, đây có thể là một cơ hội khổng lồ trong tương lai.
Josh: Cần lưu ý rằng khoản đầu tư này không chỉ mang tiềm năng tăng giá. Ông còn nắm giữ một vị thế lớn quyền chọn bán QQQ (quyền chọn bán ETF Nasdaq 100). QQQ là ETF theo dõi chỉ số Nasdaq 100 — một giỏ cổ phiếu, đồng thời là ETF có khối lượng giao dịch lớn thứ hai tại Hoa Kỳ. Hiệu suất của nó rất mạnh: tăng 55% năm 2023, tăng 25% năm 2024, tăng 20% năm 2025 và tăng 17% tính đến thời điểm hiện tại năm 2026.
Nói cách khác, QQQ — với tư cách một quỹ chỉ số — thể hiện hiệu suất tuyệt vời; việc mua nó rất dễ dàng vì đây là giỏ 100 cổ phiếu hàng đầu nhất. Còn Gavin lại thực hiện một giao dịch đối nghịch với nó. Ông không phủ nhận AI sẽ thắng, mà là muốn đầu tư vào những nhà sản xuất then chốt thực sự giải quyết các điểm nghẽn — tuy nhiên, ông không quá lạc quan về tâm lý chung của thị trường. Quyền chọn bán QQQ là “bảo vệ rủi ro đi xuống” (downside protection): nếu toàn bộ thị trường sụp đổ theo cách bất lợi, ngay cả khi AI vẫn thắng về dài hạn, ông vẫn có lớp phòng vệ (hedge) này.
Bốn hướng đầu tư đáng chú ý
Josh: Chúng ta có thể chia các điểm nghẽn đầu tư quan trọng nhất theo quan điểm của ông thành một số nhóm. Nhóm đầu tiên là các mô hình ngôn ngữ nhỏ chuyên biệt (verticalized small language models). Các LLM phổ thông như Claude và ChatGPT là các mô hình ngôn ngữ lớn tổng quát (generalized LLM), có hiểu biết rộng về thế giới và có thể trả lời các câu hỏi cụ thể. Nhưng việc huấn luyện một mô hình xoay quanh một lĩnh vực chuyên biệt hoặc một vấn đề cụ thể lại là chuyện khác.
Những vấn đề cụ thể này thường tồn tại trong doanh nghiệp — đặc biệt là các doanh nghiệp chuyên sâu vào một vấn đề nhất định, hoặc các công ty đã hình thành “niche” (thị trường ngách) trong một phân khúc nhất định. Các mô hình ngôn ngữ nhỏ chuyên biệt (verticalized SLMs) chính là để giải quyết vấn đề này: chúng là các “mô hình tiên phong” (frontier models), nhưng được tối ưu hóa cao độ để vận hành hiệu quả trên dữ liệu doanh nghiệp cụ thể, hoặc chạy cục bộ (on-device) trên thiết bị.
Chúng ta từng thảo luận về các mô hình chạy cục bộ (on-device) hoặc mô hình chạy cục bộ (locally run models). Lý do là điện thoại hoặc các thiết bị khác của bạn chứa rất nhiều dữ liệu mang tính cá nhân cao — bạn có thể không muốn chia sẻ chúng, và công ty cũng có thể không được phép truy cập. Ví dụ: hồ sơ y tế (medical records), chi tiết tài chính (financial details). Tôi thấy OpenAI đã ra mắt một “đại lý AI tài chính” (financial AI agent) có thể truy cập tài khoản ngân hàng của bạn, nhưng không thể thực hiện thao tác thay bạn — bởi vì bên trong chứa rất nhiều thông tin cá nhân (personally identifiable information), như số an sinh xã hội, chi tiết ngân hàng, v.v.
Các mô hình cục bộ hoặc SLMs có thể giải quyết những vấn đề này. Gavin phần lớn đặt cược rằng chúng sẽ trở nên rất quan trọng trong tương lai. Một công ty ông đặc biệt ưa thích là Apple. Mặc dù ông chưa chắc đã bày tỏ rõ ràng sự quan tâm đầu tư, nhưng ông tin rằng Apple sẽ là một trong những nhà sản xuất thiết bị (device maker) chủ chốt giúp mô hình cục bộ chạy trên thiết bị.
Nếu tương lai là như vậy, chúng ta có thể sẽ không còn nghĩ rằng Claude nhất thiết phải là mô hình bạn tương tác mỗi ngày. Điều bạn thực sự cần có thể là một “đại lý AI cá nhân hóa” (personalized AI agent), được huấn luyện trên dữ liệu riêng của bạn — đó chính là điều mà SLM cuối cùng có thể trở thành. Phiên bản tổng quát có thể chạy trên điện thoại của bạn, trong khi rất nhiều doanh nghiệp sẽ chạy các mô hình được tối ưu hóa cao độ và chuyên biệt trên dữ liệu sở hữu riêng (proprietary data) để bán hoặc tiếp thị sản phẩm hiệu quả hơn.
EJ: Apple ở vị trí này quá hoàn hảo. Tôi rất mong chờ WWDC (Hội nghị Nhà phát triển Toàn cầu của Apple), nó sắp diễn ra rồi.
Josh: Đúng vậy.
EJ: Chỉ còn vài tuần nữa là đến Hội nghị Nhà phát triển của Apple, khi họ sẽ ra mắt phần mềm AI mới và cách phần mềm này tích hợp với phần cứng. Điều này sẽ rất quan trọng, và chúng tôi sẽ tiếp tục đưa tin — tôi rất mong được thảo luận về điều này.
Josh: Cột trụ thứ hai là cơ sở hạ tầng chủ quyền (sovereign infrastructure). Chúng ta thường nói rằng tốc độ của “bit” (bit) nhanh hơn rất nhiều so với tốc độ của “nguyên tử” (atom). Xem cơ sở hạ tầng AI là rõ nhất: chất lượng mô hình gần như tăng theo cấp số mũ, trí tuệ sinh ra trên mỗi watt, trí tuệ tương ứng với mỗi token — tất cả đều chỉ tăng lên không ngừng.
Nhưng tốc độ triển khai vật lý lại không tăng với tốc độ tương đương — và chính điều này tạo nên “hào sâu bảo vệ” (moat). Phần cứng cực kỳ phức tạp, độ chính xác của bóng bán dẫn (transistor) đã tiến gần đến cấp độ nguyên tử; việc triển khai quy mô lớn trong một thế giới mà cơ sở hạ tầng hiện tại đã chịu áp lực nặng nề là điều không hề dễ dàng. Việc xe điện phổ biến nhanh chóng đã khiến lưới điện chịu áp lực lớn hơn, nhiều nơi gần như đạt công suất tối đa. Giờ đây, AI lại mang đến “vấn đề năng lượng” (energy problem) và “vấn đề chip” (chip problem).
Gavin đặt cược mạnh vào thực tế rằng việc xây dựng cơ sở hạ tầng rất khó — cần nhiều ngày, nhiều tháng, thậm chí nhiều năm. Ông đặt cược vào những người có thể rút ngắn chu kỳ này xuống chỉ còn vài tuần. Vì vậy, tốc độ triển khai vật lý (physical deployment) chính là hào sâu bảo vệ. Ông đang thu hẹp phạm vi mục tiêu để tìm kiếm những công ty có thể triển khai nhanh nhất.
Ví dụ đầu tiên tôi nghĩ đến là SpaceX (công ty hàng không vũ trụ của Elon Musk) và tốc độ họ xây dựng Colossus (cụm siêu máy tính AI quy mô lớn của xAI) và cho Anthropic thuê — và trong tương lai có thể cho các công ty khác thuê. Đây là một trong những trụ cột cơ sở hạ tầng mà Gavin đặc biệt quan tâm.
Nếu xem danh mục của Leopold, đây cũng là phần cốt lõi. Thực tế là: việc xây dựng các thứ rất khó, và những người có thể xây dựng được sẽ bán được với giá rất cao. Chương trình đề cập rằng hiện tại nguồn thu lớn nhất của SpaceX là cho thuê trung tâm dữ liệu — chứ không phải tên lửa. Điều này cho thấy trụ cột này quan trọng đến mức nào.
EJ: Ông quan tâm đến tốc độ, nhưng cũng quan tâm đến chi phí. Ông liên tục đề cập đến một chỉ số: hiệu suất trên mỗi watt (performance per watt). Điều ông thực sự muốn nói là các phòng thí nghiệm AI ngày càng quan tâm đến việc mỗi watt điện tạo ra được bao nhiêu token.
Hãy nghĩ xem: chỉ trong năm nay, khoảng năm công ty đã chi hàng tỷ, thậm chí hàng nghìn tỷ đô la vào GPU, công suất tính toán và điện năng vận hành các hệ thống này — bạn chắc chắn muốn “giá trị thu được trên mỗi đô la chi tiêu” (bang for buck) đủ cao. Đặc biệt là khi các nhà cung cấp đám mây quy mô khổng lồ (hyperscalers) mở rộng đến quy mô này, chi phí chính là vấn đề then chốt.
Hãy lấy một ví dụ giả định: Tôi hỏi Claude một câu hỏi, chi phí để nó trả lời là 2 xu; tôi hỏi ChatGPT một câu hỏi, chi phí để nó trả lời là 1 đô la. Ngay cả khi Claude chỉ có 95% trí tuệ của ChatGPT, tôi vẫn có khả năng cao sẽ chọn Claude — bởi vì tôi có thể hỏi nhiều lần hơn và cuối cùng nhận được câu trả lời với chi phí thấp hơn.
Vì vậy, chi phí tiếp cận trí tuệ (intelligence) này cực kỳ quan trọng. Ngay trong tuần này, Microsoft và Uber đã tuyên bố thực tế đang giảm mức sử dụng Claude Code (công cụ AI lập trình của Anthropic dành riêng cho bối cảnh lập trình) vì ngân sách hàng năm đã cạn kiệt chỉ sau khoảng 4 tháng.
Bạn có thể thấy điều này trong danh mục đầu tư của Gavin: Cerebras, Positron, Astera Labs. Ông xác định các điểm nghẽn cơ sở hạ tầng rất chi tiết, rồi đặt một khoản đầu tư đơn giản: nếu công ty này giải quyết được điểm nghẽn này, đạt được hiệu suất nhất định trên mỗi watt và giảm chi phí mỗi token xuống một mức nhất định, thì các phòng thí nghiệm AI sẽ mua thêm GPU, thêm sản phẩm hoặc thêm các thứ tương tự.
Vì vậy, lý thuyết của ông thực ra rất đơn giản, mặc dù công nghệ cụ thể rất phức tạp: tôi chỉ tập trung vào các điểm nghẽn ở lớp cơ sở hạ tầng AI. Nếu tìm được một công ty nâng cao hiệu suất trên mỗi watt và làm cho token rẻ hơn, tôi sẽ đặt cược rằng công ty đó trong tương lai sẽ rất có giá trị — hoặc IPO, hoặc bị mua lại với giá cao.
Josh: Trong phần này, nếu ai muốn sao chép giao dịch của Gavin, cần biết một số tên: Astera Labs, Cerebras, SiFive (công ty thiết kế chip RISC-V) và Positron. Bốn công ty này rất then chốt trong phân khúc này.
Hướng thứ tư và cuối cùng là sự kết hợp giữa năng lượng (energy) và không gian (space). Như chúng ta đã nói ở trên, lưới điện mặt đất (terrestrial grid) phần lớn giới hạn nguồn cung năng lượng, và việc xây dựng năng lượng mới cũng rất khó. Chương trình đề cập đến một thống kê: khoảng 40% trung tâm dữ liệu mới sẽ gặp phải phản đối rất mạnh — người dân vận động, biểu tình, không muốn các trung tâm dữ liệu này được xây dựng.
Có hai cách giải quyết. Một là tạo ra “năng lượng trong hộp” (out-of-the-box energy) — tức là năng lượng di động. Bạn có thể mang trung tâm dữ liệu đến nơi cần, và cung cấp điện bằng một thiết bị năng lượng nhỏ. Blue Marble — công ty được Leopold rất ưa thích — thuộc loại này.
Cách thứ hai là “tính toán trên quỹ đạo” (orbital compute) — đây là hướng mà Gavin hiện đang đặc biệt quan tâm. Công ty lớn nhất và cốt lõi nhất trong lĩnh vực này đương nhiên là SpaceX. Đây là công ty duy nhất có khả năng trở thành “đường cao tốc lên vũ trụ”, đưa tải trọng (payload) vào quỹ đạo, đưa các giá đỡ (racks) và trung tâm dữ liệu lên quỹ đạo thấp (low Earth orbit), đồng thời tạo ra đủ trí tuệ và điện năng để truyền tín hiệu trở lại.
Tôi cho rằng ý nghĩa của SpaceX lớn hơn cả bản thân SpaceX. Tôi hơi ngạc nhiên khi danh mục của Gavin chưa có nhiều cổ phiếu không gian (space stocks), xét theo quan điểm của ông rằng đây là một ngành khổng lồ. Có thể thực tế là nó còn quá sớm, và SpaceX chính là “khóa then chốt” (linchpin) để mở khóa ngành này.
Sắp tới, chúng ta cần theo dõi sát chuyến phóng Starship V3. Tuần trước chúng ta vừa chứng kiến một lần phóng Starship, và hiệu suất rất tốt. Nếu Starship không thực sự vận hành được, sẽ không có năng lượng trong không gian, cũng không có “giá đỡ lên quỹ đạo” (racks to orbit). Đây là điều kiện tiên quyết, bởi vì tải trọng cần phóng rất lớn. Vì vậy, SpaceX chắc chắn là công ty cần theo dõi, dù vẫn sẽ có rất nhiều công ty cấp hai chịu ảnh hưởng.
Tại sao đây không phải là một lần bong bóng internet khác?
Josh: Tiếp theo, chắc chắn mọi người sẽ hỏi: Tại sao đây không chỉ là một lần bong bóng dot-com (internet bubble) khác? Gavin đã bị hỏi rất nhiều lần câu hỏi này, và ông đưa ra câu trả lời rất mạnh mẽ — tôi gần như hoàn toàn tin tưởng ông, bởi lập luận của ông rất có sức thuyết phục.
Lập luận của ông đại khái như sau: Bong bóng internet năm 2000 là do nợ (debt-fueled) gây ra. Nhiều người vay rất nhiều tiền để đầu tư vào các lý thuyết chưa được kiểm chứng và các sản phẩm chưa ai thực sự sử dụng hoặc quan tâm.
Nếu so sánh với siêu chu kỳ AI mà Gavin đang nói đến, chỉ riêng hai công ty OpenAI và Anthropic thôi, năm nay cũng có thể đạt doanh thu thường xuyên hàng năm (ARR) lên tới 200 tỷ USD. Và đây không phải là tiền “bốc hơi” — mà là tiền đã được ký hợp đồng thực tế, trong đó một phần lớn — chương trình nói là 40–60% — đã được doanh nghiệp và khách hàng cá nhân thanh toán trước. Nói cách khác, tiền thật đang chảy.
Xét tiếp về công suất tính toán GPU, đừng nhìn vào các phòng thí nghiệm mô hình, mà hãy xem ai đang mua sản phẩm từ Nvidia. Google, Microsoft, Amazon và Meta đều đang chi tiền mặt dự trữ của chính mình — không vay mượn. Amazon vừa mới chạm đến giới hạn cuối cùng của dòng tiền tự do (free cash flow); nếu họ bắt đầu vay tiền, chúng ta mới cần lo lắng. Nhưng hiện tại trọng tâm là: họ chưa sử dụng đòn bẩy.
Hơn nữa, đây là năm công ty hàng đầu toàn cầu — và xét về một mặt nào đó, cũng là một trong những công ty thông minh nhất, bởi vì quy mô vốn hóa, quy mô và vị thế của họ đã nói lên điều đó. So với bong bóng internet, hồi đó có rất nhiều công ty vô danh gọi vốn rất nhiều, rồi đốt tiền một cách phi lý. Còn trong chu kỳ này, là những công ty thông minh nhất toàn cầu đang chi tiêu bằng tiền mặt — không dùng đòn bẩy.
Những báo cáo quý gần đây mà chúng tôi đề cập trong chương trình cũng cho thấy lợi nhuận đang được tối ưu hóa xung quanh các hành động này, các mô hình vẫn đang tiến bộ và trở nên thông minh hơn. Vì vậy, luận điểm cốt lõi của Gavin là: Đây không phải là bong bóng internet, bởi vì nó không do đòn bẩy tài chính thúc đẩy; đồng thời, các điểm nghẽn mà chúng ta đã nói đến bị ràng buộc bởi “nguyên tử vật lý” (physical atoms).
Mua một loạt chip bộ nhớ và GPU là một chuyện, nhưng Nvidia không thể bán quá mức GPU, Micron cũng không thể bán quá mức chip bộ nhớ AI, bởi vì họ không có đủ cơ sở sản xuất chip. Vì vậy, luận điểm đơn giản của ông là: Nếu bạn không thể cung ứng quá mức toàn bộ thị trường, thì đó không phải là bong bóng. Chúng ta bị giới hạn bởi việc không có đủ “xẻng và cuốc” (picks and shovels) để thực hiện điều đó — và ông đang đầu tư chính vào những thứ này.
Một điểm rất hay khác: Gavin cho rằng nếu TSMC có thể đáp ứng, thì năm nay và năm tới Nvidia vốn có thể bán được GPU trị giá 2–3 nghìn tỷ USD. Nói cách khác, TSMC là một mắt xích then chốt trong ranh giới bong bóng.
Lý do là nếu TSMC có thể đáp ứng nhu cầu của các công ty này và cung cấp số lượng chip khổng lồ như vậy, thì điều đó sẽ tiêu tốn một khoản tiền lớn. Hiện tại, trên biểu đồ, chi tiêu vốn (CapEx) và dòng tiền từ hoạt động kinh doanh (operating cash) chưa xuất hiện sự chênh lệch lớn — dòng tiền do doanh nghiệp tạo ra vẫn đủ để hỗ trợ việc xây dựng.
Nhưng nếu ngày mai TSMC nói với Nvidia: “Chúng tôi có thể nhân ba công suất sản xuất chỉ trong một đêm”, thì Nvidia sẽ không từ chối — mà sẽ bắt đầu chi một khoản tiền khổng lồ để mua chip. Các công ty khác cũng sẽ bị buộc phải vay tiền để mua những chip này, và khi đó “bong bóng chi tiêu vốn” (CapEx bubble) sẽ bắt đầu mở rộng và dần tách rời khỏi dòng tiền từ hoạt động kinh doanh.
Nhưng vì mọi khâu đều có ràng buộc cung ứng — bộ nhớ có ràng buộc, sản xuất chip có ràng buộc, năng lượng có ràng buộc — đặc biệt là ràng buộc của TSMC trong sản xuất chip tiên tiến — nên thực tế chúng ta không thể đẩy nhanh tốc độ xây dựng đến mức đó. Vì vậy, TSMC đang chặn đứng sự gia tốc của bong bóng.
Miễn là công suất sản xuất chip của TSMC vẫn còn hạn chế, miễn là Samsung và các nhà sản xuất chip khác chưa vượt qua được thị phần của TSMC, thì tốc độ tăng trưởng sẽ tương đối bền vững. Nó có vẻ nhanh, nhưng vẫn còn rất nhiều nhu cầu chưa được đáp ứng — bởi vì chúng ta đơn giản là chưa xây dựng đủ nhanh. Miễn là động lực này còn tồn tại, tôi nghĩ tạm thời sẽ không có vấn đề gì lớn.
EJ: Còn một điểm nữa: bạn không thể giả định nhu cầu sẽ tĩnh tại — bởi vì nó sẽ không như vậy. Nhu cầu liên quan đến AI đang tăng theo cấp số mũ, và tốc độ tăng nhanh hơn cả tốc độ cung ứng sản xuất chip.
Tôi có thể nghĩ ra hai cách để bác bỏ lý thuyết này. Thứ nhất, ai đó “phù thủy” sao chép thành công ASML (nhà cung cấp thiết bị quang khắc cực tím EUV hàng đầu toàn cầu), đột nhiên xuất hiện hàng loạt đối thủ cạnh tranh của ASML. Với những ai chưa biết ASML, có thể hiểu như sau: ASML sản xuất những chiếc máy trị giá khoảng 400 triệu USD, và TSMC cũng như tất cả các nhà máy đĩa bán dẫn (chip fab) lớn đều cần những chiếc máy này. Chương trình nói rằng ASML chỉ có một đội ngũ ở Na Uy (Norway) sản xuất những thứ này, và chu kỳ sản xuất rất dài — đơn hàng chờ (backlog) hiện đã xếp đến khoảng 5 năm.
Thứ hai, chúng ta tạo ra một loại LLM hoàn toàn khác, không cần nhiều GPU và cũng không cần nhiều bộ nhớ. Nhưng hiện tại, chúng ta hoàn toàn chưa thấy bất kỳ dấu hiệu nào như vậy.
Hôm nay tôi thấy một tin tức về SK Hynix (nhà cung cấp bộ nhớ băng thông rộng HBM hàng đầu toàn cầu). Đây là nhà sản xuất và cung cấp bộ nhớ hàng đầu cho GPU của Nvidia, gần như là “đầu đàn” (top dog) trong lĩnh vực bộ nhớ AI. Hiện tại, công ty này đang nhận được các đề xuất mua hàng trị giá từ 50–100 tỷ USD từ Google và Microsoft — hai công ty muốn đặt cọc trước để đảm bảo nguồn cung trong ba năm tới, nhằm chi trả cho thiết bị mở rộng sản xuất.
Điều này cho thấy các công ty lớn khát khao bộ nhớ đến mức nào — mà đây mới chỉ là một phân khúc con trong toàn bộ hệ sinh thái linh kiện AI. Thay vì cam kết cung ứng, SK Hynix lại nói: “Tôi không muốn đảm bảo cung ứng cho các anh — tôi chỉ cần tăng giá là xong.” Lợi nhuận gộp (operating margin) của họ khoảng 70%, điều gần như không thể tưởng tượng được trong ngành bán dẫn.
Vì vậy, việc Gavin “đặt cược toàn bộ” (all-in) là hoàn toàn có lý. Nó trông không giống một bong bóng — có thể thị trường sẽ phản ứng ngắn hạn như vậy. Hôm nay, trước khi ghi âm, tôi mở danh mục cổ phiếu và thấy hầu như toàn bộ đều giảm — nhưng đó chủ yếu là phản ứng cảm xúc (reactionary). Mục tiêu định hướng của việc này là: chúng ta sẽ chỉ ngày càng cần thêm GPU, thêm chip bán dẫn — trong khi nguồn cung không đủ và nhà sản xuất cũng không đủ.
Danh mục đầu tư của Gavin
Josh: Kết luận là: điện năng và đĩa bán dẫn. Chỉ hai thứ đó. Chúng là hai bức tường gạch, cũng là hai yếu tố giới hạn ngăn chúng ta tăng tốc quá nhanh. Miễn là điện năng và đĩa bán dẫn vẫn có giá trị, nhu cầu vẫn mạnh và nguồn cung vẫn hạn chế, thì phía trước vẫn còn những ngày tươi sáng.
Nếu bạn muốn bản tóm tắt nhanh (TLDR) về danh mục của Gavin, tôi có thể đọc danh mục nắm giữ lớn nhất của ông. Một lần nữa nhấn mạnh: đây không phải là lời khuyên đầu tư. Đây là những gì Gavin nắm giữ — không phản ánh danh mục của chúng tôi. Tôi không biết những cổ phiếu này sẽ tăng, giảm hay đứng yên.
Vị thế lớn nhất của ông khá phản trực quan: quyền chọn bán QQQ (quyền chọn bán ETF Nasdaq 100). Nhìn chung, ông có quan điểm bi quan (bearish) về thị trường — điều này rất đáng chú ý. Vị thế lớn thứ hai là Astera Labs, chiếm khoảng 7,4%, mã chứng khoán là ALAB. Thứ ba là Unity — công ty phần mềm 3D.
Sau đó còn rất nhiều công ty khác: Ciena (công ty thiết bị mạng quang), Micron, Nvidia, Amazon, Lumentum (công ty thiết bị quang thông và laser), Alphabet (công ty mẹ của Google), Coherent (công ty quang điện tử và vật liệu), Roblox (nền tảng trò chơi), EchoStar (công ty viễn thông vệ tinh), Twilio (nền tảng viễn thông đám mây), Wayfair (công ty thương mại điện tử đồ nội thất). Người này đầu tư vào mọi thứ.
Nếu bạn quan tâm, có thể xem báo cáo 13F của ông — chúng tôi sẽ để đường dẫn trong phần mô tả. Nhưng đây chính là quan điểm của Gavin: điểm nghẽn nằm ở điện năng và đĩa bán dẫn. Miễn là những ràng buộc này còn tồn tại, thì xu hướng cơ bản là tăng giá một chiều. EJ, anh tiếp nhận những thông tin này như thế nào? Anh sẽ xử lý chúng ra sao?
EJ: Từ khi báo cáo 13F của Leopold được công bố, thị trường luôn rất biến động. Trong lúc ghi âm tập này, tôi ngày càng nhận ra Gavin giống như một phiên bản già dặn hơn, thông minh hơn của Leopold. Ông đã hoạt động trong ngành này rất lâu. Có thể ông chưa có AUM 13 tỷ USD, nhưng tôi cảm giác ông sẽ vẫn còn ở đây sau 10 năm nữa.
Nếu bạn nghe đến đây và nghĩ: “Tôi không muốn theo dõi từng phút, từng giờ, từng ngày tiến triển của AI — tôi chỉ muốn đặt tiền vào đó và xem nó tăng trưởng thế nào trong vài tháng hoặc vài năm tới.” Vậy danh mục của Gavin có thể rất đáng tham khảo. Dĩ nhiên, đây không phải là lời khuyên đầu tư.
Ông theo đuổi một cách tiếp cận thận trọng hơn, dài hạn hơn và hướng về tương lai hơn. Nếu xu hướng ông dự đoán cuối cùng trở thành hiện thực — giống như việc ông sớm nhận diện và đầu tư vào Nvidia và Cerebras — thì trong vài năm tới có thể mang lại lợi nhuận theo cấp số mũ. Nhưng tất cả đều dựa trên một luận điểm cốt lõi của ông: Chúng ta không đang ở trong bong bóng.
Tôi rất tò mò không biết người nghe có đồng ý hay không. Rõ ràng, đa số người nghe sẽ không kỹ thuật hóa và đi sâu vào tầng nền như Gavin. Nhưng sau khi nghe tập này, bạn nghĩ chúng ta đang trong bong bóng hay không? Lý do đồng tình và phản bác là gì? Có điều gì chúng ta đã bỏ sót không? Josh, trước khi kết thúc, anh nghĩ hiện tại có phải là bong bóng không?
Josh: Tôi cho rằng chúng ta đương nhiên đang trong một bong bóng. Vấn đề là chúng ta đang ở giai đoạn nào của bong bóng — điều này còn có thể tranh luận. Hiện tại, nó trông giống giai đoạn đầu hơn, nên hy vọng nó sẽ tiếp tục duy trì trạng thái này. Theo như Gavin nói, miễn là TSMC tiếp tục giới hạn công suất sản xuất chip, thì chúng ta vẫn ổn.
Đây là toàn cảnh triển vọng chung. Chúng ta đã nói về Leopold — thành công của ông hiện được đo theo quý; giờ đây chúng ta nói về Gavin — thành công của ông được đo theo vài thập kỷ. Đáp án của nhiều người có thể nằm ở đâu đó giữa hai cực này.
Nếu bạn thích tập này, đừng quên chia sẻ với bạn bè. Cũng hãy cho chúng tôi biết bạn đánh giá cao nhất loại tài sản nào. Có thể không phải là một lý thuyết nào đó, mà là một mã cổ phiếu cụ thể đáng để chúng ta theo dõi. Tôi thấy điều này rất thú vị, bởi vì mọi thứ đang chuyển động rất nhanh — dù đi lên hay đi xuống, đều có rất nhiều biến động và cũng rất đáng để tham gia. Hẹn gặp lại ngày mai, chúc bạn một buổi sáng tốt lành.
Chào mừng tham gia cộng đồng chính thức TechFlow
Nhóm Telegram:https://t.me/TechFlowDaily
Tài khoản Twitter chính thức:https://x.com/TechFlowPost
Tài khoản Twitter tiếng Anh:https://x.com/BlockFlow_News











