Diễn thuyết của Huang Renxun tại Hội nghị GTC Taipei năm 2026: Kỷ nguyên của các tác nhân AI đã đến, tính toán chính là doanh thu

2026.06.03

Chia sẻ đến

Tuyển chọn TechFlowTuyển chọn TechFlow

Diễn thuyết của Huang Renxun tại Hội nghị GTC Taipei năm 2026: Kỷ nguyên của các tác nhân AI đã đến, tính toán chính là doanh thu

“Tính toán chính là doanh thu, tính toán chính là lợi nhuận. Không có doanh thu và lợi nhuận, tức là thua lỗ.”

2026.06.03 - 03:26:57

黄仁勋AI

Chuyên sâu báo cáo Web3

“Tính toán chính là doanh thu, tính toán chính là lợi nhuận. Không có doanh thu và lợi nhuận, tức là thua lỗ.”

Tổng hợp & Dịch thuật: TechFlow

Khách mời: Jensen Huang, CEO NVIDIA

Nguồn podcast: Bonnie Blockchain

Tiêu đề gốc: 7 Điểm Trọng Tâm Chính Trong Bài Phát Biểu Của Jensen Huang Tại Hội Nghị GTC Taipei 2026 – Tổng Quan Nhanh Về Chiến Lược Mới Nhất Của NVIDIA! [Bonnie Blockchain]

Ngày phát sóng: Ngày 2 tháng 6 năm 2026

Tóm Tắt Các Điểm Trọng Tâm

Trong bài phát biểu tại Hội nghị GTC Taipei 2026, Jensen Huang xác định chiến lược giai đoạn tiếp theo của NVIDIA dựa trên một nhận định cốt lõi: AI đã bước từ giai đoạn tạo nội dung sang kỷ nguyên “đại diện” (agents) có khả năng thực hiện công việc thực tế; token giờ đây không còn chỉ là chỉ số kỹ thuật mà đã trở thành đơn vị sản xuất doanh thu, lợi nhuận và GDP. Dựa trên sự thay đổi này, NVIDIA ra mắt Vera Rubin, Vera CPU, bộ công cụ doanh nghiệp dành riêng cho đại diện, thế hệ PC mới hợp tác cùng Microsoft, cũng như Cosmos 3, Alpamayo 2 và Isaac GR00T – tất cả đều hướng tới AI vật lý. Jensen Huang nhấn mạnh rằng mô hình tính toán trong thập kỷ tới sẽ được cấu thành bởi bốn yếu tố: mô hình, khung đại diện, kỹ năng công cụ và môi trường chạy (runtime), và sẽ lan rộng từ điện toán đám mây, doanh nghiệp, PC cục bộ sang robot, nhà máy, vệ tinh và thiết bị biên. Đối với chuỗi cung ứng Đài Loan, điều này đồng nghĩa với việc các yếu tố then chốt cho tăng trưởng công nghiệp trong giai đoạn tiếp theo sẽ là “nhà máy AI”, hiệu suất tiêu thụ điện, tốc độ triển khai cơ sở hạ tầng và năng lực phối hợp toàn bộ hệ thống.

Tóm Tắt Những Quan Điểm Nổi Bật

Sự Xuất Hiện Của Kỷ Nguyên Đại Diện AI

"AI hữu ích đã thực sự đến, AI giờ đây là máy tạo lợi nhuận và cũng là máy tạo GDP. Đằng sau nó không chỉ là mô hình ngôn ngữ lớn (LLM), mà là một mô hình tính toán hoàn toàn mới: đại diện."
"Đại diện gồm mô hình ngôn ngữ lớn và khung đại diện; khung này vận hành như một hệ điều hành, kết nối bộ nhớ, công cụ, suy luận, lập kế hoạch và hành động."
"Sự đột phá trong hệ thống đại diện bắt nguồn từ hai yếu tố: thứ nhất, LLM giờ đây đã có khả năng suy nghĩ, suy luận, lập kế hoạch và sử dụng công cụ; thứ hai, khung đại diện có thể quản lý bộ nhớ, điều phối quy trình và phân bổ công cụ."
"Mọi công ty đều sẽ trở thành công ty đại diện; mỗi công ty sẽ vận hành các đại diện bên trong tổ chức mình và đều cần một hệ điều hành đại diện riêng."

Token, Nhà Máy AI Và Kinh Tế Học Cơ Sở Hạ Tầng

"Token giờ đây là đơn vị doanh thu mang lại lợi nhuận. Các công ty AI muốn sản xuất thêm token sẽ xây dựng thêm nhà máy AI – đó chính là lý do nhu cầu tính toán tại Đài Loan bùng nổ."
"Tính toán chính là doanh thu, tính toán chính là lợi nhuận. Không có doanh thu và lợi nhuận thì tức là đang chịu lỗ."
"Nếu một nhà máy AI chỉ có công suất điện tối đa 1 gigawatt (GW), thì giới hạn điện năng chính là 1 GW; trong điều kiện ấy, thông lượng mỗi watt chính là doanh thu, bởi mỗi token đều có giá trị."
"Chỉ vì chip rẻ hơn mà chọn kiến trúc sai sẽ không chuyển hóa thành lợi ích thực sự; điều bạn cần đảm bảo là doanh thu trên mỗi watt. Mua càng nhiều, bạn càng kiếm được nhiều."

Vera Rubin Và Sự Chuyển Đổi Cơ Sở Hạ Tầng Của NVIDIA

"Vera Rubin không phải một con chip, cũng không chỉ là GPU, mà là một hệ thống toàn diện được xây dựng từ đầu đến cuối."
"Trước đây NVIDIA là công ty GPU, sau đó trở thành công ty hệ thống, và giờ đây đang tiến thêm một bước nữa để trở thành công ty cơ sở hạ tầng, hỗ trợ khách hàng xây dựng nhà máy AI."
"Vera Rubin là dự án kỹ thuật tham vọng nhất trong lịch sử NVIDIA, với sự tham gia của 40.000 kỹ sư toàn công ty, và chuỗi cung ứng Đài Loan cũng đồng hành trong việc sáng tạo hệ thống này."
"Grace Blackwell được thiết kế để xử lý AI, đặc biệt là suy luận (inference); Vera Rubin được thiết kế để vận hành đại diện."

Vera CPU Và Yêu Cầu Tính Toán Của Đại Diện

"Tất cả các CPU trước đây đều được thiết kế cho con người; CPU này được thiết kế riêng cho đại diện."
"Đại diện không có kiên nhẫn. Thế giới của chúng không được đo bằng giây, mà bằng nanogiây. Khi sử dụng công cụ, chúng mong muốn phản hồi càng nhanh càng tốt; khi truy cập cơ sở dữ liệu, chúng kỳ vọng kết quả trả về ngay lập tức."
"Vera CPU là CPU được thiết kế riêng cho đại diện, chú trọng hiệu năng luồng đơn (single-thread), số lệnh thực thi mỗi chu kỳ (IPC), băng thông trên mỗi nhân và tổng băng thông hệ thống."
"Thị trường này chắc chắn sẽ lớn hơn thị trường trước đó, bởi số lượng đại diện sẽ vượt xa số lượng con người — và đại diện cực kỳ thiếu kiên nhẫn. Đây chính là NVIDIA Vera CPU."

Thế Hệ Máy Tính Cá Nhân Tiếp Theo

"Mô hình tính toán đại diện trong tương lai sẽ chạy trên đám mây AI, trong nội bộ doanh nghiệp, và cả trên chiếc PC của bạn."
"Hệ điều hành mới sẽ là hệ điều hành truyền thống cộng thêm mô hình ngôn ngữ lớn; về nhiều mặt, mô hình ngôn ngữ lớn chính là phiên bản hiện đại của DirectX — một phần mở rộng trí tuệ cho máy tính."
"Các ứng dụng truyền thống sẽ bị thay thế bởi môi trường chạy đại diện (agent runtime); ứng dụng hiện đại sẽ trở thành một đại diện."
"NVIDIA và Microsoft đang cùng nhau tái định nghĩa PC, đồng thời ra mắt thế hệ máy Windows mới bao phủ máy để bàn, máy tính xách tay và trạm làm việc."

AI Vật Lý, Xe Tự Hành Và Robot

"Dữ liệu huấn luyện mô hình ngôn ngữ đến từ góc nhìn của con người, nhưng robot cần hiểu thế giới từ góc nhìn của chính mình; vấn đề dữ liệu là thách thức lớn nhất đối với AI vật lý."
"Cosmos 3 là mô hình nền tảng tiên phong cho AI vật lý, có khả năng hiểu, suy luận, sinh nội dung, mô phỏng vòng kín (closed-loop simulation), thậm chí trở thành chính chiến lược."
"Khi đã có AI, bản thân tính toán cũng trở thành dữ liệu; bạn có thể dùng Cosmos 3 để huấn luyện thêm nhiều mô hình AI khác và nâng cấp nó thành mô hình chuyên biệt của riêng bạn."
"Dù là đại diện trên đám mây, trên PC, hệ thống xe tự hành hay robot hình người, mô hình tính toán nền tảng đều giống nhau: mô hình, khung, kỹ năng công cụ và môi trường chạy."

Jensen Huang Ca Ngợi Món Ăn Đài Loan Như Một Phần Thiết Yếu Trong Chuỗi Cung Ứng AI

Jensen Huang:

Quy mô hệ sinh thái Đài Loan ngày nay thật đáng kinh ngạc. Khi nói về hệ sinh thái, hầu hết mọi người thường nghĩ ngay đến ngăn xếp phần mềm của chúng ta — hệ sinh thái nhà phát triển xây dựng trên nền tảng hệ thống tính toán NVIDIA. Nhưng hệ sinh thái NVIDIA không chỉ dừng ở đó; nó vươn lên cao hơn, bao gồm toàn bộ chuỗi cung ứng Đài Loan — nơi mọi thứ bắt đầu; và vươn xuống thấp hơn, trải dài tới trung tâm dữ liệu, rồi cuối cùng đến người dùng cuối.

Hôm nay, chúng ta gần như sẽ thảo luận từng mắt xích trong hệ sinh thái này. Có quá nhiều người xứng đáng được cảm ơn. Tôi yêu hệ sinh thái này — nơi tập trung rất nhiều doanh nghiệp và cũng là nơi có những đối tác hệ sinh thái yêu thích nhất của tôi. Đài Loan sở hữu một hệ sinh thái vô cùng phong phú — đây là hệ sinh thái chuỗi cung ứng tốt nhất toàn cầu.

Kỷ Nguyên Đại Diện AI Đã Đến

Jensen Huang:

Hai năm trước khi tôi đến đây, tôi đã bắt đầu chia sẻ với quý vị về sự chuyển dịch của AI từ AI tạo sinh (generative AI) sang làn sóng tiếp theo — AI đại diện (agentic AI). Hôm nay, chúng ta có thể khẳng định rõ ràng: AI đại diện đã thực sự đến, và AI hữu ích đã thực sự đến.

Từ góc độ công nghiệp, điều này có nghĩa là nhu cầu về token đang tăng vọt. Bởi nếu AI thực sự có thể làm việc, con người sẽ muốn sản xuất nhiều hơn khả năng ấy. Token giờ đây đã trở thành đơn vị mang lại lợi nhuận, là đơn vị tạo ra doanh thu. Vì nó có thể tạo ra tiền, các công ty AI sẽ cố gắng xây dựng thêm token, tạo ra thêm token, và xây dựng thêm nhà máy AI — đó chính là lý do nhu cầu tính toán tại Đài Loan bùng nổ.

Đây cũng chính là lý do vì sao mọi người đều bận rộn và hoạt động kinh doanh rất tốt. Thực tế, điều này thậm chí còn phản ánh rõ nét trên giá cổ phiếu của một số công ty quý vị. Mô hình tính toán đã thay đổi — mọi thứ đều đã thay đổi.

Điểm trọng tâm thứ nhất: AI hữu ích đã thực sự đến, AI giờ đây là máy tạo lợi nhuận và cũng là máy tạo GDP. Đằng sau nó là một mô hình tính toán hoàn toàn mới — không chỉ là mô hình ngôn ngữ lớn, mà là đại diện. Tất cả nội dung hôm nay của chúng ta đều được xây dựng trên nền tảng này.

Hãy để tôi dành chút thời gian giải thích rõ hơn điều tôi đang nói đến. Đây là một đại diện — một ứng dụng đại diện. Trước đây, đây là ứng dụng phần mềm, là mã code, là hệ điều hành — tức là mã code của ứng dụng chạy trên hệ điều hành. Hôm nay, nó là đại diện, được cấu thành từ một hoặc nhiều mô hình ngôn ngữ lớn, và được đặt trong một khung đại diện. Khung này giúp phối hợp công việc của nó, khiến nó thực sự hoàn thành các nhiệm vụ có năng suất.

Khi đầu vào đi vào hệ thống, đại diện phải hiểu, quan sát, suy luận, hành động và sử dụng công cụ. Công cụ có thể là bảng tính điện tử, trình duyệt web, bộ xử lý dữ liệu hoặc bộ xử lý cơ sở dữ liệu. Mỗi lần luồng thông tin — dù là xử lý ngữ cảnh, hiểu điều gì đang xảy ra, suy luận bước tiếp theo nên làm gì, hay xây dựng kế hoạch có thể thực thi — đều cần một phần mềm nào đó để phối hợp.

Vì vậy, bản chất của đại diện chính là một hệ thống như vậy. Nó xử lý bộ nhớ ngắn hạn (bộ nhớ làm việc) và bộ nhớ dài hạn, giống như con người. Do đó, hệ thống quản lý bộ nhớ trở nên cực kỳ quan trọng. Toàn bộ hệ thống này gọi là đại diện. Mô hình ngôn ngữ lớn phụ trách tư duy, còn khung đại diện kết nối mọi thứ lại với nhau — giống như một hệ điều hành.

Đây chính là mô hình tính toán mới và cũng là lý do đại diện có thể hoàn thành những nhiệm vụ đáng kinh ngạc. Đây là một bước đột phá lớn: mô hình ngôn ngữ lớn giờ đây đã có thể suy nghĩ, suy luận, lập kế hoạch và sử dụng công cụ một cách xuất sắc; đồng thời, chúng ta cũng đã có khung đại diện có khả năng quản lý bộ nhớ, điều phối quy trình và gọi công cụ. Vì vậy, giờ đây chúng ta có thể làm được rất nhiều điều mà trước đây không thể.

Token Trong Nhà Máy AI Là Gì?

Jensen Huang:

Token, DSX, GPU, CPU, Vera… Chúng ta vừa ra mắt hệ thống thế hệ tiếp theo — Vera Rubin. Vera Rubin không phải một con chip, cũng không chỉ là GPU. Nó bắt đầu từ GPU, nhưng vượt xa hơn GPU. Toàn bộ hệ thống từ đầu đến cuối mới chính là Vera Rubin.

Hệ thống này bao gồm GPU, NVLink 72 dành riêng cho Vera Rubin, và được phối hợp bởi Vera CPU — loại CPU tôi sẽ giới thiệu sau. Nó cũng bao gồm hệ thống lưu trữ cách mạng Vera, bộ vi xử lý mạng CX9, ngăn xếp phần mềm DOCA của chúng ta, cũng như bộ xử lý bảo mật tích hợp. Mọi dữ liệu trong hệ thống — dù ở trạng thái tĩnh, đang được truyền tải hay đang được sử dụng — đều được mã hóa. Toàn bộ hệ thống đều an toàn, bởi mô hình AI vô cùng quý giá. Đó cũng là lý do toàn bộ hệ thống tuân thủ nguyên tắc tính toán bảo mật (confidential computing).

Bất kỳ thành phần nào trong các hệ thống này, khi tách riêng ra, đều đủ để tạo nên một cuộc cách mạng đầy đủ. Vera Rubin là dự án kỹ thuật tham vọng nhất trong lịch sử NVIDIA. Toàn bộ 40.000 kỹ sư của công ty đều tham gia vào dự án Vera Rubin, chưa kể đến sự đóng góp của quý vị trong việc sáng tạo toàn bộ hệ thống. Vera Rubin thực sự là một kỳ tích — nó không chỉ là một con chip, mà là một hệ thống gồm nhiều thành phần kết hợp chặt chẽ.

Và điều đó vẫn chưa hết. Từ lâu, NVIDIA từng là một công ty GPU; những năm gần đây, chúng ta dần tiến hóa thành một công ty hệ thống. Điều quý vị đang thấy hôm nay là hệ thống phức tạp nhất mà chúng ta từng thiết kế từ đầu. Nhưng cuối cùng, khách hàng và đối tác của chúng ta không muốn mua máy tính — họ muốn xây dựng nhà máy AI.

Đây chính là lý do NVIDIA bắt đầu chuyển đổi một lần nữa. Quý vị có thể thấy, rất nhiều công nghệ của chúng ta đã mở rộng tới quy mô cơ sở hạ tầng đầy đủ. Các đối tác của chúng ta cũng đang hoạt động ở quy mô cơ sở hạ tầng: nhà máy điện, hệ thống làm mát, nhà cung cấp lưới điện, cũng như nhiều doanh nghiệp công nghiệp — giờ đây đều trở thành một phần trong hệ sinh thái của chúng ta. Về cốt lõi, chúng ta cần xây dựng toàn bộ ngăn xếp công nghệ, giống như cách chúng ta từng xây dựng GPU, Grace Blackwell, NVLink 72; và giờ đây, chúng ta cần xây dựng hệ thống toàn ngăn xếp (full-stack system), để khách hàng có thể xây dựng cơ sở hạ tầng AI tuyệt vời.

Làm tốt điều này — hỗ trợ khách hàng xây dựng và triển khai nhà máy AI — trở nên cực kỳ quan trọng. Lý do rất đơn giản: tính toán chính là doanh thu, tính toán chính là lợi nhuận. Không có doanh thu và lợi nhuận, tức là đang chịu lỗ.

Quý vị cần hiểu một điều: khi một cơ sở hạ tầng AI được đưa vào vận hành, thời gian triển khai có thể nhanh hoặc chậm; thông lượng có thể cao hoặc thấp; tính linh hoạt và độ tin cậy có thể tốt hoặc kém; tuổi thọ hiệu quả có thể dài hoặc ngắn. Bởi khoản đầu tư này có thể lên tới 50–60 tỷ USD, thậm chí 100 tỷ USD, nên đường cong này cực kỳ quan trọng.

Đây cũng là lý do vì sao NVIDIA là một đối tác tuyệt vời. Chúng ta sở hữu năng lực tích hợp đầy đủ — không chỉ là một trang thuyết trình, mà là việc thực sự tạo ra toàn bộ cơ sở hạ tầng, kết nối mọi thứ lại với nhau, và tự mình triển khai quy mô lớn để đảm bảo hệ thống vận hành ổn định. Vì vậy, thời gian khởi tạo token đầu tiên, thời gian suy luận đầu tiên và thời gian khởi động huấn luyện đầu tiên của chúng ta đều nhanh hơn.

Thứ hai, thông lượng mỗi watt và số token mỗi watt của chúng ta đạt mức đẳng cấp thế giới. Lý do nằm ở chỗ chúng ta tích hợp mọi thứ, thiết kế mọi thứ từ đầu, mô phỏng toàn bộ hệ thống và áp dụng thiết kế đồng bộ tối ưu. Giống như tủ máy Vera Rubin vừa được trình diễn — mọi thiết kế đều nhằm đạt được thông lượng đáng kinh ngạc.

Nếu trung tâm dữ liệu hoặc nhà máy của quý vị có công suất điện 1 gigawatt, thì đó chính là giới hạn tuyệt đối — quý vị không thể có thêm bất kỳ năng lượng nào. Dưới giới hạn 1 GW, thông lượng mỗi watt chính là doanh thu, bởi mỗi token đều tạo ra lợi nhuận và mỗi token đều là doanh thu.

Đây chính là tương lai. Tính toán chính là doanh thu, hiệu năng mỗi watt chính là doanh thu của quý vị. Chỉ vì chip rẻ hơn mà chọn kiến trúc sai sẽ không chuyển hóa thành lợi ích thực sự; điều quý vị cần đảm bảo là doanh thu trên mỗi watt. Mua càng nhiều, quý vị càng kiếm được nhiều.

Tôi đứng trước quý vị hôm nay và có thể khẳng định: Vera Rubin đã đi vào sản xuất hàng loạt đầy đủ. Quy mô chuỗi cung ứng mà chúng ta xây dựng cho Vera Rubin gấp đôi so với Grace Blackwell. Trước đây, lắp ráp một tủ máy Grace Blackwell mất hai giờ, giờ đây chỉ cần năm phút. Vì vậy, không chỉ công suất cao hơn, mà thông lượng sản xuất cũng nhanh hơn rất nhiều — và chúng ta cần tất cả điều này để đáp ứng nhu cầu.

Hệ sinh thái này phi thường. Để hỗ trợ Grace Blackwell và chuẩn bị cho quá trình tăng tốc sản xuất Vera Rubin, hàng triệu foot vuông công suất sản xuất đã được đưa vào vận hành. Tôi xin chân thành cảm ơn quý vị. Vera Rubin đã đi vào sản xuất hàng loạt đầy đủ. Xin cảm ơn quý vị.

Giới Thiệu Hệ Thống Vera Rubin

Jensen Huang:

Vera Rubin không được xây dựng chỉ để phục vụ AI. Vera Rubin không chỉ được xây dựng để chạy AI, mà được thiết kế đặc biệt để vận hành đại diện. Đây là một hệ thống đại diện. Hãy tưởng tượng độ phức tạp của nó. Cũng chính vì vậy, đại diện là đột phá khoa học máy tính cuối cùng. Phải mất rất nhiều năm, nó mới thực sự khai phá tiềm năng và trở nên hữu ích. Máy tính có thể vận hành nó cũng xứng đáng là máy tính tiên tiến nhất thế giới.

Đây chính là Vera Rubin. Cùng xem xét kỹ hơn. Xin mời mang Vera Rubin lên sân khấu.

Đây là Vera Rubin, Vera Rubin NVLink 72. Đây là một phần trong hệ thống thế hệ tiếp theo; tại hội nghị GTC tới, tôi sẽ chia sẻ thêm chi tiết với quý vị; hôm nay, chúng ta còn rất nhiều nội dung cần thảo luận. Đây là tủ máy Vera CPU, chứa 256 nhân CPU, làm mát bằng chất lỏng toàn bộ. Tôi sẽ giới thiệu chi tiết về Vera sau. Đây là hệ thống xử lý lưu trữ BlueField Vera — cũng là hệ thống bảo mật. Tất nhiên, còn có mạng Mellanox của chúng ta — đây là CPO (co-packaged optics) đầu tiên trên toàn cầu. Đây chính là Vera Rubin — một tổ hợp công nghệ đáng kinh ngạc được tích hợp hoàn chỉnh.

Năm xưa, khi chúng ta phát triển Hopper, mục tiêu là huấn luyện sơ bộ (pre-training). Lúc đó, pre-training là ứng dụng quan trọng nhất và cũng là tải trọng lớn nhất mà chúng ta đối mặt. Sau đó, khi phát triển Grace Blackwell, nhiều người nói: "Jensen, NVIDIA rất giỏi pre-training, còn suy luận thì dễ thôi." Quý vị còn nhớ chứ? Lúc ấy, nhiều người khẳng định: "Suy luận rất dễ, chúng tôi cũng làm được."

Nhưng quý vị biết đấy, suy luận chính là tiền. Mô hình rất phức tạp, và việc đồng thời đạt hiệu suất cao về tốc độ phản hồi, tương tác nhanh và thông lượng lớn là vô cùng khó khăn. Đó chính là lý do chúng ta tạo ra NVLink 72.

Hôm nay, chi phí token của NVIDIA là thấp nhất thế giới. Không phải thấp hơn 10%, mà thấp hơn nhiều lần — thậm chí chênh lệch cả cấp độ. Tất cả điều này đều nhờ thiết kế đồng bộ tối ưu, nhờ chúng ta hiểu rõ mô hình và mẫu tính toán của suy luận, và nhờ NVLink 72.

Với Vera Rubin, chúng ta đã vượt xa hơn suy luận. Giờ đây là suy luận trong hệ thống đại diện. Đây chính là Vera Rubin. Không dây cáp, không ống dẫn, không quạt. Lần trước tôi trình diễn nó, dây cáp khắp nơi.

VERA CPU: CPU Cho Đại Diện AI

Jensen Huang:

Vera CPU là CPU được xây dựng cho kỷ nguyên AI. Cho đến nay, mọi CPU đều được thiết kế cho con người. Trước đây, chúng ta là người dùng, cũng là người thuê. Con người sử dụng CPU trong một thế giới được đo bằng giây. Chúng ta thuê CPU trên đám mây, và số nhân CPU càng nhiều thì tài nguyên cho thuê càng lớn. Cảnh quan ứng dụng và kinh tế học của CPU cũ hoàn toàn khác biệt so với đại diện.

Đại diện không có kiên nhẫn. Thế giới của chúng không được đo bằng giây, mà bằng nanogiây. Khi sử dụng công cụ, chúng mong muốn phản hồi càng nhanh càng tốt; khi truy cập cơ sở dữ liệu, chúng kỳ vọng kết quả trả về ngay lập tức. Mỗi khoảnh khắc đại diện phải chờ đợi là một rào cản ngăn chúng tiến tới bước tiếp theo, rồi bước tiếp theo nữa, và tiếp tục như vậy. Vì vậy, chúng ta buộc phải thiết kế CPU có độ trễ thấp nhất có thể và khả năng tương tác cao nhất có thể.

Đây chính là lý do chúng ta tạo ra Vera CPU cho kỷ nguyên AI. Trong hệ thống của chúng ta, nó có ba vai trò. Thứ nhất, dĩ nhiên là dùng để "suy nghĩ" trong Vera Rubin. Trong tủ máy Vera Rubin, đã có hai CPU. Quý vị biết đấy, chúng ta đang sản xuất và bán hàng triệu tủ máy Vera Rubin, cũng như đã bán hàng triệu tủ máy Grace Blackwell. NVIDIA hiện là một trong những nhà sản xuất CPU lớn nhất thế giới.

Hai CPU trong tủ máy Vera Rubin có chức năng khác nhau: một CPU dùng để phối hợp và quản lý GPU, quản lý bộ nhớ đệm KV (KV cache), cũng như xử lý các phần mềm chạy trong tủ máy. Chúng ta còn có Grace BlueField để đảm bảo an ninh và cô lập. Còn phần tính toán Vera thì dùng cho khung đại diện — phụ trách phối hợp mô hình AI, sử dụng công cụ và truy cập cơ sở dữ liệu.

Máy chủ dữ liệu ở đây là Vera BlueField — máy chủ lưu trữ nhanh nhất thế giới và cũng là hệ thống lưu trữ nhanh nhất thế giới. Nó cực kỳ quan trọng, bởi đại diện truy cập bộ nhớ với tốc độ cực cao. Máy chủ lưu trữ và CPU giờ đây đã nằm trên đường dẫn then chốt — phần đắt đỏ nhất trong trung tâm dữ liệu.

Lý do phần này đắt đỏ là có căn cứ vững chắc. Kinh tế học của nhà máy AI xoay quanh token, và token được tạo ra chính tại đây. Vì vậy, quý vị dĩ nhiên muốn sản xuất và tạo ra càng nhiều token càng tốt. Giá trị kinh tế đều tập trung tại đây, và CPU cũng như hệ thống lưu trữ tuyệt đối không được trở thành điểm nghẽn.

Vì vậy, Vera CPU gây áp lực rất lớn lên kiến trúc CPU — và cũng là lý do chúng ta phải thiết kế lại kiến trúc từ đầu. Đây là một CPU chưa từng tồn tại trên thế giới, chúng ta gọi nó là Vera. Đây là CPU được thiết kế riêng cho đại diện. Tất cả các CPU trước đây đều được thiết kế cho con người; CPU này được thiết kế riêng cho đại diện.

Thứ nhất, IPC (số lệnh thực thi mỗi chu kỳ) của Vera phải cực kỳ mạnh, bởi chúng ta cần giảm độ trễ và rút ngắn thời gian xử lý. Chúng ta cần hiệu năng luồng đơn (single-thread performance), chứ không chỉ đơn thuần là thông lượng. Hiệu năng luồng đơn phải đạt đẳng cấp thế giới — phải là tốt nhất. Vì vậy, IPC của Vera cực kỳ cao — mức cao nhất toàn cầu: mỗi chu kỳ đồng hồ có thể lấy, giải mã và thực thi tới 10 lệnh.

Thứ hai, băng thông cần thiết để CPU truyền dữ liệu vào/ra phải đạt đẳng cấp thế giới. Điều này bao gồm cả băng thông trên mỗi nhân và tổng băng thông. Như tôi đã nói, hệ thống đại diện về bản chất là phân tán và tách rời. Khi tính toán được tách rời và triển khai phân tán, mạng lưới trở thành vấn đề then chốt. Vì vậy, chúng ta phải di chuyển dữ liệu giữa các nhân CPU, giữa CPU và bộ lưu trữ, cũng như giữa CPU và GPU nhanh nhất có thể.

Cả băng thông xung quanh hệ thống lẫn băng thông bên trong nhân CPU đều phải đạt đẳng cấp thế giới, bởi các nhân CPU đang liên lạc với nhau bằng băng thông cực cao. Chúng không được cho thuê từng nhân một, mà hoạt động phối hợp đồng bộ. Băng thông cắt ngang (cross-sectional bandwidth) của Vera thật đáng kinh ngạc. Đây là hệ thống đầu tiên hỗ trợ PCI Express Gen 6, đồng thời cũng là hệ thống đầu tiên trang bị LPDDR5 với băng thông đạt 1,2–2 TB/giây — cao gấp 2–3 lần so với CPU hiệu năng cao nhất hiện nay.

Đây là CPU được thiết kế riêng cho đại diện. Thị trường này chắc chắn sẽ lớn hơn thị trường trước đó, bởi số lượng đại diện sẽ vượt xa số lượng con người — và đại diện cực kỳ thiếu kiên nhẫn. Đây chính là NVIDIA Vera CPU.

Mô Hình Tính Toán Quan Trọng Nhất Trong Thập Kỷ Tới

Jensen Huang:

Đây thực sự là trang quan trọng nhất. Kết luận cốt lõi ở đây là: đây chính là mô hình ứng dụng và mô hình tính toán trong thập kỷ tới. Đại diện, khung đại diện và mô hình ngôn ngữ lớn được khung điều phối — mọi công ty đều sẽ vận hành nó. Mọi công ty đều sẽ trở thành công ty đại diện, mọi công ty đều sẽ có đại diện vận hành bên trong tổ chức mình, và mọi công ty đều sẽ nhận ra rằng đại diện cần một hệ điều hành riêng.

Mọi công ty đều đang hỏi chúng tôi: Làm thế nào để vận hành đại diện một cách an toàn? Làm thế nào để xây dựng đại diện phù hợp với khối lượng công việc của riêng mình? Vì vậy, chúng tôi có Bộ công cụ đại diện AI doanh nghiệp NVIDIA. Thực tế, quý vị đã chứng kiến tôi từng bước công khai xây dựng nó.

Gần như mọi việc NVIDIA làm đều được quý vị biết rõ. Nếu quý vị xem lại bài phát biểu GTC của tôi cách đây 5 hoặc 10 năm, quý vị sẽ thấy tôi đã nói về những điều hôm nay trong nhiều năm qua — bởi chúng tôi luôn chuẩn bị cho khoảnh khắc này.

Để xây dựng dịch vụ đại diện (agent-as-a-service) hoặc đại diện phục vụ vận hành, doanh nghiệp cần bốn yếu tố. Thứ nhất, cần mô hình. Dĩ nhiên, mô hình ngôn ngữ lớn càng thông minh, càng rẻ và càng nhanh thì càng tốt. Thứ hai, cần một khung để điều phối toàn bộ hệ thống. Thứ ba, các mô hình muốn sử dụng công cụ — và các công cụ này mang theo kỹ năng. Tôi vừa trình diễn thư viện CUDA-X, chúng sẽ trở thành công cụ mạnh mẽ cho đại diện trong tương lai. Thứ tư, cần một môi trường chạy (runtime) — tức là hệ điều hành kết nối mọi thứ lại với nhau.

Đây chính là Bộ công cụ đại diện NVIDIA. Nó bao gồm các mô hình có thể tùy chỉnh — tức là các mô hình mã nguồn mở đẳng cấp thế giới của NVIDIA. Tôi còn muốn trình diễn thêm. Quý vị có thể chạy đại diện từ bất kỳ đâu, ví dụ như đại diện mạnh mẽ Claude Code hoặc Codex. Quý vị có thể đưa chúng vào một khung tên là Open Shell để vận hành một cách cực kỳ an toàn trong nội bộ doanh nghiệp.

Shell này bảo vệ đại diện, đảm bảo nó luôn tuân thủ các chính sách bảo mật. Riêng tư được bảo vệ, quyền hạn và đặc quyền được phân bổ rõ ràng, và danh tính cũng được bảo vệ. Vì vậy, Open Shell đang được áp dụng trên toàn cầu. NVIDIA Open Shell là mã nguồn mở, và quý vị sẽ thấy nhiều công ty đang áp dụng nó — bao gồm Red Hat, Canonical và Microsoft. Nó sẽ được áp dụng ở mọi nơi.

Đây là một môi trường chạy quan trọng, và nó được tối ưu hóa hoàn toàn cho nền tảng AI NVIDIA phổ biến khắp nơi. Quý vị có thể chạy Open Shell trên mọi đám mây, trong môi trường cục bộ, thậm chí trên thiết bị đầu cuối. Giờ đây, quý vị đã có các công cụ và thư viện mà đại diện có thể sử dụng, có các mô hình có thể tùy chỉnh hoặc sử dụng trực tiếp, và cũng có khung đại diện. Các khung đại diện này giờ đây có thể chạy cục bộ hoặc ở bất kỳ đâu.

Một trong những ứng dụng đại diện yêu thích của tôi là nhà thiết kế vi mạch. Đây là một trong những công việc quan trọng nhất của NVIDIA. Vì vậy, chúng tôi tất nhiên hợp tác với Cadence để xây dựng một "siêu đại diện" thiết kế vi mạch. Siêu đại diện này được điều phối bởi Codex hoặc Claude Code, nhận đầu vào là RTL, sơ đồ kiến trúc, sơ đồ mạch hoặc đặc tả kỹ thuật, và giúp quý vị sửa chữa những phần cần được khắc phục. Chúng tôi đã cùng nhau xây dựng một số siêu đại diện và tối ưu hóa chúng cho môi trường chạy NVIDIA bằng Nemotron.

NVIDIA cam kết xây dựng các mô hình mở cho thế giới, để quý vị và tất cả chúng ta đều có thể tạo ra đại diện riêng. Hôm nay, chúng tôi công bố Nemotron 3 Ultra — mô hình mở thế hệ tiếp theo của chúng tôi, và vô cùng thông minh. Mô hình Nemotron không chỉ cung cấp mô hình, mà còn cung cấp toàn bộ dữ liệu chúng tôi dùng để huấn luyện mô hình.

Bởi chúng tôi sở hữu một liên minh đối tác mạnh mẽ, quý vị có thể thấy tất cả các đối tác được liệt kê ở đây. Chúng tôi cùng nhau hợp tác và đóng góp dữ liệu. Nhờ những mối quan hệ hợp tác tuyệt vời này, từ mô hình, kịch bản huấn luyện đến dữ liệu — tất cả đều được mở hoàn toàn cho quý vị. Đây là hình thức mô hình mở tốt nhất, cũng là chính sách hệ thống mô hình mở tốt nhất thế giới. Mục tiêu rất đơn giản: quý vị có thể lấy toàn bộ nội dung này, tiếp tục cải tiến trên nền tảng đó để làm cho nó tốt hơn, và biến nó thành mô hình riêng của quý vị.

Nemotron 3 Ultra nhanh hơn 5 lần, chi phí giảm 30% và hoàn toàn mã nguồn mở. Chúng tôi kiên định với điều này. Đây là Nemotron 3, và hiện chúng tôi cũng đang phát triển Nemotron 4. Chính bộ công cụ đầy đủ gồm mô hình, khung, kỹ năng công cụ và môi trường chạy này sẽ giúp mọi doanh nghiệp trên toàn cầu — giống như Cadence sử dụng siêu đại diện — tạo ra đại diện riêng của mình.

Thế Hệ Máy Tính Cá Nhân Mới Của NVIDIA

Jensen Huang:

Microsoft và NVIDIA sẽ cùng tái định nghĩa PC. Đây sẽ là PC mới. Đêm mai — tức là đêm mai tại đây — tôi sẽ cùng Satya chia sẻ thêm về công việc mà chúng tôi đã cùng nhau thúc đẩy trong ba năm qua. Microsoft và NVIDIA đã dành rất nhiều thời gian để suy nghĩ lại hoàn toàn cách vận hành PC, nhằm chuẩn bị sẵn sàng cho khoảnh khắc này.

Như tôi đã đề cập trước đây, mô hình tính toán đại diện sẽ chạy trên đám mây AI, trong nội bộ doanh nghiệp, và cả trên chiếc PC của quý vị. Khi PC sở hữu một đại diện tự chủ, điều gì sẽ xảy ra? Nó sẽ hỗ trợ quý vị, hiểu quý vị. Quý vị có thể trò chuyện với nó, nó có thể nhìn thấy quý vị. Quý vị có thể yêu cầu nó đọc tài liệu, giúp quý vị nghiên cứu. Nó còn có thể làm nhiều việc hơn nữa — tôi sẽ trình diễn sau.

Hệ điều hành mới dĩ nhiên là hệ điều hành cũ cộng thêm mô hình ngôn ngữ lớn. Về nhiều mặt, mô hình ngôn ngữ lớn chính là phiên bản hiện đại của DirectX. Nó có đầu vào và đầu ra, hiểu prompt, hiểu thị giác máy tính, có thể sinh video và âm thanh. Đây là phần mở rộng trí tuệ hiện đại cho PC và cho máy tính nói chung.

Ở trên nền tảng này, như tôi đã nói trước đây, các ứng dụng truyền thống sẽ bị thay thế bởi môi trường chạy đại diện, và ứng dụng hiện đại chính là đại diện.

Thưa quý vị, đây là máy tính xách tay NVIDIA RTX Spark. Cảm ơn. Tôi mang quá nhiều thứ trong túi. Được rồi, đây là con chip đáng kinh ngạc nhất thế giới. Đây là N1X — sản phẩm hợp tác giữa chúng tôi và MediaTek. Tôi vừa nhìn thấy Rick. Đây là N1X, một con chip tuyệt đẹp. Thẳng thắn mà nói, đây là con chip cần 33 năm để xây dựng.

Lý do là toàn bộ ngăn xếp phần mềm NVIDIA 100% đều có thể chạy trên đó. Quý vị muốn làm sinh học kỹ thuật số? Không vấn đề. Muốn xử lý dữ liệu địa chấn? Không vấn đề. Muốn nghiên cứu thiên văn học? Không vấn đề. Mọi thứ liên quan đến CUDA, mọi lĩnh vực vật lý, sinh học, genomics và AI đều không vấn đề. Toàn bộ đồ họa máy tính cũng không vấn đề.

Mọi ứng dụng mà NVIDIA từng tạo ra, cũng như mọi ứng dụng từng chạy trên Windows, đều đã được Microsoft và NVIDIA tối ưu hóa tỉ mỉ để chiếc máy tính này thực sự có thể chạy mọi thứ mà thế giới từng sáng tạo. Ngoài ra, nó còn có thể chạy đại diện. Đây là một chiếc máy tính đáng kinh ngạc, và tôi rất tự hào về nó.

Chiếc máy tính này có thể chạy mô hình Nemotron 3 Ultra cục bộ hoặc mô hình siêu mạnh Nemotron 3; cũng có thể kết nối với Claude Code, Codex hoặc các mô hình khác trên đám mây; hoặc kết nối với các mô hình trên mạng. Nó sẽ hoạt động và hoàn thành những việc đáng kinh ngạc. RTX Spark là sự tái định nghĩa máy tính xách tay, nhưng thực tế, Microsoft và NVIDIA đang tái định nghĩa toàn bộ PC.

Hôm nay, chúng tôi công bố một dòng sản phẩm hoàn toàn mới: ba chiếc máy Windows cách mạng, bao phủ máy để bàn, máy tính xách tay và trạm làm việc. Chúng 100% tương thích với Windows, 100% hỗ trợ CUDA và 100% được trang bị NVIDIA AI Tensor Core. Mọi thứ quý vị từng thấy chạy trên mọi nền tảng NVIDIA trên toàn cầu đều có thể chạy trên đây.

Chúng tôi đã chuẩn bị lộ trình cho điều này. Đây là một gia đình sản phẩm hoàn toàn mới. Với mỗi thế hệ kiến trúc, chúng tôi sẽ có máy để bàn, máy tính xách tay và trạm làm việc; thế hệ tiếp theo cũng sẽ vẫn gồm máy để bàn, máy tính xách tay và trạm làm việc. Tôi vô cùng vui mừng và vinh dự khi toàn bộ ngành công nghiệp PC toàn cầu — 100% — đã cùng gia nhập chúng tôi để tái định nghĩa PC. Đây là một dòng sản phẩm mới, cũng là một khởi đầu mới.

Cosmos 3: Mô Hình Nền Tảng Cho AI Vật Lý

Jensen Huang:

Trong bối cảnh mô hình ngôn ngữ, dữ liệu tiếng Anh và các ngôn ngữ khác mà chúng ta huấn luyện trên Internet đều xuất phát từ góc nhìn của con người. Chúng được con người viết ra và cũng được con người đọc. Tuy nhiên, để tạo dữ liệu cho robot AI, chúng ta phải xuất phát từ giác quan và góc nhìn của chính robot. Phần lớn dữ liệu video trên thế giới là góc nhìn người thứ ba (third-person), chứ không phải góc nhìn người thứ nhất (first-person).

Vì vậy, vấn đề dữ liệu là thách thức lớn nhất đối với hệ thống đại diện, hệ thống robot và AI vật lý. Quý vị đã thấy chúng tôi từng bước tiến lên bậc thang này. Chúng tôi bắt đầu từ điều khiển từ xa (teleoperation), về bản chất là minh họa bởi con người. Điều này không khác gì đột phá phản hồi của con người trong học tăng cường (reinforcement learning). Sau đó, chúng tôi sử dụng mô phỏng — đây chính là lúc Omniverse phát huy tác dụng. Điều này cũng tương tự như phần thưởng có thể xác minh trong học tăng cường.

Chúng tôi dùng các hệ thống này để khởi tạo mô hình AI, khởi tạo mô hình AI vật lý. Cuối cùng, chúng tôi có thể học từ góc nhìn người thứ ba và tái chiếu lại dưới góc nhìn người thứ nhất. Thông qua quy trình khởi tạo này, cuối cùng chúng tôi sở hữu một mô hình nền tảng thế giới, có khả năng hiểu thế giới vật lý từ bất kỳ góc nhìn nào quý vị mong muốn: người thứ ba, người thứ nhất, từ ngoài vào trong, từ trong ra ngoài — đều được. Đây thực sự là một bước đột phá lớn.

Hôm nay, chúng tôi công bố Cosmos 3. Cosmos 3 là tiên phong trong AI vật lý. Chúng ta đang dẫn đầu trong mô hình ngôn ngữ, và nhiều người cũng đang nghiên cứu mô hình ngôn ngữ. Nhưng trong AI vật lý, chúng ta chắc chắn là mạnh nhất toàn cầu. Tôi vô cùng tự hào về đội ngũ đã làm được điều này.

Đây là mô hình nền tảng cho mọi công việc của quý vị. Dù quý vị muốn tạo robot, robot nhà máy hay robot làm việc trong nhà máy — bất kỳ công việc nào liên quan đến thế giới vật lý — giờ đây quý vị đều có một người bạn đồng hành: Cosmos 3. Nó có thể hiểu và suy luận, có thể sinh nội dung, có thể mô phỏng vòng kín và thậm chí có thể trở thành chính chiến lược. Nó dẫn đầu trên mọi bảng xếp hạng toàn cầu. Tôi vô cùng tự hào về Cosmos. Hôm nay, chúng tôi công bố Cosmos 3.

Trước đây, dữ liệu cộng tính toán tạo ra AI. Giờ đây, khi đã có AI, chính tính toán cũng trở thành dữ liệu. Vì vậy, hãy dùng Cosmos 3 để huấn luyện một loạt mô hình AI. Cosmos là một hệ thống mô hình mở xuất sắc, hoàn toàn giống như Nemotron. Chúng tôi mở mô hình, mở dữ liệu, thậm chí mở cả phương pháp huấn luyện, để quý vị có thể nâng cấp nó cho riêng mình và biến Cosmos thành mô hình chuyên biệt của quý vị.

Alpamayo 2: Suy Luận Cho Xe Tự Hành

Jensen Huang:

Hôm nay, chúng tôi công bố Alpamayo 2 — một mô hình mở dành riêng cho ô tô tự hành. Chúng tôi đang hợp tác với các hãng xe toàn cầu. Nếu quý vị xem danh sách các thương hiệu đã gia nhập NVIDIA Hyperion và đang phát triển ô tô NVIDIA Hyperion, chúng đại diện khoảng 80% ô tô toàn cầu. Nói cách khác, các nhà sản xuất này chiếm khoảng 80% ô tô toàn cầu.

Trong tương lai sẽ có rất nhiều hệ thống NVIDIA Hyperion, có khả năng chạy Alpamayo cũng như bất kỳ ngăn xếp công nghệ xe tự hành nào khác. Chúng tôi cũng kết nối với các dịch vụ di chuyển. Khoảng 97% dịch vụ di chuyển toàn cầu hiện đang kết nối với chúng tôi. Vì vậy, khi triển khai Alpamayo trên môi trường chạy Hyperion và hệ điều hành Halos, chúng tôi có thể kết nối với toàn bộ các dịch vụ này trên toàn cầu.

Isaac GR00T: Robot Hình Người

Jensen Huang:

NVIDIA Isaac GR00T là ngăn xếp công nghệ robot hình người của chúng tôi, bao gồm mô hình, tạo dữ liệu, mô phỏng, môi trường chạy và hệ điều hành. Nó đại diện cho nền tảng GR00T — tức là nền tảng Isaac GR00T.

Quý vị có thể thấy, mỗi hệ thống của chúng tôi đều tuân theo cùng một mẫu hoàn toàn: dù là hệ thống đại diện trên đám mây, trên PC, hệ thống robot xe tự hành hay hệ thống robot hình người — đều là cùng một mẫu.

Dĩ nhiên, trong từng trường hợp, chúng tôi đều xây dựng đầy đủ mọi thứ. Chúng tôi thực hiện tích hợp dọc (vertical integration), tích hợp hoàn chỉnh, thiết kế đồng bộ và thiết kế đồng bộ tối ưu — rồi mở toàn bộ ra để mọi người có thể sử dụng bất kỳ phần nào theo nhu cầu. Quý vị muốn sử dụng gì, chúng tôi thậm chí còn hỗ trợ quý vị sửa đổi.

Nhưng hiện vẫn còn thiếu một điều: hệ thống robot cần một nền tảng tham chiếu. Các hệ thống robot quá phức tạp — với rất nhiều động cơ và cảm biến, và cũng rất dễ hư hỏng. Tuy nhiên, chúng ta cần một cách để cung cấp các nền tảng tham chiếu này. Giống như cách chúng ta đã làm cho PC, DGX, đám mây và ô tô tự hành, giờ đây chúng ta cũng sẽ làm điều tương tự cho robot.

Hôm nay, chúng tôi công bố NVIDIA Isaac GR00T — một nền tảng tham chiếu robot hình người được tích hợp hoàn chỉnh. Mỗi bàn tay có 25 bậc tự do, thân robot có 31 bậc tự do, cao 6 feet (khoảng 1,83 mét), nặng 150 pound (khoảng 68 kg). Giống tôi, chỉ khác là con số đầu tiên nhỏ hơn tôi, con số thứ hai lớn hơn tôi, còn lại thì khá giống nhau.

Nền tảng này chạy vi xử lý Thor mới, cùng toàn bộ ngăn xếp phần mềm, ngăn xếp tạo dữ liệu, ngăn xếp mô phỏng dữ liệu và môi trường chạy của chúng tôi. Mọi thứ đều được tích hợp vào một nền tảng robot để tất cả mọi người sử dụng. Chúng tôi xây dựng nền tảng này dành riêng cho giáo dục đại học và các nhà nghiên cứu đại học, bởi với họ, việc tự xây dựng nền tảng như vậy là quá khó khăn.

Tổng Kết Và Đánh Giá Lại

Jensen Huang:

Trong sáu tháng qua, ngành công nghiệp máy tính đã bị thay đổi hoàn toàn. Sự thay đổi xảy ra bởi đại diện cuối cùng đã được hiện thực hóa và hội tụ với các mô hình tiên tiến nhất, khiến AI giờ đây thực sự có thể làm những việc hữu ích.

Mô hình tính toán này sẽ lặp lại đi lặp lại: một đại diện gồm mô hình và khung, sử dụng các công cụ mang kỹ năng, và chạy trên một môi trường chạy nhất định. Môi trường chạy phụ thuộc vào việc nó chạy trên đám mây, trong môi trường doanh nghiệp cục bộ, trên PC hay trên robot. Nhưng mô hình tính toán hoàn toàn giống nhau.

Quý vị sẽ sử dụng các khung khác nhau theo sở thích, cũng như các mô hình khác nhau theo sở thích. Quý vị sẽ cải tiến chúng cho mục đích chuyên biệt của riêng mình. Quý vị sẽ tạo ra các siêu đại diện, cho thuê chúng cho người khác, giúp người khác hoàn thành công việc. Chính nền tảng đại diện và mô hình đại diện này là điều Bộ công cụ AI doanh nghiệp NVIDIA hướng đến hỗ trợ. Với quý vị, đây là một cách tuyệt vời để tham gia vào AI; với chúng tôi, đây cũng là một cơ hội tăng trưởng khổng lồ.

Vera Rubin đã đi vào sản xuất hàng loạt đầy đủ. Grace Blackwell được thiết kế để xử lý AI, đặc biệt là suy luận; Vera Rubin được thiết kế để vận hành đại diện. Nó đã đi vào sản xuất hàng loạt đầy đủ. Nó xa hơn rất nhiều so với một GPU — mà là một hệ thống xử lý đại diện phân tán và tách rời hoàn chỉnh.

NVIDIA thực sự đã trở thành một công ty cơ sở hạ tầng. Không chỉ là công ty GPU, không chỉ là công ty hệ thống, mà là công ty cơ sở hạ tầng. Mục tiêu của chúng tôi là giúp quý vị tạo ra doanh thu và lợi nhuận lớn nhất, và đạt được điều đó nhanh nhất có thể.

Trong thế giới đại diện, cách tính toán mới này có nghĩa là CPU cũng phải được xây dựng cho đại diện — chứ không phải cho con người. CPU dành riêng cho đại diện có những yêu cầu đặc biệt riêng. NVIDIA Vera của chúng tôi là một cuộc cách mạng. Tôi rất vui khi thấy tốc độ tăng trưởng và đơn đặt hàng của nó — nó sẽ trở thành sản phẩm ra mắt nhanh nhất và thành công nhất trong lịch sử NVIDIA.

NVIDIA và Microsoft đã tạo ra một dòng PC hoàn toàn mới. Đây là một khởi đầu mới. Dĩ nhiên, cùng mô hình xử lý đại diện và mô hình tính toán đại diện mà tôi vừa mô tả cũng sẽ chạy trên nhiều thiết bị khác nhau. Tôi đã đề cập đến PC, nhưng trong tương lai nó sẽ xuất hiện trên robot, vệ tinh, trạm gốc, nhà máy, đám mây, môi trường cục bộ và thiết bị biên. Hệ thống AI đại diện và mô hình tính toán đại diện này sẽ được sao chép lặp đi lặp lại trên mọi máy tính. Cách chúng ta hiểu về máy tính cá nhân có thể sẽ thay đổi.

Chào mừng tham gia cộng đồng chính thức TechFlow

Nhóm Telegram:https://t.me/TechFlowDaily

Tài khoản Twitter chính thức:https://x.com/TechFlowPost

Tài khoản Twitter tiếng Anh:https://x.com/BlockFlow_News

Liên kết gốc

Thêm vào mục ưa thích

Chia sẻ lên mạng xã hội

Tác giả

深潮 TechFlow

深潮TechFlow

Diễn thuyết của Huang Renxun tại Hội nghị GTC Taipei năm 2026: Kỷ nguyên của các tác nhân AI đã đến, tính toán chính là doanh thu

Tuyển chọn TechFlowTuyển chọn TechFlow

Diễn thuyết của Huang Renxun tại Hội nghị GTC Taipei năm 2026: Kỷ nguyên của các tác nhân AI đã đến, tính toán chính là doanh thu

Tóm Tắt Các Điểm Trọng Tâm