
Bài phát biểu mới nhất của Huang Renxun tại CES: AI Agent có tiềm năng trở thành ngành công nghiệp robot tiếp theo, quy mô có thể đạt hàng chục nghìn tỷ USD
Tuyển chọn TechFlowTuyển chọn TechFlow

Bài phát biểu mới nhất của Huang Renxun tại CES: AI Agent có tiềm năng trở thành ngành công nghiệp robot tiếp theo, quy mô có thể đạt hàng chục nghìn tỷ USD
NVIDIA đang đưa AI từ đám mây đến các thiết bị cá nhân và cơ sở doanh nghiệp, đáp ứng mọi nhu cầu tính toán từ nhà phát triển đến người dùng thông thường.
Biên tập: Youxin

Tại CES 2025 khai mạc sáng nay, ông Jensen Huang – nhà sáng lập và CEO của NVIDIA – đã có bài phát biểu chủ đề mang tính bước ngoặt, vén màn tương lai của AI và điện toán. Từ khái niệm token cốt lõi trong AI sinh tạo đến việc ra mắt GPU kiến trúc Blackwell hoàn toàn mới, và tầm nhìn về một tương lai kỹ thuật số do AI dẫn dắt, bài phát biểu này sẽ định hình sâu sắc toàn ngành công nghiệp với góc nhìn xuyên lĩnh vực.

1) Từ AI sinh tạo đến Agentic AI: Mở màn cho một kỷ nguyên hoàn toàn mới
-
Sự ra đời của Token: Là động lực cốt lõi của AI sinh tạo, token biến văn bản thành tri thức, thổi hồn vào hình ảnh, mở ra phương thức biểu đạt kỹ thuật số hoàn toàn mới.
-
Hành trình tiến hóa của AI: Từ AI nhận thức, AI sinh tạo đến Agentic AI có khả năng suy luận, lập kế hoạch và hành động – công nghệ AI không ngừng vươn tới những đỉnh cao mới.
-
Cách mạng Transformer: Kể từ khi ra mắt năm 2018, công nghệ này đã định nghĩa lại cách thức tính toán, lật đổ hoàn toàn các nền tảng kỹ thuật truyền thống.
2) GPU Blackwell: Vượt qua giới hạn hiệu năng
-
Dòng GeForce RTX 50 thế hệ mới: Dựa trên kiến trúc Blackwell, sở hữu 92 tỷ bóng bán dẫn, hiệu năng AI đạt 4000 TOPS và sức mạnh xử lý 4 PetaFLOPS – gấp ba lần thế hệ trước.
-
Sự kết hợp giữa AI và đồ họa: Lần đầu tiên tích hợp shader lập trình được với mạng thần kinh, giới thiệu công nghệ nén kết cấu thần kinh (neural texture compression) và tô màu vật liệu bằng AI, mang lại hiệu ứng render ấn tượng.
-
Phổ cập hiệu năng cao: RTX 5070 dành cho laptop với giá $1299 đạt hiệu năng ngang RTX 4090, thúc đẩy sự phổ biến của điện toán hiệu năng cao.
3) Mở rộng đa lĩnh vực ứng dụng AI
-
AI Agent doanh nghiệp: NVIDIA cung cấp các công cụ như Nemo và Llama Nemotron giúp doanh nghiệp xây dựng "nhân viên số" tự suy luận, hiện thực hóa quản lý và dịch vụ thông minh.
-
Physic AI: Thông qua nền tảng Omniverse và Cosmos, AI được tích hợp vào công nghiệp, ô tô tự hành và robot, tái định nghĩa sản xuất và logistics toàn cầu.
-
Các kịch bản tính toán tương lai: NVIDIA đang đưa AI từ đám mây đến thiết bị cá nhân và nội bộ doanh nghiệp, bao phủ mọi nhu cầu tính toán từ nhà phát triển đến người dùng phổ thông.
Dưới đây là nội dung chính bài phát biểu của ông Jensen Huang:
Đây là nơi trí tuệ được khai sinh, một nhà máy hoàn toàn mới – cỗ máy phát điện tạo ra token. Nó là khối xây dựng của AI, mở ra một lĩnh vực mới, đồng thời là bước đi đầu tiên vào một thế giới phi thường. Token biến văn bản thành tri thức, thổi hồn vào hình ảnh; chúng biến ý tưởng sáng tạo thành video, giúp ta điều hướng an toàn trong mọi môi trường; dạy robot di chuyển như bậc thầy, và truyền cảm hứng để ta ăn mừng chiến thắng theo những cách hoàn toàn mới. Trong lúc ta cần nhất, token còn có thể mang lại bình yên trong tâm trí. Chúng trao ý nghĩa cho dữ liệu kỹ thuật số, giúp ta hiểu thế giới tốt hơn, dự đoán các mối nguy tiềm tàng và tìm ra cách chữa trị những đe dọa bên trong. Nó biến tầm nhìn của ta thành hiện thực, sửa chữa những gì ta đã mất.
Tất cả bắt đầu từ năm 1993, khi NVIDIA ra mắt sản phẩm đầu tiên – NV1. Chúng tôi muốn tạo ra những chiếc máy tính có thể làm những điều mà máy tính thông thường không thể, biến PC thành một cỗ máy chơi game. Sau đó, năm 1999, NVIDIA phát minh ra GPU lập trình được, khởi đầu hơn 20 năm tiến bộ công nghệ, khiến đồ họa máy tính hiện đại trở nên khả thi. Năm năm sau, chúng tôi giới thiệu CUDA, sử dụng các thuật toán phong phú để biểu đạt khả năng lập trình của GPU. Công nghệ này ban đầu khó giải thích, nhưng đến năm 2012, thành công của AlexNet đã chứng minh tiềm năng của CUDA, thúc đẩy bước đột phá trong AI.
Kể từ đó, AI phát triển với tốc độ đáng kinh ngạc. Từ AI nhận thức, đến AI sinh tạo, rồi đến Agentic AI có khả năng cảm nhận, suy luận, lập kế hoạch và hành động – năng lực của AI không ngừng tăng lên. Năm 2018, Google ra mắt Transformer, thế giới AI thực sự cất cánh. Transformer không chỉ thay đổi hoàn toàn diện mạo của AI mà còn định nghĩa lại toàn bộ lĩnh vực điện toán. Chúng tôi nhận ra rằng học máy không đơn thuần là một ứng dụng hay cơ hội kinh doanh mới, mà là một cuộc cách mạng căn bản trong cách thức tính toán. Từ việc viết lệnh thủ công đến tối ưu hóa mạng thần kinh bằng học máy, mọi tầng lớp của nền tảng kỹ thuật đều trải qua sự thay đổi lớn.
Ngày nay, ứng dụng AI đã hiện diện khắp nơi. Dù là hiểu văn bản, hình ảnh, âm thanh, hay dịch mã axit amin và vật lý, nó đều có thể thực hiện. Gần như mọi ứng dụng AI đều có thể quy về ba câu hỏi: Nó học được thông tin dạng nào? Dịch sang dạng nào? Tạo ra dạng nào? Khái niệm cơ bản này thúc đẩy mọi ứng dụng do AI dẫn dắt.
Tất cả những thành tựu này đều nhờ vào sự hỗ trợ của GeForce. GeForce đã đưa AI đến đại chúng, và giờ đây, AI đang quay lại cách mạng hóa GeForce. Nhờ công nghệ theo dõi tia sáng thời gian thực, chúng tôi có thể render đồ họa với hiệu ứng kinh ngạc. Qua DLSS, AI thậm chí có thể vượt xa việc tạo khung hình, dự đoán hình ảnh tương lai. Trong 3,3 triệu pixel, chỉ có 200 nghìn pixel được tính toán, phần còn lại do AI dự đoán. Công nghệ kỳ diệu này thể hiện sức mạnh to lớn của AI, giúp tính toán hiệu quả hơn và mở ra vô vàn khả năng trong tương lai.
Đó là lý do tại sao hiện nay có quá nhiều điều kỳ diệu xảy ra. Chúng tôi đã dùng GeForce thúc đẩy sự phát triển của AI, và giờ đây, AI đang cách mạng hóa hoàn toàn GeForce. Hôm nay, chúng tôi công bố sản phẩm thế hệ tiếp theo – dòng RTX Blackwell. Hãy cùng xem.
Đây là dòng GeForce RTX 50 hoàn toàn mới, dựa trên kiến trúc Blackwell. GPU này là một cỗ máy hiệu năng khủng, sở hữu 92 tỷ bóng bán dẫn, hiệu năng AI 4000 TOPS và sức mạnh xử lý AI đạt 4 PetaFLOPS – cao gấp ba lần kiến trúc Ada thế hệ trước. Tất cả nhằm mục đích tạo ra những pixel tuyệt đẹp như tôi vừa trình diễn. Nó cũng đạt 380 Teraflops trong ray tracing, mang lại chất lượng hình ảnh đẹp nhất có thể cho từng pixel cần tính toán, cùng với 125 Teraflops trong shading. Card đồ họa này sử dụng bộ nhớ G7 của Micron, tốc độ đạt 1,8TB mỗi giây – gấp đôi hiệu năng thế hệ trước.
Chúng tôi hiện có thể kết hợp tải trọng công việc AI với tải trọng đồ họa máy tính. Một đặc điểm phi thường của thế hệ này là shader lập trình được cũng có thể xử lý mạng thần kinh. Điều này giúp chúng tôi phát minh ra công nghệ nén kết cấu thần kinh (neural texture compression) và tô màu vật liệu bằng AI (neural material shading). Các công nghệ này sử dụng AI để học và nén kết cấu, cuối cùng tạo ra những hiệu ứng hình ảnh ngoạn mục mà chỉ AI mới có thể thực hiện.
Ngay cả về thiết kế cơ khí, card đồ họa này cũng là một kỳ tích. Nó có thiết kế hai quạt, toàn bộ card giống như một quạt khổng lồ, các mô-đun điều chỉnh điện áp bên trong là tiên tiến nhất. Thiết kế tuyệt vời như vậy hoàn toàn nhờ nỗ lực của đội ngũ kỹ sư.
Tiếp theo là so sánh hiệu năng. RTX 4090 quen thuộc với mức giá $1599 là khoản đầu tư cốt lõi cho trung tâm giải trí PC tại nhà. Giờ đây, dòng RTX 50 cung cấp hiệu năng cao hơn với giá khởi điểm chỉ $549, từ RTX 5070 đến RTX 5090, hiệu năng gấp đôi RTX 4090.
Thú vị hơn nữa, chúng tôi đã đưa GPU hiệu năng cao này vào laptop. RTX 5070 cho laptop có giá $1299 nhưng sở hữu hiệu năng ngang RTX 4090. Thiết kế này kết hợp công nghệ AI và đồ họa máy tính, giúp đạt được hiệu suất năng lượng và hiệu năng cao.

Đồ họa máy tính trong tương lai sẽ là render thần kinh (neural rendering) – sự kết hợp giữa AI và đồ họa máy tính. Dòng Blackwell thậm chí có thể hoạt động trong laptop mỏng chỉ 14,9 mm, toàn bộ dòng sản phẩm từ RTX 5070 đến RTX 5090 đều phù hợp với laptop siêu mỏng.
GeForce thúc đẩy sự phổ cập của AI, giờ đây AI quay lại cách mạng hóa hoàn toàn GeForce. Đây là sự thúc đẩy lẫn nhau giữa công nghệ và trí tuệ, chúng ta đang tiến tới một cảnh giới cao hơn.
Ba Định luật Mở rộng (Scaling Law) của AI
Tiếp theo, hãy cùng nói về định hướng phát triển của AI.
1) Định luật Mở rộng Tiền huấn luyện (Pre-training Scaling Law)
Ngành công nghiệp AI đang tăng tốc mở rộng, thúc đẩy quá trình này là một mô hình mạnh mẽ được gọi là "Scaling Law". Quy tắc kinh nghiệm này đã được các nhà nghiên cứu và giới công nghiệp kiểm chứng lặp đi lặp lại, cho thấy quy mô dữ liệu huấn luyện càng lớn, quy mô mô hình càng lớn, và năng lực tính toán đầu tư càng nhiều thì năng lực mô hình cũng càng mạnh.
Tốc độ tăng trưởng dữ liệu đang gia tăng theo cấp số mũ. Dự kiến trong vài năm tới, lượng dữ liệu con người sản xuất mỗi năm sẽ vượt quá tổng lượng dữ liệu sản xuất trong toàn bộ lịch sử loài người trước đó. Những dữ liệu khổng lồ này đang ngày càng đa dạng dạng thức (multimodal), bao gồm video, hình ảnh và âm thanh. Toàn bộ dữ liệu khổng lồ này có thể được dùng để huấn luyện hệ thống kiến thức cơ bản của AI, đặt nền móng vững chắc cho AI.
2) Định luật Mở rộng Sau huấn luyện (Post-training Scaling Law)
Bên cạnh đó, còn có hai Định luật Mở rộng khác đang nổi lên.
Định luật thứ hai là "Định luật Mở rộng Sau huấn luyện", liên quan đến các công nghệ như học tăng cường và phản hồi từ con người. Thông qua cách này, AI tạo câu trả lời dựa trên truy vấn của con người và không ngừng cải thiện từ phản hồi của con người. Hệ thống học tăng cường này, thông qua các gợi ý chất lượng cao, giúp AI tinh thông kỹ năng trong các lĩnh vực chuyên biệt, ví dụ giỏi giải toán hoặc suy luận phức tạp hơn.
Tương lai của AI không chỉ là nhận thức và sinh tạo, mà là một quá trình không ngừng tự hoàn thiện, phá vỡ giới hạn. Nó giống như có một người thầy hoặc huấn luyện viên, cung cấp phản hồi sau khi bạn hoàn thành nhiệm vụ. Qua thử nghiệm, phản hồi và tự cải thiện, AI cũng có thể tiến bộ thông qua cơ chế học tăng cường và phản hồi tương tự. Giai đoạn sau huấn luyện này kết hợp học tăng cường với công nghệ tạo dữ liệu tổng hợp, giống như một quá trình tự luyện tập. AI có thể đối mặt với những bài toán phức tạp và có thể kiểm chứng, ví dụ như chứng minh định lý hay giải bài toán hình học, không ngừng tối ưu hóa câu trả lời của mình thông qua học tăng cường. Mặc dù sau huấn luyện đòi hỏi năng lực tính toán khổng lồ, nhưng cuối cùng có thể tạo ra những mô hình phi thường.
3) Định luật Mở rộng Thời gian Kiểm tra (Test-time Scaling Law)
Định luật Mở rộng Thời gian Kiểm tra cũng dần lộ diện. Định luật này thể hiện tiềm năng độc đáo khi AI thực sự được sử dụng. AI có thể phân bổ tài nguyên một cách động trong quá trình suy luận, không còn giới hạn ở tối ưu tham số, mà tập trung vào phân bổ tính toán để tạo ra câu trả lời chất lượng cao như mong muốn.
Quá trình này giống như suy luận tư duy, chứ không phải suy diễn trực tiếp hay trả lời một lần. AI có thể chia nhỏ vấn đề thành nhiều bước, tạo ra nhiều giải pháp và đánh giá, cuối cùng chọn ra phương án tối ưu. Loại suy luận kéo dài này rất hiệu quả trong việc nâng cao năng lực mô hình.
Chúng ta đã thấy sự tiến hóa của công nghệ này, từ ChatGPT đến GPT-4, rồi đến Gemini Pro ngày nay, tất cả các hệ thống này đều trải qua sự phát triển từng bước của tiền huấn luyện, sau huấn luyện và mở rộng thời gian kiểm tra. Để đạt được những đột phá này cần năng lực tính toán khổng lồ, và đây chính là giá trị cốt lõi của kiến trúc Blackwell của NVIDIA.
Giới thiệu mới nhất về kiến trúc Blackwell
Các hệ thống Blackwell hiện đang được sản xuất hàng loạt, hiệu năng thật sự ấn tượng. Hiện nay, mọi nhà cung cấp dịch vụ đám mây đều đang triển khai các hệ thống này, được sản xuất bởi 45 nhà máy trên toàn cầu, hỗ trợ tới 200 cấu hình khác nhau, bao gồm làm mát bằng chất lỏng, làm mát bằng gió, kiến trúc x86 và phiên bản CPU Grace của NVIDIA.
Thành phần cốt lõi của nó – hệ thống NVLink – nặng tới 1,5 tấn, chứa 600.000 linh kiện, tương đương độ phức tạp của 20 chiếc ô tô, phía sau là 2 dặm dây đồng và 5.000 cáp. Quá trình sản xuất cực kỳ phức tạp, nhưng mục tiêu là đáp ứng nhu cầu tính toán không ngừng mở rộng.
So với kiến trúc thế hệ trước, Blackwell tăng hiệu năng trên mỗi watt lên 4 lần, và hiệu năng trên mỗi đô la lên 3 lần. Điều này có nghĩa là với cùng chi phí, quy mô mô hình huấn luyện có thể tăng gấp 3 lần, và chìa khóa đằng sau những cải tiến này chính là việc tạo token AI. Những token này được sử dụng rộng rãi trong ChatGPT, Gemini và các dịch vụ AI khác, là nền tảng của điện toán tương lai.
Trên nền tảng này, NVIDIA đang thúc đẩy một mô hình tính toán hoàn toàn mới: render thần kinh, kết hợp hoàn hảo giữa AI và đồ họa máy tính. 72 GPU dưới kiến trúc Blackwell tạo thành hệ thống chip đơn lớn nhất thế giới, cung cấp hiệu năng xử lý dấu phẩy động AI lên tới 1,4 ExaFLOPS, băng thông bộ nhớ đạt mức kinh ngạc 1,2 PB/s – tương đương tổng lưu lượng Internet toàn cầu. Khả năng tính toán siêu việt này cho phép AI xử lý các tác vụ suy luận phức tạp hơn, đồng thời giảm đáng kể chi phí, đặt nền tảng cho điện toán hiệu quả hơn.
Hệ thống và Sinh thái AI Agent
Nhìn về tương lai, quá trình suy luận của AI sẽ không còn là phản hồi đơn bước đơn giản, mà gần giống với một "cuộc đối thoại nội tâm". AI tương lai không chỉ tạo câu trả lời, mà còn phản tư, suy luận và không ngừng tối ưu hóa. Cùng với tốc độ tạo token AI tăng lên và chi phí giảm xuống, chất lượng dịch vụ AI sẽ được nâng cao đáng kể, đáp ứng nhu cầu ứng dụng rộng rãi hơn.
Để giúp doanh nghiệp xây dựng các hệ thống AI có khả năng suy luận tự chủ, NVIDIA cung cấp ba công cụ chính: NeMo của NVIDIA, các microservice AI và thư viện tăng tốc. Bằng cách đóng gói phần mềm CUDA phức tạp và các mô hình học sâu thành các dịch vụ dạng container, doanh nghiệp có thể triển khai các mô hình AI này trên bất kỳ nền tảng đám mây nào, nhanh chóng phát triển các AI Agent chuyên biệt cho từng lĩnh vực, ví dụ như công cụ phục vụ quản lý doanh nghiệp hoặc "nhân viên số" tương tác với người dùng.
Những mô hình này mở ra khả năng mới cho doanh nghiệp, không chỉ hạ thấp rào cản phát triển ứng dụng AI mà còn thúc đẩy toàn ngành tiến vững chắc vào hướng Agentic AI (AI tự chủ). AI tương lai sẽ trở thành nhân viên số, có thể dễ dàng tích hợp vào các công cụ doanh nghiệp như SAP, ServiceNow, cung cấp dịch vụ thông minh cho khách hàng trong các môi trường khác nhau. Đây là cột mốc tiếp theo trong việc mở rộng AI, cũng là tầm nhìn cốt lõi của hệ sinh thái công nghệ NVIDIA.
Hệ thống đào tạo và đánh giá. Trong tương lai, các AI Agent này về bản chất là lực lượng lao động kỹ thuật số làm việc song hành với nhân viên, hoàn thành nhiệm vụ thay bạn. Vì vậy, việc đưa các Agent chuyên biệt này vào công ty giống như tuyển dụng nhân viên mới. Chúng tôi cung cấp các thư viện công cụ khác nhau, giúp các AI Agent này học ngôn ngữ riêng biệt, từ vựng, quy trình kinh doanh và cách làm việc của công ty. Bạn cần cung cấp các ví dụ về thành quả công việc, họ sẽ cố gắng tạo ra, sau đó bạn đưa ra phản hồi, đánh giá, v.v. Đồng thời, bạn cũng sẽ đặt giới hạn, ví dụ rõ ràng họ không được thực hiện thao tác nào, không được nói gì, và kiểm soát thông tin họ có thể truy cập. Toàn bộ quy trình nhân viên số này được gọi là Nemo. Về một khía cạnh nào đó, bộ phận CNTT của mỗi công ty sẽ dần trở thành phòng Nhân sự (HR) cho các AI Agent.
Ngày nay, bộ phận CNTT quản lý và duy trì lượng lớn phần mềm; trong tương lai, họ sẽ quản lý, nuôi dưỡng, tuyển dụng và cải tiến lượng lớn các Agent số, cung cấp dịch vụ cho công ty. Do đó, bộ phận CNTT sẽ dần chuyển hóa thành phòng HR cho các AI Agent.
Bên cạnh đó, chúng tôi cung cấp nhiều bản mẫu (blueprint) mã nguồn mở cho hệ sinh thái sử dụng. Người dùng có thể tự do chỉnh sửa các bản mẫu này. Chúng tôi cung cấp bản mẫu cho nhiều loại Agent khác nhau. Hôm nay, chúng tôi cũng công bố một điều rất ngầu và thông minh: Chúng tôi ra mắt một họ mô hình hoàn toàn mới dựa trên Llama, đó là series mô hình nền tảng ngôn ngữ Nvidia Llama Nemotron.
Llama 3.1 là một mô hình hiện tượng. Llama 3.1 của Meta đạt khoảng 350.650.000 lượt tải xuống và sinh ra khoảng 60.000 mô hình khác. Đây là một trong những lý do cốt lõi thúc đẩy hầu hết mọi doanh nghiệp và ngành công nghiệp bắt đầu nghiên cứu AI. Chúng tôi nhận ra rằng mô hình Llama có thể được tinh chỉnh tốt hơn cho các trường hợp sử dụng doanh nghiệp. Sử dụng chuyên môn và năng lực của mình, chúng tôi đã tinh chỉnh nó thành bộ công cụ mô hình mở Llama Nemotron.
Các mô hình này được chia thành các kích cỡ khác nhau: mô hình nhỏ phản hồi nhanh; mô hình siêu cấp Super Llama Nemotron là mô hình thông dụng; còn mô hình siêu lớn Ultra Model có thể đóng vai trò mô hình giáo viên, dùng để đánh giá các mô hình khác, tạo câu trả lời và quyết định chất lượng, hoặc dùng làm mô hình chưng cất tri thức. Tất cả các mô hình này hiện đã sẵn sàng.
Những mô hình này thể hiện xuất sắc, dẫn đầu các bảng xếp hạng trong các lĩnh vực như hội thoại, chỉ thị và truy xuất thông tin, rất phù hợp với chức năng AI Agent trên phạm vi toàn cầu.
Chúng tôi cũng hợp tác chặt chẽ với hệ sinh thái, ví dụ như hợp tác với ServiceNow, SAP, Siemens trong AI công nghiệp. Các công ty như Cadence và Perplexity cũng đang triển khai các dự án tuyệt vời. Perplexity đã làm đảo lộn lĩnh vực tìm kiếm, Codium phục vụ 30 triệu kỹ sư phần mềm toàn cầu. Trợ lý AI sẽ tăng đáng kể năng suất của các nhà phát triển phần mềm, đây là lĩnh vực ứng dụng khổng lồ tiếp theo của AI. Trên toàn thế giới có 1 tỷ người lao động tri thức, AI Agent có thể là ngành công nghiệp robot tiếp theo, với tiềm năng đạt hàng ngàn tỷ đô la Mỹ.
Bản mẫu AI Agent
Tiếp theo, hãy cùng xem một số bản mẫu AI Agent được hoàn thành cùng các đối tác.
AI Agent là lực lượng lao động kỹ thuật số mới, có thể hỗ trợ hoặc thay thế con người hoàn thành nhiệm vụ. Các khối xây dựng Agentic AI, mô hình NEM tiền huấn luyện và khung Nemo của NVIDIA giúp các tổ chức dễ dàng phát triển và triển khai AI Agent. Những Agent này có thể được huấn luyện trở thành chuyên gia nhiệm vụ chuyên biệt theo lĩnh vực.
Dưới đây là bốn ví dụ:
-
Agent trợ lý nghiên cứu: Có thể đọc các tài liệu phức tạp như bài giảng, tạp chí, báo cáo tài chính, v.v., và tạo podcast tương tác, thuận tiện cho việc học;
-
AI Agent an ninh phần mềm: Giúp nhà phát triển quét liên tục các lỗ hổng phần mềm và nhắc nhở thực hiện các biện pháp tương ứng;
-
AI Agent phòng thí nghiệm ảo: Tăng tốc thiết kế và sàng lọc hợp chất, nhanh chóng tìm ra các ứng cử viên thuốc tiềm năng;
-
AI Agent phân tích video: Dựa trên bản mẫu Metropolis của NVIDIA, phân tích dữ liệu từ hàng tỷ camera, tạo tìm kiếm tương tác, tóm tắt và báo cáo. Ví dụ, giám sát lưu lượng giao thông, quy trình cơ sở, đưa ra đề xuất cải tiến, v.v.;
Thời đại Physic AI đã đến
Chúng tôi muốn đưa AI từ đám mây đến mọi ngóc ngách, bao gồm nội bộ công ty và PC cá nhân. NVIDIA đang nỗ lực biến WSL 2 của Windows (Hệ thống phụ Windows) thành nền tảng hỗ trợ AI được ưa chuộng. Điều này sẽ giúp các nhà phát triển và kỹ sư tận dụng dễ dàng hơn bộ công cụ AI của NVIDIA, bao gồm mô hình ngôn ngữ, mô hình hình ảnh, mô hình hoạt hình, v.v.
Bên cạnh đó, NVIDIA ra mắt Cosmos – nền tảng phát triển mô hình nền tảng thế giới vật lý đầu tiên, tập trung vào việc hiểu các đặc tính động của thế giới vật lý, ví dụ như trọng lực, ma sát, quán tính, mối quan hệ không gian, quan hệ nhân quả, v.v. Nó có thể tạo video, cảnh phù hợp với quy luật vật lý, được ứng dụng rộng rãi trong huấn luyện và xác thực robot, AI công nghiệp và mô hình ngôn ngữ đa phương thức.
Cosmos kết nối với Omniverse của NVIDIA để cung cấp mô phỏng vật lý, tạo ra kết quả mô phỏng chân thực và đáng tin cậy. Sự kết hợp này là công nghệ cốt lõi trong phát triển ứng dụng robot và công nghiệp.

Chiến lược công nghiệp của NVIDIA dựa trên ba hệ thống tính toán:
-
Hệ thống DGX dùng để huấn luyện AI;
-
Hệ thống AGX dùng để triển khai AI;
-
Hệ thống song sinh kỹ thuật số (digital twin), dùng cho học tăng cường và tối ưu hóa AI;
Thông qua sự phối hợp của ba hệ thống này, NVIDIA thúc đẩy sự phát triển của robot và AI công nghiệp, xây dựng thế giới kỹ thuật số tương lai. Thay vì nói đây là một bài toán ba vật thể, chúng ta có một giải pháp “ba máy tính”.
Tầm nhìn robot của NVIDIA khiến tôi muốn giới thiệu ba ví dụ.
1) Ứng dụng trực quan hóa công nghiệp
Hiện nay, toàn cầu có hàng triệu nhà máy và hàng chục ngàn kho hàng, tạo thành xương sống của ngành sản xuất trị giá 50 nghìn tỷ đô la Mỹ. Trong tương lai, tất cả điều này cần được định nghĩa bằng phần mềm, tự động hóa và tích hợp công nghệ robot. Chúng tôi hợp tác với Keon – nhà cung cấp giải pháp tự động hóa kho hàng hàng đầu toàn cầu – và Accenture – nhà cung cấp dịch vụ chuyên nghiệp lớn nhất thế giới – tập trung vào sản xuất kỹ thuật số, cùng tạo ra những giải pháp đặc biệt. Cách tiếp cận thị trường của chúng tôi tương tự các nền tảng phần mềm và công nghệ khác, thông qua nhà phát triển và đối tác hệ sinh thái, và ngày càng nhiều đối tác sinh thái đang kết nối với nền tảng Omniverse. Bởi vì ai cũng muốn trực quan hóa tương lai của công nghiệp. Trong GDP toàn cầu trị giá 50 nghìn tỷ đô la Mỹ này, có quá nhiều lãng phí, cũng như quá nhiều cơ hội tự động hóa.
Hãy xem ví dụ hợp tác giữa Keon, Accenture và chúng tôi:
Keon (công ty giải pháp chuỗi cung ứng), Accenture (lãnh đạo toàn cầu trong dịch vụ chuyên nghiệp) và NVIDIA đang đưa Physic AI vào thị trường kho hàng và trung tâm phân phối trị giá nghìn tỷ đô la Mỹ. Việc quản lý hậu cần kho hàng hiệu quả đòi hỏi giải quyết mạng lưới quyết định phức tạp, chịu ảnh hưởng bởi các biến số luôn thay đổi như nhu cầu hàng ngày và theo mùa, giới hạn không gian, nguồn cung lao động, cũng như tích hợp các hệ thống robot và tự động hóa đa dạng. Ngày nay, gần như không thể dự đoán các chỉ số hiệu suất then chốt (KPI) vận hành của kho vật lý.
Để giải quyết các vấn đề này, Keon đang áp dụng Mega (một bản mẫu Omniverse của NVIDIA) để xây dựng song sinh kỹ thuật số công nghiệp, nhằm kiểm tra và tối ưu đội xe robot. Trước tiên, giải pháp quản lý kho của Keon sẽ giao nhiệm vụ cho "bộ não AI công nghiệp" trong song sinh kỹ thuật số, ví dụ như di chuyển hàng hóa từ vị trí đệm đến giải pháp lưu trữ xe tự hành. Đội xe robot thực hiện nhiệm vụ trong môi trường mô phỏng kho vật lý trên Omniverse, thông qua cảm nhận và suy luận, lập kế hoạch hành động tiếp theo và thực hiện. Môi trường song sinh kỹ thuật số sử dụng mô phỏng cảm biến, giúp bộ não robot nhìn thấy trạng thái sau khi nhiệm vụ hoàn thành và quyết định hành động tiếp theo. Dưới sự theo dõi chính xác của Mega, toàn bộ vòng lặp tiếp tục, đồng thời đo lường các KPI hoạt động như năng suất, hiệu quả và mức sử dụng – tất cả đều hoàn thành trước khi thay đổi kho vật lý thực tế.
Với sự hợp tác của NVIDIA, Keon và Accenture đang tái định nghĩa tương lai của tự trị công nghiệp.
Trong tương lai, mỗi nhà máy sẽ có một song sinh kỹ thuật số, hoàn toàn đồng bộ với nhà máy thực tế. Bạn có thể sử dụng Omniverse và Cosmos để tạo ra lượng lớn các kịch bản tương lai, AI sẽ quyết định kịch bản KPI tối ưu và sử dụng nó làm điều kiện ràng buộc và logic lập trình AI để triển khai tại nhà máy thực tế.
2) Ô tô tự hành
Cuộc cách mạng ô tô tự hành đã đến. Sau nhiều năm phát triển, thành công của cả Waymo lẫn Tesla đều chứng minh sự trưởng thành của công nghệ tự hành. Giải pháp của chúng tôi cung cấp ba hệ thống máy tính cho ngành này: hệ thống dùng để huấn luyện AI (ví dụ như hệ thống DGX), hệ thống dùng để mô phỏng kiểm thử và tạo dữ liệu tổng hợp (ví dụ như Omniverse và Cosmos), và hệ thống máy tính trong xe (ví dụ như hệ thống AGX). Gần như tất cả các hãng ô tô lớn nhất thế giới đều đang hợp tác với chúng tôi, bao gồm Waymo, Zoox, Tesla, và BYD – công ty xe điện lớn nhất thế giới. Ngoài ra còn có Mercedes, Lucid, Rivian, Xiaomi và Volvo – những công ty sắp ra mắt các mẫu xe đổi mới. Aurora đang sử dụng công nghệ NVIDIA để phát triển xe tải tự hành.
Hàng năm có 100 triệu ô tô được sản xuất, 1 tỷ ô tô lưu thông trên đường toàn cầu, tổng quãng đường lái xe hàng năm lên tới hàng nghìn tỷ dặm. Những con số này sẽ dần đạt mức tự động hóa cao hoặc hoàn toàn tự động. Dự kiến ngành này sẽ trở thành ngành công nghiệp robot đầu tiên trị giá hàng ngàn tỷ đô la Mỹ.
Hôm nay, chúng tôi công bố ra mắt máy tính trên xe thế hệ tiếp theo – Thor. Đây là một máy tính robot đa năng, có thể xử lý lượng dữ liệu khổng lồ từ các cảm biến như camera, radar độ phân giải cao, lidar, v.v. Thor là bản nâng cấp của Orin – tiêu chuẩn hiện tại của ngành, với sức mạnh tính toán gấp 20 lần, hiện đã sản xuất hàng loạt. Đồng thời, hệ điều hành Drive OS của NVIDIA là hệ điều hành máy tính AI đầu tiên được chứng nhận đạt tiêu chuẩn an toàn chức năng cao nhất (ISO 26262 ASIL D).
Nhà máy dữ liệu tự hành
NVIDIA sử dụng mô hình AI Omniverse và nền tảng Cosmos để tạo Nhà máy dữ liệu tự hành, mở rộng dữ liệu huấn luyện thông qua các kịch bản lái xe tổng hợp. Bao gồm:
-
OmniMap: Kết hợp dữ liệu bản đồ và địa không gian, xây dựng môi trường 3D có thể lái được;
-
Động cơ tái tạo thần kinh: Sử dụng nhật ký cảm biến để tạo môi trường mô phỏng 4D độ trung thực cao, và tạo biến thể kịch bản cho dữ liệu huấn luyện;
-
Edify 3DS: Tìm kiếm hoặc tạo tài sản mới từ kho tài sản, tạo cảnh cho mô phỏng.
Thông qua các công nghệ này, chúng tôi mở rộng từ vài nghìn lần lái xe thành dữ liệu hàng tỷ dặm, phục vụ phát triển hệ thống tự hành an toàn và tiên tiến hơn.
3) Robot đa dụng
Thời đại robot đa dụng đang đến gần. Chìa khóa thúc đẩy đột phá trong lĩnh vực này nằm ở huấn luyện. Đối với robot hình người, việc thu thập dữ liệu bắt chước tương đối khó khăn, nhưng Isaac Groot của NVIDIA cung cấp giải pháp. Nó tạo ra tập dữ liệu khổng lồ thông qua mô phỏng, kết hợp động cơ mô phỏng đa vũ trụ của Omniverse và Cosmos để huấn luyện, xác minh và triển khai chính sách.
Ví dụ, nhà phát triển có thể điều khiển robot từ xa thông qua Apple Vision Pro, thu thập dữ liệu mà không cần robot thực tế, và dạy các thao tác nhiệm vụ trong môi trường không rủi ro. Thông qua chức năng ngẫu nhiên hóa lĩnh vực và mở rộng từ 3D sang thực tế của Omniverse, tạo ra tập dữ liệu tăng theo cấp số mũ, cung cấp nguồn tài nguyên dồi dào cho robot học hỏi.
Tóm lại, dù là trực quan hóa công nghiệp, ô tô tự hành hay robot đa dụng, công nghệ NVIDIA đang dẫn dắt sự thay đổi trong tương lai của Physic AI và lĩnh vực robot.
Cuối cùng, tôi còn một nội dung quan trọng muốn giới thiệu, tất cả những điều này đều không thể tách rời khỏi một dự án mà chúng tôi khởi động nội bộ trong công ty cách đây mười năm, tên gọi Project Digits, tên đầy đủ là Deep Learning GPU Intelligence Training System (Hệ thống huấn luyện trí tuệ GPU học sâu), viết tắt là Digits.
Trước khi chính thức phát hành, chúng tôi đã điều chỉnh DGX để hài hòa với các dòng sản phẩm nội bộ RTX, AGX, OVX và các dòng khác. Sự ra đời của DGX1 thực sự đã thay đổi định hướng phát triển của AI, đồng thời cũng là một cột mốc của NVIDIA trong sự phát triển AI.
Sự cách mạng của DGX1
Mục đích ban đầu của DGX1 là cung cấp siêu máy tính AI "sẵn sàng sử dụng" cho các nhà nghiên cứu và doanh nghiệp khởi nghiệp. Hãy tưởng tượng, siêu máy tính trước đây yêu cầu người dùng xây dựng cơ sở riêng, thiết kế và xây dựng cơ sở hạ tầng phức tạp mới tồn tại được. Trong khi đó, DGX1 là siêu máy tính được thiết kế riêng cho phát triển AI, không cần thao tác phức tạp, mở hộp là dùng được.
Tôi vẫn nhớ, năm 2016 tôi đã trao chiếc DGX1 đầu tiên cho một công ty khởi nghiệp – OpenAI. Lúc đó, Elon Musk, Ilya Sutskever cùng nhiều kỹ sư của NVIDIA đều có mặt, chúng tôi cùng nhau ăn mừng sự xuất hiện của DGX1. Thiết bị này đã thúc đẩy đáng kể sự phát triển tính toán AI.
Ngày nay, AI đã hiện diện khắp nơi. Không chỉ giới hạn ở phòng thí nghiệm của các tổ chức nghiên cứu và doanh nghiệp khởi nghiệp, như tôi đã đề cập ban đầu, AI đã trở thành một cách tính toán và phát triển phần mềm hoàn toàn mới. Mỗi kỹ sư phần mềm, nghệ sĩ sáng tạo, thậm chí người dùng phổ thông sử dụng công cụ máy tính, đều cần một siêu máy tính AI. Nhưng tôi luôn mong DGX1 có thể nhỏ gọn hơn.
Siêu máy tính AI mới nhất
Dưới đây là siêu máy tính AI mới nhất của NVIDIA. Nó vẫn thuộc Project Digits, hiện chúng tôi vẫn đang tìm kiếm một cái tên tốt hơn, chào đón mọi người đề xuất. Đây là một thiết bị thực sự đáng kinh ngạc.
Siêu máy tính này có thể chạy toàn bộ ngăn xếp phần mềm AI của NVIDIA, bao gồm DGX Cloud. Nó có thể được dùng như siêu máy tính đám mây, cũng có thể là trạm làm việc hiệu năng cao, thậm chí là trạm phân tích để trên bàn. Quan trọng nhất, nó dựa trên một con chip mới được phát triển bí mật, mã hiệu GB110, đây là con Grace Blackwell nhỏ nhất mà chúng tôi từng chế tạo.
Tôi đang cầm một con chip, hãy để tôi giới thiệu thiết kế bên trong của nó. Con chip này được phát triển hợp tác với MediaTek – một trong những công ty SoC hàng đầu thế giới. SoC CPU này được tùy chỉnh riêng cho NVIDIA, sử dụng công nghệ liên kết chip-tới-chip NVLink để kết nối với GPU Blackwell. Con chip nhỏ này hiện đã sản xuất hàng loạt. Chúng tôi dự kiến siêu máy tính này sẽ chính thức ra mắt vào khoảng tháng 5.
Chúng tôi thậm chí cung cấp cấu hình "gấp đôi hiệu năng", có thể kết nối các thiết bị này bằng ConnectX, hỗ trợ công nghệ GPU trực tiếp (GPUDirect). Đó là một giải pháp siêu tính toán hoàn chỉnh, có thể đáp ứng mọi nhu cầu phát triển AI, công việc phân tích và ứng dụng công nghiệp.
Bên cạnh đó, ba con chip hệ thống Blackwell hoàn toàn mới đã được công bố sản xuất hàng loạt, mô hình nền tảng vật lý AI đầu tiên trên thế giới và ba đột phá trong lĩnh vực robot – robot AI Agent tự chủ, robot hình người và ô tô tự hành.
Chào mừng tham gia cộng đồng chính thức TechFlow
Nhóm Telegram:https://t.me/TechFlowDaily
Tài khoản Twitter chính thức:https://x.com/TechFlowPost
Tài khoản Twitter tiếng Anh:https://x.com/BlockFlow_News












