Sự kiện AI GTC của NVIDIA khai mạc, ra mắt chip AI mạnh nhất Blackwell

2024.03.19

Chia sẻ đến

Tuyển chọn TechFlowTuyển chọn TechFlow

Sự kiện AI GTC của NVIDIA khai mạc, ra mắt chip AI mạnh nhất Blackwell

NVIDIA cho biết chi phí và mức tiêu thụ năng lượng của Blackwell được cải thiện 25 lần so với thế hệ trước, là con chip mạnh nhất thế giới.

2024.03.19 - 09:27:34

Chuyên sâu báo cáo Web3

NVIDIA cho biết chi phí và mức tiêu thụ năng lượng của Blackwell được cải thiện 25 lần so với thế hệ trước, là con chip mạnh nhất thế giới.

Tác giả: Lý Đan

Nguồn: Wall Street Insights

Hội nghị phát triển trí tuệ nhân tạo (AI) hàng đầu thế giới năm nay - Hội nghị GTC AI 2024 của NVIDIA đã chính thức khai mạc vào thứ Hai, ngày 18 tháng 3 theo giờ Mỹ.

Năm nay là lần đầu tiên sau 5 năm, sự kiện GTC thường niên của NVIDIA quay trở lại hình thức tổ chức trực tiếp, cũng được xem là hội nghị AI mà trước đó giới phân tích cho rằng NVIDIA sẽ “trình làng những sản phẩm thật sự đột phá”.

Chiều thứ Hai theo giờ địa phương, ông Huang Renxun, nhà sáng lập và CEO của NVIDIA đã có bài phát biểu chủ đề tại Trung tâm SAP ở San Jose, California với chủ đề "Hội nghị AI số 1 dành cho các nhà phát triển" (1# AI Conference for Developers).

Blackwell cải thiện chi phí và tiêu thụ năng lượng gấp 25 lần so với thế hệ trước – Vi xử lý mạnh nhất thế giới, quy trình 4nm của TSMC

Huang Renxun đã giới thiệu thế hệ chip và phần mềm mới dùng để vận hành các mô hình AI. NVIDIA chính thức ra mắt GPU AI thế hệ mới mang tên Blackwell, dự kiến sẽ bắt đầu giao hàng vào cuối năm nay.

Theo NVIDIA, nền tảng Blackwell có khả năng xây dựng và vận hành AI sinh nội dung thời gian thực trên các mô hình ngôn ngữ lớn (LLM) ở mức độ nghìn tỷ tham số, đồng thời giảm chi phí và tiêu thụ năng lượng đến 25 lần so với thế hệ trước.

NVIDIA cho biết Blackwell sở hữu sáu công nghệ cách mạng, hỗ trợ huấn luyện AI và suy luận LLM thời gian thực cho các mô hình lên tới 10 nghìn tỷ tham số:

Vi xử lý mạnh nhất thế giới: GPU kiến trúc Blackwell gồm 208 tỷ bóng bán dẫn, được sản xuất bằng quy trình tùy chỉnh 4 nanomet (nm) của TSMC, hai chip die GPU đạt giới hạn reticle được nối với nhau qua liên kết chip-chip tốc độ 10 TB/giây thành một GPU thống nhất duy nhất.
Bộ xử lý Transformer thế hệ thứ hai: Kết hợp công nghệ Blackwell Tensor Core với thuật toán quản lý phạm vi động nâng cao của NVIDIA trong các khung làm việc TensorRT-LLM và NeMo Megatron, Blackwell sẽ hỗ trợ tính toán và suy luận mô hình kích thước kép thông qua định dạng dấu phẩy động 4-bit mới cho AI.
NVLink thế hệ thứ năm: Để tăng hiệu suất cho các mô hình AI nghìn tỷ tham số và mô hình chuyên gia trộn lẫn (mixture-of-experts), thế hệ NVLink mới nhất cung cấp băng thông hai chiều đột phá 1,8TB/s cho mỗi GPU, đảm bảo truyền thông tin tốc độ cao liền mạch giữa tối đa 576 GPU cho các LLM phức tạp nhất.
Bộ xử lý RAS: GPU được hỗ trợ bởi Blackwell bao gồm một bộ xử lý chuyên dụng nhằm đảm bảo độ tin cậy, khả năng sẵn sàng và dịch vụ (RAS). Ngoài ra, kiến trúc Blackwell còn bổ sung các chức năng cấp chip, sử dụng bảo trì phòng ngừa dựa trên AI để chẩn đoán và dự đoán các vấn đề về độ tin cậy. Điều này giúp tối đa hóa thời gian hoạt động của hệ thống, tăng độ bền cho AI quy mô lớn, cho phép vận hành liên tục hàng tuần hoặc thậm chí hàng tháng, đồng thời giảm chi phí vận hành.
AI an toàn: Các chức năng tính toán bảo mật tiên tiến bảo vệ mô hình AI và dữ liệu khách hàng mà không ảnh hưởng đến hiệu suất, đồng thời hỗ trợ giao thức mã hóa giao diện gốc mới, điều này cực kỳ quan trọng đối với các ngành nhạy cảm về quyền riêng tư như chăm sóc sức khỏe và dịch vụ tài chính.
Bộ xử lý giải nén: Bộ xử lý giải nén chuyên dụng hỗ trợ các định dạng mới nhất, tăng tốc truy vấn cơ sở dữ liệu, cung cấp hiệu suất cao nhất cho phân tích dữ liệu và khoa học dữ liệu. Trong vài năm tới, việc xử lý dữ liệu – lĩnh vực doanh nghiệp chi hàng chục tỷ USD mỗi năm – sẽ ngày càng được tăng tốc bởi GPU.

Hiệu suất suy luận GB200 NVL72 tăng cao tới 30 lần so với H100

NVIDIA đồng thời giới thiệu siêu chip GB200 Grace Blackwell Superchip, nối hai GPU B200 Tensor Core với CPU NVIDIA Grace thông qua liên kết NVLink siêu tiết kiệm điện 900GB/s.

Để đạt hiệu suất AI cao nhất, hệ thống được hỗ trợ bởi GB200 có thể kết nối với nền tảng Quantum-X800 InfiniBand và Spectrum-X800 Ethernet của NVIDIA vừa được công bố hôm thứ Hai, cung cấp mạng cao cấp với tốc độ lên tới 800Gb/s.

GB200 là thành phần chính của GB200 NVL72, một hệ thống làm mát bằng chất lỏng, nhiều nút, quy mô khung máy, phù hợp với các khối lượng công việc đòi hỏi tính toán cao nhất. Hệ thống này kết hợp 36 siêu chip Grace Blackwell, bao gồm 72 GPU Blackwell và 36 CPU Grace được nối với nhau qua liên kết NVLink thế hệ thứ năm. GB200 NVL72 còn bao gồm đơn vị xử lý dữ liệu NVIDIA BlueField®-3, giúp tăng tốc mạng đám mây, lưu trữ linh hoạt, an ninh zero-trust và độ đàn hồi tính toán GPU trong các đám mây AI quy mô lớn.

So với số lượng tương đương GPU H100 Tensor Core, GB200 NVL72 mang lại hiệu suất tăng cao tới 30 lần cho các tác vụ suy luận LLM, đồng thời giảm chi phí và tiêu thụ năng lượng đến 25 lần.

Nền tảng GB200 NVL72 hoạt động như một GPU đơn lẻ với hiệu suất AI 1,4 exaflops và 30TB bộ nhớ nhanh, là khối xây dựng cho DGX SuperPOD mới nhất.

NVIDIA ra mắt bo mạch chủ máy chủ HGX B200, kết nối tám GPU B200 thông qua NVLink, hỗ trợ các nền tảng AI sinh nội dựa trên x86. HGX B200 hỗ trợ tốc độ mạng lên tới 400Gb/s thông qua nền tảng mạng InfiniBand Quantum-2 và Ethernet Spectrum-X của NVIDIA.

Amazon, Microsoft, Google và Oracle nằm trong số những nhà cung cấp dịch vụ đám mây đầu tiên hỗ trợ Blackwell

Chip Blackwell sẽ trở thành nền tảng cho các trung tâm dữ liệu lớn nhất thế giới như Amazon, Microsoft và Google triển khai các máy tính và sản phẩm mới. Các sản phẩm dựa trên Blackwell sẽ ra mắt vào cuối năm nay.

NVIDIA cho biết AWS của Amazon, Google Cloud, Azure của Microsoft và Oracle Cloud Infrastructure sẽ là những nhà cung cấp dịch vụ đám mây đầu tiên cung cấp các instance hỗ trợ Blackwell; các công ty thành viên trong chương trình NVIDIA Cloud Partner như Applied Digital, CoreWeave, Crusoe, IBM Cloud và Lambda cũng sẽ là những nhà cung cấp đầu tiên cung cấp instance Blackwell.

Các đám mây Sovereign AI cũng sẽ cung cấp dịch vụ và cơ sở hạ tầng đám mây dựa trên Blackwell, bao gồm Indosat Ooredoo Hutchinson, Nebius, Nexgen Cloud, Oracle EU Sovereign Cloud, Oracle Government Cloud tại Mỹ, Anh và Úc, Scaleway, Singtel, Taiga Cloud thuộc Northern Data Group, Shakti Cloud của Yotta Data Services và YTL Power International.

Huang Renxun nói: “Trong ba mươi năm qua, chúng tôi luôn theo đuổi tính toán tăng tốc, hướng tới những đột phá mang tính chuyển đổi trong học sâu và AI. AI sinh nội là công nghệ quyết định thời đại chúng ta. Blackwell chính là động cơ thúc đẩy cuộc cách mạng công nghiệp mới này. Thông qua hợp tác với những công ty năng động nhất thế giới, chúng tôi sẽ hiện thực hóa tiềm năng của AI trong mọi lĩnh vực.”

Trong bản thông cáo báo chí, NVIDIA liệt kê một số tổ chức dự kiến sẽ sử dụng Blackwell, như Microsoft, Amazon, Google, Meta, Dell, OpenAI, Oracle, Tesla và xAI do Elon Musk lãnh đạo. Huang Renxun cũng giới thiệu thêm nhiều đối tác khác bao gồm các công ty này.

Dự án AI Project GR00T hỗ trợ robot hình người

Trong bài phát biểu, Huang Renxun tiết lộ NVIDIA đã ra mắt dự án AI đa phương thức Project GR00T nhằm hỗ trợ robot hình người trong tương lai. Dự án này sử dụng mô hình nền tảng phổ quát, cho phép robot hình người nhận văn bản, giọng nói, video hay thậm chí là trình diễn trực tiếp làm đầu vào, xử lý và thực hiện các hành động tổng quát cụ thể.

Project GR00T được phát triển với sự hỗ trợ từ nền tảng robot Isaac của NVIDIA, bao gồm Isaac Lab mới dành cho học tăng cường.

Huang Renxun cho biết, các robot được hỗ trợ bởi nền tảng Project GR00T sẽ được thiết kế để hiểu ngôn ngữ tự nhiên và bắt chước hành động thông qua việc quan sát hành vi con người, từ đó học nhanh chóng các kỹ năng như phối hợp, linh hoạt và thích nghi với thế giới thực, tương tác mà hoàn toàn không gây ra “nổi dậy robot”.

Huang Renxun nói:

“Xây dựng mô hình nền tảng cho robot hình người phổ quát là một trong những vấn đề thú vị nhất mà lĩnh vực AI ngày nay có thể giải quyết. Khi tích hợp các công nghệ này lại với nhau, các chuyên gia robot hàng đầu thế giới có thể tạo ra bước nhảy vọt lớn trong lĩnh vực robot thông minh tổng quát.”

TSMC và Synopsys áp dụng công nghệ quang khắc của NVIDIA

Huang Renxun cũng đề cập rằng TSMC và Synopsys sẽ áp dụng công nghệ quang khắc tính toán của NVIDIA, sử dụng nền tảng quang khắc tính toán CuLitho của NVIDIA.

TSMC và Synopsys đã tích hợp phần mềm Culitho W của NVIDIA. Họ sẽ sử dụng GPU Blackwell thế hệ tiếp theo của NVIDIA để triển khai các ứng dụng AI và HPC.

Phần mềm mới NIM giúp người dùng dễ dàng tận dụng GPU NVIDIA hiện có để suy luận AI

NVIDIA đồng thời công bố ra mắt dịch vụ vi mô suy luận mang tên NVIDIA NIM, là các dịch vụ vi mô gốc đám mây được tối ưu hóa, nhằm rút ngắn thời gian đưa mô hình AI sinh nội ra thị trường và đơn giản hóa việc triển khai chúng trên đám mây, trung tâm dữ liệu và các trạm làm việc được tăng tốc GPU.

NVIDIA NIM mở rộng thư viện nhà phát triển bằng cách trừu tượng hóa sự phức tạp trong phát triển và đóng gói sản xuất mô hình AI thông qua API tiêu chuẩn ngành. Đây là một phần của NVIDIA AI Enterprise, cung cấp con đường đơn giản hóa để phát triển các ứng dụng doanh nghiệp được hỗ trợ bởi AI và triển khai các mô hình AI trong môi trường sản xuất.

NIM giúp người dùng dễ dàng hơn trong việc sử dụng GPU NVIDIA cũ để suy luận hoặc chạy phần mềm AI, cho phép khách hàng doanh nghiệp tiếp tục sử dụng GPU NVIDIA mà họ đã có. Sức mạnh tính toán cần thiết cho suy luận thấp hơn nhiều so với lúc ban đầu huấn luyện mô hình AI mới. NIM cho phép các doanh nghiệp vận hành mô hình AI riêng thay vì phải mua sản phẩm AI từ các công ty như OpenAI.

Khách hàng sử dụng máy chủ NVIDIA chỉ cần đăng ký NVIDIA AI Enterprise để sử dụng NIM, với mức phí giấy phép 4.500 USD mỗi GPU mỗi năm.

NVIDIA sẽ hợp tác với các công ty AI như Microsoft và Hugging Face để đảm bảo mô hình AI của họ có thể chạy trên tất cả các chip NVIDIA tương thích. Các nhà phát triển sử dụng NIM có thể vận hành hiệu quả các mô hình trên máy chủ riêng hoặc máy chủ NVIDIA dựa trên đám mây mà không cần quá trình cấu hình dài dòng.

Bình luận cho rằng, phần mềm như NIM giúp việc triển khai AI dễ dàng hơn, không chỉ tạo thêm nguồn thu cho NVIDIA mà còn cung cấp thêm một lý do để khách hàng tiếp tục gắn bó với chip NVIDIA.

Chào mừng tham gia cộng đồng chính thức TechFlow

Nhóm Telegram:https://t.me/TechFlowDaily

Tài khoản Twitter chính thức:https://x.com/TechFlowPost

Tài khoản Twitter tiếng Anh:https://x.com/BlockFlow_News

Thêm vào mục ưa thích

Chia sẻ lên mạng xã hội

Tác giả

华尔街见闻

Sự kiện AI GTC của NVIDIA khai mạc, ra mắt chip AI mạnh nhất Blackwell

Tuyển chọn TechFlowTuyển chọn TechFlow

Sự kiện AI GTC của NVIDIA khai mạc, ra mắt chip AI mạnh nhất Blackwell

Blackwell cải thiện chi phí và tiêu thụ năng lượng gấp 25 lần so với thế hệ trước – Vi xử lý mạnh nhất thế giới, quy trình 4nm của TSMC

Hiệu suất suy luận GB200 NVL72 tăng cao tới 30 lần so với H100

Amazon, Microsoft, Google và Oracle nằm trong số những nhà cung cấp dịch vụ đám mây đầu tiên hỗ trợ Blackwell

Dự án AI Project GR00T hỗ trợ robot hình người

TSMC và Synopsys áp dụng công nghệ quang khắc của NVIDIA

Phần mềm mới NIM giúp người dùng dễ dàng tận dụng GPU NVIDIA hiện có để suy luận AI

Bài viết liên quan

Nội dung bài viết

TechFlow Cục Tình báo: ASML lần thứ hai nâng dự báo doanh số cả năm lên 45 tỷ Euro, lỗ hổng bảo mật Claude và Cursor 0day gây chấn động cộng đồng nhà phát triển

Tổng quan các sự kiện nổi bật gần đây: Logic đầu tư ETH thay đổi, định giá AI báo động đỏ, Multicoin đặt cược vào ZEC và HYPE

Kết quả kinh doanh Q2 của 6 ngân hàng lớn Phố Wall đồng loạt khởi sắc: Lợi nhuận Goldman Sachs tăng gấp đôi, tăng 8%, SpaceX IPO trở thành「chất xúc tác mạnh nhất」

Từ TrueFi đến Elara: Tại sao điểm đến tiếp theo của tài chính trên chuỗi là cơ sở hạ tầng thanh khoản?

Các nhà phân tích Phố Wall bị mua chuộc? Trao đổi lợi ích đằng sau định giá nghìn tỷ của SpaceX

Robinhood Chain Tổng kết toàn cảnh: Ngoài các meme như cashcat, còn có những dự án nào đáng chú ý?

Chỉ 67 trong số 1000 dự án tiền mã hóa hàng đầu theo vốn hóa thị trường có trang Wikipedia, «hiểu biết» của ChatGPT về ngành tiền mã hóa đang bị bóp méo

Phân tích báo cáo nghiên cứu Morgan Stanley: Trò chơi tăng giá của Apple, thực chất là đang phòng ngừa rủi ro chi phí chip bùng nổ.

WebX Tokyo: Diễn đàn định chế HashKey và Hackathon nỗ lực song song, thúc đẩy hiện thực hóa hệ sinh thái tài chính trên chuỗi

Giá trị giao dịch cổ phiếu ưu đãi của các doanh nghiệp crypto tăng vọt lên 13 tỷ USD, Strategy và Alphabet dẫn đầu "công cụ huy động vốn mới" bứt phá

Tuyển chọn TechFlow
Xem thêm>

Sự kiện AI GTC của NVIDIA khai mạc, ra mắt chip AI mạnh nhất Blackwell

Tuyển chọn TechFlowTuyển chọn TechFlow

Sự kiện AI GTC của NVIDIA khai mạc, ra mắt chip AI mạnh nhất Blackwell

Blackwell cải thiện chi phí và tiêu thụ năng lượng gấp 25 lần so với thế hệ trước – Vi xử lý mạnh nhất thế giới, quy trình 4nm của TSMC

Hiệu suất suy luận GB200 NVL72 tăng cao tới 30 lần so với H100

Amazon, Microsoft, Google và Oracle nằm trong số những nhà cung cấp dịch vụ đám mây đầu tiên hỗ trợ Blackwell

Dự án AI Project GR00T hỗ trợ robot hình người

TSMC và Synopsys áp dụng công nghệ quang khắc của NVIDIA

Phần mềm mới NIM giúp người dùng dễ dàng tận dụng GPU NVIDIA hiện có để suy luận AI

Bài viết liên quan

Nội dung bài viết

TechFlow Cục Tình báo: ASML lần thứ hai nâng dự báo doanh số cả năm lên 45 tỷ Euro, lỗ hổng bảo mật Claude và Cursor 0day gây chấn động cộng đồng nhà phát triển

Tổng quan các sự kiện nổi bật gần đây: Logic đầu tư ETH thay đổi, định giá AI báo động đỏ, Multicoin đặt cược vào ZEC và HYPE

Kết quả kinh doanh Q2 của 6 ngân hàng lớn Phố Wall đồng loạt khởi sắc: Lợi nhuận Goldman Sachs tăng gấp đôi, tăng 8%, SpaceX IPO trở thành「chất xúc tác mạnh nhất」

Từ TrueFi đến Elara: Tại sao điểm đến tiếp theo của tài chính trên chuỗi là cơ sở hạ tầng thanh khoản?

Các nhà phân tích Phố Wall bị mua chuộc? Trao đổi lợi ích đằng sau định giá nghìn tỷ của SpaceX

Robinhood Chain Tổng kết toàn cảnh: Ngoài các meme như cashcat, còn có những dự án nào đáng chú ý?

Chỉ 67 trong số 1000 dự án tiền mã hóa hàng đầu theo vốn hóa thị trường có trang Wikipedia, «hiểu biết» của ChatGPT về ngành tiền mã hóa đang bị bóp méo

Phân tích báo cáo nghiên cứu Morgan Stanley: Trò chơi tăng giá của Apple, thực chất là đang phòng ngừa rủi ro chi phí chip bùng nổ.

WebX Tokyo: Diễn đàn định chế HashKey và Hackathon nỗ lực song song, thúc đẩy hiện thực hóa hệ sinh thái tài chính trên chuỗi

Giá trị giao dịch cổ phiếu ưu đãi của các doanh nghiệp crypto tăng vọt lên 13 tỷ USD, Strategy và Alphabet dẫn đầu "công cụ huy động vốn mới" bứt phá

Tuyển chọn TechFlowXem thêm>

Tuyển chọn TechFlow
Xem thêm>