
Tốc độ suy luận đạt gấp 10 lần GPU của NVIDIA, Groq – công ty vừa huy động được 640 triệu USD – rốt cuộc là ai?
Tuyển chọn TechFlowTuyển chọn TechFlow

Tốc độ suy luận đạt gấp 10 lần GPU của NVIDIA, Groq – công ty vừa huy động được 640 triệu USD – rốt cuộc là ai?
Công ty khởi nghiệp kỳ lân sản xuất chip AI nổi tiếng với tốc độ nhanh Groq vừa công bố huy động được 640 triệu USD, định giá mới nhất cũng tăng vọt lên 2,8 tỷ USD.
Tác giả: Tâm Nguyên Vũ Trụ
Ngày 5 tháng 8, công ty khởi nghiệp về chip trí tuệ nhân tạo (AI) của Mỹ là Groq chính thức thông báo đã huy động thành công 640 triệu USD trong vòng gọi vốn mới nhất, định giá công ty đạt 2,8 tỷ USD.
Vòng gọi vốn này do BlackRock Private Equity Partners - quỹ đầu tư thuộc tập đoàn quản lý tài sản hàng đầu phố Wall là BlackRock dẫn dắt, với sự tham gia của Cisco Investments từ Cisco và Samsung Catalyst Fund từ Samsung Electronics. Điều này cho thấy rõ tiềm lực công nghệ đổi mới cùng nền tảng tài chính vững chắc đằng sau Groq.
01. Tổng quan nhanh trong 1 phút
1. Tên dự án: Groq
2. Thời gian thành lập: Năm 2016
3. Giới thiệu sản phẩm:
Chip tăng tốc AI LPU do Groq ra mắt được thiết kế riêng biệt dành cho các mô hình ngôn ngữ lớn (LLM), sở hữu hiệu suất suy luận cực cao. Hiệu năng của chip này vượt trội hơn GPU và TPU thông thường từ 10 đến 100 lần, tốc độ suy luận đạt gấp 10 lần GPU của NVIDIA.
4. Đội ngũ sáng lập:
-
Jonathan Ross: Người sáng lập kiêm CEO, từng là nhân viên nghiên cứu cốt lõi trong dự án TPU của Google
-
Yann LeCun: Chủ nhân giải thưởng Turing, một trong ba "ông tổ học sâu", đảm nhiệm cố vấn kỹ thuật
5. Tình hình gọi vốn:
-
Năm 2017, Groq nhận được 10,3 triệu USD trong vòng hạt giống ngay từ những ngày đầu thành lập;
-
Năm 2018, Groq huy động được 52,3 triệu USD trong vòng A, do Social Capital dẫn dắt;
-
Năm 2020, Groq huy động được 150 triệu USD trong vòng B, do Tiger Global Management dẫn dắt, với sự tham gia của D1 Capital Partners và The Spruce House Partnership;
-
Năm 2021, Groq huy động thêm 300 triệu USD trong vòng C, tiếp tục nhận được sự hỗ trợ từ Tiger Global Management và D1 Capital Partners;
-
Trong vòng gọi vốn mới nhất, Groq huy động được 640 triệu USD, do quỹ BlackRock Inc. dẫn dắt, với sự tham gia của Cisco và Samsung.
02. Tiên phong trong lĩnh vực bộ xử lý AI nhờ đổi mới sáng tạo
Quá trình thành lập Groq có thể được xem như một minh chứng điển hình về đổi mới và đột phá công nghệ.
Trước khi sáng lập Groq, Ross từng làm kỹ sư tại Google, phụ trách thúc đẩy nghiên cứu về học sâu và kiến trúc tính toán. Trong thời gian làm việc tại Google, Ross nhận thấy kiến trúc tính toán truyền thống gặp phải những điểm nghẽn hiệu suất đáng kể khi xử lý các tác vụ AI hiện đại, đặc biệt trong lĩnh vực học sâu và phân tích dữ liệu quy mô lớn.

CPU và GPU truyền thống không thể đáp ứng yêu cầu cao về tính toán song song và độ trễ thấp đối với các tác vụ này. Nhận thức đó đã thúc đẩy Ross rời Google để sáng lập một công ty chuyên phá vỡ giới hạn tính toán truyền thống – Groq.
Đội ngũ sáng lập Groq trong giai đoạn đầu tập trung toàn lực vào thiết kế phần cứng và nghiên cứu phát triển công nghệ. Các thành viên trong nhóm đều là những nhân tài hàng đầu trong lĩnh vực tính toán hiệu năng cao và bán dẫn, sở hữu kinh nghiệm phong phú cùng nền tảng kỹ thuật vững chắc. Những công việc ban đầu bao gồm thiết kế kiến trúc bộ xử lý, phát triển nguyên mẫu và kiểm thử hiệu năng.
Tư tưởng công nghệ của Groq xoay quanh một kiến trúc bộ xử lý đổi mới, hướng tới việc mang lại hiệu suất tính toán và hiệu quả cao hơn so với các bộ xử lý hiện có. Mục tiêu của công ty là thiết kế một nền tảng phần cứng có khả năng vượt qua giới hạn của CPU và GPU, nhằm đáp ứng nhu cầu ngày càng tăng về năng lực tính toán trong lĩnh vực AI và HPC.

Khi công nghệ ngày càng trưởng thành và nhu cầu thị trường gia tăng, Groq bắt đầu mở rộng phạm vi hoạt động sang các lĩnh vực như trung tâm dữ liệu, điện toán đám mây và điện toán biên. Hiện nay, công ty đã thiết lập mối quan hệ hợp tác chiến lược với nhiều đối tác công nghệ hàng đầu trong ngành, thúc đẩy việc ứng dụng sản phẩm trên toàn cầu.
03. Tái định hình tính toán hiệu năng cao
Kể từ khi thành lập, Groq đã nhanh chóng trở thành tiên phong trong lĩnh vực trí tuệ nhân tạo (AI) và tính toán hiệu năng cao (HPC) nhờ công nghệ đột phá và sản phẩm xuất sắc.
Cốt lõi công nghệ của Groq nằm ở kiến trúc bộ xử lý đổi mới. Khác với các bộ xử lý CPU và GPU truyền thống, triết lý thiết kế của Groq tập trung vào việc nâng cao năng lực tính toán và hiệu quả, đặc biệt nhắm đến nhu cầu của các ứng dụng AI hiện đại và ứng dụng xử lý dữ liệu quy mô lớn.
-
Thiết kế song song hóa cao độ: Kiến trúc bộ xử lý của Groq áp dụng mức độ song song hóa cực cao, tích hợp số lượng lớn đơn vị tính toán, có khả năng xử lý đồng thời khối lượng dữ liệu khổng lồ. Thiết kế này không chỉ nâng cao năng lực tính toán mà còn giảm thiểu độ trễ xử lý dữ liệu.
-
Tối ưu hóa đường đi dữ liệu: Bộ xử lý truyền thống thường gặp phải điểm nghẽn truyền tải dữ liệu; kiến trúc của Groq khắc phục điều này bằng cách tối ưu hóa đường đi dữ liệu và thiết kế bộ nhớ đệm tốc độ cao, giảm đáng kể độ trễ truyền tải dữ liệu. Nhờ vậy, bộ xử lý có thể xử lý các tập dữ liệu quy mô lớn hiệu quả hơn, đáp ứng yêu cầu hiệu suất cao trong quá trình huấn luyện và suy luận AI.
-
Tùy chọn cấu hình linh hoạt: Groq cung cấp nhiều tùy chọn cấu hình, cho phép người dùng điều chỉnh tài nguyên tính toán theo nhu cầu ứng dụng cụ thể. Sự linh hoạt này giúp bộ xử lý của họ có thể ứng dụng rộng rãi trong nhiều kịch bản tính toán khác nhau, từ trung tâm dữ liệu đến môi trường điện toán biên.

Bộ tăng tốc AI của Groq là thành phần cốt lõi trong danh mục sản phẩm, được thiết kế chuyên biệt nhằm tăng tốc quá trình huấn luyện và suy luận của các mô hình học sâu. Ưu thế của nó thể hiện rõ ở ba khía cạnh chính:
-
Thông lượng cao và độ trễ thấp: Bộ tăng tốc tăng tốc đáng kể quá trình huấn luyện mô hình học máy nhờ cải thiện năng lực xử lý và giảm độ trễ. Điều này đặc biệt quan trọng đối với các ứng dụng cần xử lý lượng dữ liệu khổng lồ như nhận dạng hình ảnh và xử lý ngôn ngữ tự nhiên.
-
Hỗ trợ thuật toán được tối ưu: Bộ tăng tốc của Groq tối ưu hóa nhiều thuật toán học máy khác nhau, bao gồm mạng nơ-ron tích chập (CNN), mạng nơ-ron hồi tiếp (RNN)... Thông qua tối ưu hóa ở tầng phần cứng, bộ tăng tốc có thể thực thi hiệu quả các tác vụ tính toán phức tạp này, nâng cao hiệu quả huấn luyện mô hình và hiệu suất suy luận.
-
Khả năng mở rộng và cấu hình: Thiết kế bộ tăng tốc hỗ trợ khả năng mở rộng cao, có thể xử lý các tác vụ xử lý dữ liệu ở quy mô khác nhau. Người dùng có thể cấu hình nhiều bộ tăng tốc kết hợp để xây dựng cụm tính toán hiệu năng cao, đáp ứng nhu cầu của các ứng dụng AI quy mô lớn.
Nhờ thiết kế song song hóa cao độ, đường đi dữ liệu được tối ưu và khả năng tăng tốc AI mạnh mẽ, Groq cung cấp hỗ trợ kỹ thuật vượt trội cho nhiều lĩnh vực như trung tâm dữ liệu, điện toán đám mây và điện toán biên.
Khi công nghệ không ngừng phát triển và sản phẩm tiếp tục được cải tiến, Groq đang cung cấp những giải pháp chưa từng có tiền lệ cho nhu cầu tính toán hiện đại, thúc đẩy công nghệ tính toán tiến lên một tầm cao mới.
Là một "ngựa ô" trong lĩnh vực chip AI, khả năng suy luận tốc độ cao của chip LPU từ Groq là điều không thể phủ nhận. Tuy nhiên, cùng với định giá công ty tăng vọt và kỳ vọng ngày càng cao từ thị trường, Groq cũng đang đối mặt với một loạt thách thức và vấn đề.
04. Thách thức và cơ hội song hành
Thứ nhất là vấn đề dung lượng của LPU. Mặc dù thể hiện hiệu suất vượt trội khi xử lý các mô hình ngôn ngữ lớn, nhưng dung lượng bộ nhớ nhỏ khiến khi triển khai thực tế có thể cần rất nhiều tài nguyên phần cứng.
Theo phân tích, khi chạy các mô hình lớn như LLaMA 70B, nhu cầu phần cứng và chi phí của Groq có thể cao hơn nhiều so với dự kiến, điều này rõ ràng gia tăng áp lực tài chính đối với công ty trong việc triển khai quy mô lớn.
Thứ hai, mặc dù tính chuyên dụng của LPU mang lại lợi thế trong các tác vụ cụ thể, nhưng cũng hạn chế phạm vi ứng dụng trong các tác vụ AI đa dạng hơn. So với GPU, tính phổ quát không đủ của LPU có thể ảnh hưởng đến sức cạnh tranh trong các kịch bản AI đa dạng.

Là một sản phẩm và công ty khởi nghiệp non trẻ, Groq vẫn còn nhiều việc phải làm trong các khía cạnh như độ trưởng thành công nghệ, mức độ công nhận thị trường và xây dựng hệ sinh thái. Công ty cần liên tục tối ưu sản phẩm, mở rộng đội ngũ nghiên cứu phát triển, đồng thời thiết lập quan hệ hợp tác với các đối tác trong ngành để đẩy nhanh tiến trình thương mại hóa công nghệ.
Nhìn về tương lai, cơ hội phát triển của Groq cũng vô cùng to lớn. Khi công nghệ AI không ngừng tiến bộ và phạm vi ứng dụng mở rộng, nhu cầu ngày càng tăng từ các doanh nghiệp đối với chip AI hiệu năng cao. Nếu Groq có thể giải quyết hiệu quả các vấn đề về chi phí và tính phổ quát, chip LPU của họ hoàn toàn có thể chiếm vị trí quan trọng trên thị trường suy luận AI.
Groq dự kiến sẽ tung ra 108.000 chip LPU trước cuối tháng 3 năm 2025. Nếu mục tiêu đầy tham vọng này đạt được, vị thế dẫn đầu của họ trong ngành sẽ được củng cố thêm nữa. Làm thế nào để Groq liên tục đột phá bản thân trong cuộc cạnh tranh khốc liệt trên thị trường, đạt được cả thành công về đổi mới công nghệ lẫn thành tựu thương mại, là điều đáng để chúng ta theo dõi sát sao.
Chào mừng tham gia cộng đồng chính thức TechFlow
Nhóm Telegram:https://t.me/TechFlowDaily
Tài khoản Twitter chính thức:https://x.com/TechFlowPost
Tài khoản Twitter tiếng Anh:https://x.com/BlockFlow_News














