
Grok3 của Musk vẫn chưa phải là "thông minh nhất Trái Đất", nhưng chắc chắn là giàu nhất
Tuyển chọn TechFlowTuyển chọn TechFlow

Grok3 của Musk vẫn chưa phải là "thông minh nhất Trái Đất", nhưng chắc chắn là giàu nhất
Có tiền có thể tùy tiện, nhưng để trở thành "mạnh nhất" thì vẫn còn rất nhiều việc phải làm.

Hình ảnh: Được tạo bởi Wujie AI
Grok 3, "AI thông minh nhất trên Trái Đất" theo lời Elon Musk, đã chính thức ra mắt.
Trong một buổi phát trực tiếp thu hút hàng trăm nghìn người xem, Musk đã công bố Grok 3, cùng tham gia công bố còn có hai nhà nghiên cứu gốc Hoa là Tony Wu và Jimmy Ba, đồng sáng lập viên của xAI. Theo các bài kiểm tra chuẩn hóa, Grok 3 thực sự mạnh đến kinh ngạc, còn xét về mặt đầu tư vốn, cụm sức mạnh tính toán với 200.000 GPU phía sau lại càng gây choáng ngợp hơn.
Việc ra mắt Grok 3 bao gồm một loạt các mô hình: Grok 3, Grok 3 mini, cũng như các cập nhật như chế độ suy luận (Think), DeepSearch, Big Brain, v.v.
#01 Danh hiệu "AI thông minh nhất" đến từ bảng xếp hạng, còn thực tế thì sao?

Về đánh giá chuẩn hóa, Grok 3 thể hiện vượt trội so với các mô hình khác như GPT-4o, Gemini-2 Pro, Claude3.5 Sonnet, DeepSeek-V3 trong các bài kiểm tra suy luận toán học, STEM và lĩnh vực khoa học. Ngay cả phiên bản nhỏ hơn là Grok 3 Mini cũng đạt mức độ hàng đầu.

Các phiên bản sớm của Grok 3 cũng đạt điểm số cao trên nền tảng thử nghiệm cộng đồng Chatbot Arena, nơi các mô hình AI cạnh tranh lẫn nhau và người dùng bỏ phiếu chọn câu trả lời tốt nhất. Grok-3 là mô hình đầu tiên vượt qua mốc 1400 điểm, đứng đầu ở mọi hạng mục.

Kể từ khi ra mắt năm 2023, điểm MMILU của Grok tăng nhanh chóng, đặc biệt đạt bước đột phá rõ rệt với Grok 2 vào năm 2024, cho thấy khả năng đuổi kịp và tiến bộ nhanh so với dòng GPT.

"Grok 3 sở hữu khả năng suy luận rất mạnh mẽ, do đó trong các thử nghiệm mà chúng tôi từng thực hiện cho đến nay, Grok 3 đều thể hiện vượt trội so với bất kỳ sản phẩm nào đã công bố mà chúng tôi biết. Đây là một tín hiệu tích cực," Elon Musk nói qua cuộc gọi video tại Hội nghị Thượng đỉnh Chính phủ Thế giới tổ chức ở Dubai tuần trước.
Grok 3 cũng giới thiệu chế độ suy luận (Think), thông qua Grok 3 Reasoning và Grok 3 mini Reasoning, có thể suy nghĩ giống như các mô hình chuyên về suy luận như DeepSeek-R1. Mô hình Grok 3 có thể giải quyết các vấn đề phức tạp bằng cách cân nhắc mọi giải pháp khả thi, tự phê bình, xác minh giải pháp, quay lui, suy luận từ nguyên lý cơ bản, v.v. Tuy nhiên, để tránh việc sao chép, một phần quá trình suy luận của Grok 3 đã được làm mờ.

Grok 3 Reasoning vượt qua phiên bản tốt nhất của o3-mini —— o3-mini-high trên nhiều bài kiểm tra phổ biến, bao gồm cả AIME2025, một bộ tiêu chuẩn toán học mới.

Nhóm đã minh họa việc sử dụng chế độ Think của Grok 3 để tạo ra một đồ họa 3D hoạt hình về hành trình phóng tàu vũ trụ từ Trái Đất đến Sao Hỏa rồi trở về, thể hiện quỹ đạo cho cửa sổ phóng tiếp theo.
Trong phần trình diễn, Grok 3 cung cấp một đoạn mã Python sử dụng Matplotlib và giải thích chi tiết đoạn mã. Mã dường như giải định luật Kepler bằng phương pháp số. Sau khi chạy mã, Grok tạo hoạt ảnh hai hành tinh Trái Đất và Sao Hỏa, với quả cầu nhỏ màu xanh biểu thị hành trình của tàu vũ trụ giữa chúng.

Phần trình diễn được thực hiện trực tiếp nên chưa kiểm chứng hoàn toàn tính chính xác, nhưng Musk – người đang đeo mặt dây chuyền thể hiện quỹ đạo chuyển tiếp Trái Đất - Sao Hỏa – nhận xét rằng kết quả khá gần với lời giải thực tế.

Andrej Karpathy, người đã trải nghiệm trước Grok 3, cho biết chế độ Think của Grok 3 thực hiện được những nhiệm vụ mà DeepSeek-R1, Gemini 2.0 Flash Thinking và Claude chưa làm được, tuy nhiên ông cũng nói rằng các mô hình hàng đầu của OpenAI như o1-pro cũng có thể làm được điều tương tự.

Sau OpenAI, Gemini và Perplexity, Grok cũng ra mắt công cụ tìm kiếm sâu riêng mang tên Deep Search. Nhóm xAI định vị Deep Search là "cỗ máy tìm kiếm thế hệ tiếp theo", là sản phẩm thế hệ đầu tiên của Grok Agent. Nó không chỉ đơn thuần là công cụ truy xuất thông tin, mà nhằm hỗ trợ lập trình, nghiên cứu và giải đáp các vấn đề thường ngày.
Theo phần trình diễn, Deep Search của Grok 3 không có quá nhiều điểm nổi bật, chủ yếu nhấn mạnh vào việc khác biệt với mô hình khớp từ khóa truyền thống, có thể hiểu sâu ngữ nghĩa và ý định của truy vấn người dùng, lấy nội dung từ nhiều nguồn, kiểm chứng chéo để đảm bảo độ chính xác, đồng thời linh hoạt hơn trong điều chỉnh, cho phép người dùng chỉ định nguồn tài liệu.
Nhóm xAI đặc biệt nhấn mạnh tính minh bạch trong quá trình tìm kiếm của Deep Search, giúp người dùng hiểu được quá trình "suy nghĩ" của AI.
Andrej Karpathy cho rằng DeepSearch của Grok 3 tương đương với DeepResearch của Perplexity, nhưng vẫn chưa đạt đến trình độ của Deep Research mà OpenAI vừa công bố gần đây.
#02 Chế độ "Big Brain" đầy đủ sức mạnh
Đối với các truy vấn phức tạp hơn, chế độ "Big Brain" sẽ sử dụng thêm sức mạnh tính toán để suy luận. Nhóm xAI mô tả các mô hình suy luận này là phù hợp nhất với các vấn đề toán học, khoa học và lập trình, trông giống như một cách nói khác của phiên bản "đầy đủ sức mạnh".

Nhóm xAI đã minh họa việc Grok 3 dưới chế độ Big Brain tạo ra một trò chơi mới kết hợp Tetris (Xếp hình) và Bejeweled (Bảo vật mê cung). Nhóm giải thích rằng vì được tạo ngẫu hứng trong buổi phát trực tiếp nên Grok có thể mắc một vài lỗi nhỏ trong mã, khiến trò chơi không hoạt động hoàn toàn như mong đợi. Trong buổi thử nghiệm trực tiếp, trò chơi tạo ra có thể chạy được, nhưng có vấn đề về hiển thị màu sắc, và cũng chưa rõ liệu cơ chế xoá hàng ngang như trong Tetris đã được triển khai hay chưa.
Nhóm xAI cũng xác nhận kế hoạch ra mắt một studio game AI trong buổi phát trực tiếp, Musk trước đó một ngày cũng đã đăng tweet liên quan trên X.

#03 Có tiền có thể tùy hứng, nhưng để trở thành "mạnh nhất" còn cần làm nhiều hơn nữa

Grok 3 được xây dựng dựa trên cụm Colossus của xAI. Giai đoạn một với 100.000 card mất 122 ngày để xây dựng, sau đó mở rộng lên 200.000 card trong 92 ngày, sử dụng khoảng 200.000 GPU để huấn luyện Grok 3 và hoàn tất giai đoạn tiền huấn luyện vào đầu tháng Một. Trước đó, Musk từng đăng bài trên nền tảng X rằng việc phát triển Grok 3 sử dụng lượng tài nguyên tính toán "gấp 10 lần" so với người tiền nhiệm Grok 2, đồng thời tập dữ liệu huấn luyện cũng được mở rộng, bao gồm cả tài liệu các vụ án tòa án. Trong buổi phát trực tiếp, ông cho biết tài nguyên tính toán của Grok 3 khoảng gấp 15 lần so với Grok 2.
Musk cũng tiết lộ xAI đang xây dựng một cụm AI mới, với công suất sẽ gấp năm lần cụm hiện tại.

Về chế độ giọng nói, nhóm chưa đưa ra ngày phát hành cụ thể, nhưng Musk cho biết "khoảng một tuần nữa sẽ ra mắt".
Chi tiết cụ thể, giọng nói sẽ được tạo trực tiếp bởi một mô hình tương tự Grok, có khả năng hiểu lời nói và sinh ra âm thanh trực tiếp. Cách này giúp AI ghi nhớ chi tiết và tiếp tục cuộc hội thoại một cách tự nhiên hơn. Chức năng chế độ giọng nói sẽ được cung cấp cả trên ứng dụng và API.
xAI dự kiến ra mắt API của Grok-3 trong vài tuần tới. API này sẽ bao gồm các mô hình suy luận của Grok-3 và chức năng Deep Search. Nhóm xAI rất kỳ vọng vào các trường hợp ứng dụng doanh nghiệp, cho rằng khả năng mạnh mẽ của Grok-3 và sự góp mặt của Deep Search sẽ mang lại giá trị lớn cho người dùng doanh nghiệp.

Đáng chú ý, xAI gần đây còn tung chương trình khuyến mãi: chỉ cần đồng ý chia sẻ dữ liệu và nạp tối thiểu 5 USD sẽ được tặng 150 USD hạn mức API. Rõ ràng, xAI không ngại chịu lỗ chút ít, mà coi trọng hơn việc thu hút người dùng và dữ liệu thông qua cách này.
Về kế hoạch mã nguồn mở, Musk cho biết sẽ tiếp tục chiến lược trước đó, khi Grok 3 trưởng thành và ổn định (dự kiến trong vài tháng tới), sẽ công bố mã nguồn mở của Grok 2.

Hiện tại, người dùng có thể trải nghiệm thông qua website, ứng dụng X và Grok, tuy nhiên không phải tất cả các mô hình và chức năng liên quan đến Grok 3 đều đã ra mắt (một số vẫn đang trong giai đoạn thử nghiệm). Grok 3 sẽ được ra mắt trước tiên cho các thuê bao Premium+ trên nền tảng X, ngoài ra còn ra mắt dịch vụ đăng ký độc lập mang tên Super Grok, cung cấp các tính năng tiên tiến nhất và quyền truy cập sớm nhất cho người dùng Grok, với giá 30 USD mỗi tháng hoặc 300 USD mỗi năm. SuperGrok mở khóa thêm lượt truy vấn trong DeepSearch và cung cấp dịch vụ tạo hình ảnh không giới hạn.
Việc ra mắt Grok 3 đánh dấu sự cạnh tranh khốc liệt của xAI trong lĩnh vực AI, không chỉ đối đầu với OpenAI và Google, mà còn chịu áp lực từ các doanh nghiệp Trung Quốc mới nổi. Ví dụ, DeepSeek buộc các công ty AI toàn cầu phải điều chỉnh chiến lược, biến mô hình suy luận sâu thành "tiêu chuẩn", thúc đẩy OpenAI gần đây miễn phí mô hình suy luận của mình và bắt đầu đưa ra tín hiệu mã nguồn mở.

Đối với Musk, OpenAI có lẽ là đối thủ lớn nhất của xAI. Ông thành lập xAI vào năm 2023 nhằm trở thành lựa chọn thay thế cho OpenAI, đồng thời công khai chỉ trích kế hoạch tái cấu trúc OpenAI thành một doanh nghiệp vì lợi nhuận.
Musk còn khởi kiện OpenAI hai vụ, cáo buộc công ty này đi lệch khỏi nguyên tắc sáng lập ban đầu, đồng thời đề xuất mua bộ phận phi lợi nhuận của OpenAI với giá 97,4 tỷ USD, nhưng đề xuất này đã bị hội đồng quản trị OpenAI bác bỏ vào tuần trước. Sam Altman cho rằng mức giá mua này là chiến thuật "làm chậm tiến độ của chúng tôi". Dù từng tham gia sáng lập OpenAI, Musk đã chỉ trích công ty này kể từ khi rời hội đồng quản trị vào năm 2018.
Cả hai công ty đều đang huy động vốn khổng lồ, với định giá tăng vọt không ngừng. Theo Bloomberg tuần trước, xAI của Musk đang đàm phán huy động khoảng 10 tỷ USD, sau khi hoàn tất, định giá công ty sẽ đạt 75 tỷ USD, so với mức định giá trước đó là 51 tỷ USD. Đồng thời, OpenAI đang đàm phán huy động tối đa 40 tỷ USD, dự kiến định giá sẽ tăng lên 300 tỷ USD.
Tính chất "rủng rỉnh tiền bạc" nhờ vốn đầu tư của cả hai bên cũng rất rõ ràng. SoftBank, OpenAI, Oracle và MGX được hỗ trợ bởi Abu Dhabi đã cùng nhau tuyên bố vào tháng Một kế hoạch đầu tư 100 tỷ USD tại Mỹ, tổng cộng sẽ dành 500 tỷ USD để xây dựng trung tâm dữ liệu và các cơ sở hạ tầng AI khác. Đồng thời, Dell Technologies cũng sắp hoàn tất một thương vụ trị giá hơn 5 tỷ USD để cung cấp các máy chủ tối ưu hóa cho AI cho xAI.
Xét theo tình hình hiện tại, OpenAI thực sự là đối thủ cạnh tranh chính của xAI. Hai bên có mối quan hệ cạnh tranh trực tiếp về công nghệ, định vị thị trường và chiến lược huy động vốn. OpenAI vẫn dẫn đầu nhờ dòng sản phẩm trưởng thành và thị phần vững chắc. Dù việc ra mắt Grok 3 có ưu thế nhất định về một số chỉ số, nhưng nhìn chung phần trình diễn không có nhiều đổi mới, chủ yếu là bổ sung và đuổi kịp các doanh nghiệp hàng đầu ngành. Điều thực sự hỗ trợ Grok 3 dường như chủ yếu là 200.000 GPU và nguồn vốn hỗ trợ vô tận, chứ không phải đột phá công nghệ thực sự. Buổi ra mắt này cũng không phải là "lần cuối cùng AI có thể vượt qua Grok" như Musk từng nói.
Mở đầu buổi ra mắt Grok 3, Musk một lần nữa giới thiệu sứ mệnh của xAI và Grok: hiểu bản chất vũ trụ, làm rõ những gì đang xảy ra, tìm dấu vết người ngoài hành tinh, khám phá ý nghĩa của sự sống, tìm hiểu nguồn gốc vũ trụ và xác định cách kết thúc của nó. xAI theo đuổi chân lý, hướng tới trở thành trí tuệ nhân tạo tìm kiếm chân lý tối hậu.
Tuy nhiên, dù là để thực hiện những tầm nhìn lớn lao này hay đối mặt với cạnh tranh thực tế hơn, chỉ dựa vào "sức mạnh tiền bạc" và danh hiệu "mạnh nhất" trên bảng xếp hạng là chưa đủ. Để thực sự trở thành "trí tuệ nhân tạo thông minh nhất trên Trái Đất", Musk và xAI vẫn còn một chặng đường dài phía trước.
Chào mừng tham gia cộng đồng chính thức TechFlow
Nhóm Telegram:https://t.me/TechFlowDaily
Tài khoản Twitter chính thức:https://x.com/TechFlowPost
Tài khoản Twitter tiếng Anh:https://x.com/BlockFlow_News










