Grok3 của Musk vẫn chưa phải là "thông minh nhất Trái Đất", nhưng chắc chắn là giàu nhất

2025.02.20

Chia sẻ đến

Tuyển chọn TechFlowTuyển chọn TechFlow

Grok3 của Musk vẫn chưa phải là "thông minh nhất Trái Đất", nhưng chắc chắn là giàu nhất

Có tiền có thể tùy tiện, nhưng để trở thành "mạnh nhất" thì vẫn còn rất nhiều việc phải làm.

2025.02.20 - 09:40:35

Grok3

Chuyên sâu báo cáo Web3

Có tiền có thể tùy tiện, nhưng để trở thành "mạnh nhất" thì vẫn còn rất nhiều việc phải làm.

Hình ảnh: Được tạo bởi Wujie AI

Grok 3, "AI thông minh nhất trên Trái Đất" theo lời Elon Musk, đã chính thức ra mắt.

Trong một buổi phát trực tiếp thu hút hàng trăm nghìn người xem, Musk đã công bố Grok 3, cùng tham gia công bố còn có hai nhà nghiên cứu gốc Hoa là Tony Wu và Jimmy Ba, đồng sáng lập viên của xAI. Theo các bài kiểm tra chuẩn hóa, Grok 3 thực sự mạnh đến kinh ngạc, còn xét về mặt đầu tư vốn, cụm sức mạnh tính toán với 200.000 GPU phía sau lại càng gây choáng ngợp hơn.

Việc ra mắt Grok 3 bao gồm một loạt các mô hình: Grok 3, Grok 3 mini, cũng như các cập nhật như chế độ suy luận (Think), DeepSearch, Big Brain, v.v.

#01 Danh hiệu "AI thông minh nhất" đến từ bảng xếp hạng, còn thực tế thì sao?

Về đánh giá chuẩn hóa, Grok 3 thể hiện vượt trội so với các mô hình khác như GPT-4o, Gemini-2 Pro, Claude3.5 Sonnet, DeepSeek-V3 trong các bài kiểm tra suy luận toán học, STEM và lĩnh vực khoa học. Ngay cả phiên bản nhỏ hơn là Grok 3 Mini cũng đạt mức độ hàng đầu.

Các phiên bản sớm của Grok 3 cũng đạt điểm số cao trên nền tảng thử nghiệm cộng đồng Chatbot Arena, nơi các mô hình AI cạnh tranh lẫn nhau và người dùng bỏ phiếu chọn câu trả lời tốt nhất. Grok-3 là mô hình đầu tiên vượt qua mốc 1400 điểm, đứng đầu ở mọi hạng mục.

Kể từ khi ra mắt năm 2023, điểm MMILU của Grok tăng nhanh chóng, đặc biệt đạt bước đột phá rõ rệt với Grok 2 vào năm 2024, cho thấy khả năng đuổi kịp và tiến bộ nhanh so với dòng GPT.

"Grok 3 sở hữu khả năng suy luận rất mạnh mẽ, do đó trong các thử nghiệm mà chúng tôi từng thực hiện cho đến nay, Grok 3 đều thể hiện vượt trội so với bất kỳ sản phẩm nào đã công bố mà chúng tôi biết. Đây là một tín hiệu tích cực," Elon Musk nói qua cuộc gọi video tại Hội nghị Thượng đỉnh Chính phủ Thế giới tổ chức ở Dubai tuần trước.

Grok 3 cũng giới thiệu chế độ suy luận (Think), thông qua Grok 3 Reasoning và Grok 3 mini Reasoning, có thể suy nghĩ giống như các mô hình chuyên về suy luận như DeepSeek-R1. Mô hình Grok 3 có thể giải quyết các vấn đề phức tạp bằng cách cân nhắc mọi giải pháp khả thi, tự phê bình, xác minh giải pháp, quay lui, suy luận từ nguyên lý cơ bản, v.v. Tuy nhiên, để tránh việc sao chép, một phần quá trình suy luận của Grok 3 đã được làm mờ.

Grok 3 Reasoning vượt qua phiên bản tốt nhất của o3-mini —— o3-mini-high trên nhiều bài kiểm tra phổ biến, bao gồm cả AIME2025, một bộ tiêu chuẩn toán học mới.

Nhóm đã minh họa việc sử dụng chế độ Think của Grok 3 để tạo ra một đồ họa 3D hoạt hình về hành trình phóng tàu vũ trụ từ Trái Đất đến Sao Hỏa rồi trở về, thể hiện quỹ đạo cho cửa sổ phóng tiếp theo.

Trong phần trình diễn, Grok 3 cung cấp một đoạn mã Python sử dụng Matplotlib và giải thích chi tiết đoạn mã. Mã dường như giải định luật Kepler bằng phương pháp số. Sau khi chạy mã, Grok tạo hoạt ảnh hai hành tinh Trái Đất và Sao Hỏa, với quả cầu nhỏ màu xanh biểu thị hành trình của tàu vũ trụ giữa chúng.

Phần trình diễn được thực hiện trực tiếp nên chưa kiểm chứng hoàn toàn tính chính xác, nhưng Musk – người đang đeo mặt dây chuyền thể hiện quỹ đạo chuyển tiếp Trái Đất - Sao Hỏa – nhận xét rằng kết quả khá gần với lời giải thực tế.

Andrej Karpathy, người đã trải nghiệm trước Grok 3, cho biết chế độ Think của Grok 3 thực hiện được những nhiệm vụ mà DeepSeek-R1, Gemini 2.0 Flash Thinking và Claude chưa làm được, tuy nhiên ông cũng nói rằng các mô hình hàng đầu của OpenAI như o1-pro cũng có thể làm được điều tương tự.

Sau OpenAI, Gemini và Perplexity, Grok cũng ra mắt công cụ tìm kiếm sâu riêng mang tên Deep Search. Nhóm xAI định vị Deep Search là "cỗ máy tìm kiếm thế hệ tiếp theo", là sản phẩm thế hệ đầu tiên của Grok Agent. Nó không chỉ đơn thuần là công cụ truy xuất thông tin, mà nhằm hỗ trợ lập trình, nghiên cứu và giải đáp các vấn đề thường ngày.

Theo phần trình diễn, Deep Search của Grok 3 không có quá nhiều điểm nổi bật, chủ yếu nhấn mạnh vào việc khác biệt với mô hình khớp từ khóa truyền thống, có thể hiểu sâu ngữ nghĩa và ý định của truy vấn người dùng, lấy nội dung từ nhiều nguồn, kiểm chứng chéo để đảm bảo độ chính xác, đồng thời linh hoạt hơn trong điều chỉnh, cho phép người dùng chỉ định nguồn tài liệu.

Nhóm xAI đặc biệt nhấn mạnh tính minh bạch trong quá trình tìm kiếm của Deep Search, giúp người dùng hiểu được quá trình "suy nghĩ" của AI.

Andrej Karpathy cho rằng DeepSearch của Grok 3 tương đương với DeepResearch của Perplexity, nhưng vẫn chưa đạt đến trình độ của Deep Research mà OpenAI vừa công bố gần đây.

#02 Chế độ "Big Brain" đầy đủ sức mạnh

Đối với các truy vấn phức tạp hơn, chế độ "Big Brain" sẽ sử dụng thêm sức mạnh tính toán để suy luận. Nhóm xAI mô tả các mô hình suy luận này là phù hợp nhất với các vấn đề toán học, khoa học và lập trình, trông giống như một cách nói khác của phiên bản "đầy đủ sức mạnh".

Nhóm xAI đã minh họa việc Grok 3 dưới chế độ Big Brain tạo ra một trò chơi mới kết hợp Tetris (Xếp hình) và Bejeweled (Bảo vật mê cung). Nhóm giải thích rằng vì được tạo ngẫu hứng trong buổi phát trực tiếp nên Grok có thể mắc một vài lỗi nhỏ trong mã, khiến trò chơi không hoạt động hoàn toàn như mong đợi. Trong buổi thử nghiệm trực tiếp, trò chơi tạo ra có thể chạy được, nhưng có vấn đề về hiển thị màu sắc, và cũng chưa rõ liệu cơ chế xoá hàng ngang như trong Tetris đã được triển khai hay chưa.

Nhóm xAI cũng xác nhận kế hoạch ra mắt một studio game AI trong buổi phát trực tiếp, Musk trước đó một ngày cũng đã đăng tweet liên quan trên X.

#03 Có tiền có thể tùy hứng, nhưng để trở thành "mạnh nhất" còn cần làm nhiều hơn nữa

Grok 3 được xây dựng dựa trên cụm Colossus của xAI. Giai đoạn một với 100.000 card mất 122 ngày để xây dựng, sau đó mở rộng lên 200.000 card trong 92 ngày, sử dụng khoảng 200.000 GPU để huấn luyện Grok 3 và hoàn tất giai đoạn tiền huấn luyện vào đầu tháng Một. Trước đó, Musk từng đăng bài trên nền tảng X rằng việc phát triển Grok 3 sử dụng lượng tài nguyên tính toán "gấp 10 lần" so với người tiền nhiệm Grok 2, đồng thời tập dữ liệu huấn luyện cũng được mở rộng, bao gồm cả tài liệu các vụ án tòa án. Trong buổi phát trực tiếp, ông cho biết tài nguyên tính toán của Grok 3 khoảng gấp 15 lần so với Grok 2.

Musk cũng tiết lộ xAI đang xây dựng một cụm AI mới, với công suất sẽ gấp năm lần cụm hiện tại.

Về chế độ giọng nói, nhóm chưa đưa ra ngày phát hành cụ thể, nhưng Musk cho biết "khoảng một tuần nữa sẽ ra mắt".

Chi tiết cụ thể, giọng nói sẽ được tạo trực tiếp bởi một mô hình tương tự Grok, có khả năng hiểu lời nói và sinh ra âm thanh trực tiếp. Cách này giúp AI ghi nhớ chi tiết và tiếp tục cuộc hội thoại một cách tự nhiên hơn. Chức năng chế độ giọng nói sẽ được cung cấp cả trên ứng dụng và API.

xAI dự kiến ra mắt API của Grok-3 trong vài tuần tới. API này sẽ bao gồm các mô hình suy luận của Grok-3 và chức năng Deep Search. Nhóm xAI rất kỳ vọng vào các trường hợp ứng dụng doanh nghiệp, cho rằng khả năng mạnh mẽ của Grok-3 và sự góp mặt của Deep Search sẽ mang lại giá trị lớn cho người dùng doanh nghiệp.

Đáng chú ý, xAI gần đây còn tung chương trình khuyến mãi: chỉ cần đồng ý chia sẻ dữ liệu và nạp tối thiểu 5 USD sẽ được tặng 150 USD hạn mức API. Rõ ràng, xAI không ngại chịu lỗ chút ít, mà coi trọng hơn việc thu hút người dùng và dữ liệu thông qua cách này.

Về kế hoạch mã nguồn mở, Musk cho biết sẽ tiếp tục chiến lược trước đó, khi Grok 3 trưởng thành và ổn định (dự kiến trong vài tháng tới), sẽ công bố mã nguồn mở của Grok 2.

Hiện tại, người dùng có thể trải nghiệm thông qua website, ứng dụng X và Grok, tuy nhiên không phải tất cả các mô hình và chức năng liên quan đến Grok 3 đều đã ra mắt (một số vẫn đang trong giai đoạn thử nghiệm). Grok 3 sẽ được ra mắt trước tiên cho các thuê bao Premium+ trên nền tảng X, ngoài ra còn ra mắt dịch vụ đăng ký độc lập mang tên Super Grok, cung cấp các tính năng tiên tiến nhất và quyền truy cập sớm nhất cho người dùng Grok, với giá 30 USD mỗi tháng hoặc 300 USD mỗi năm. SuperGrok mở khóa thêm lượt truy vấn trong DeepSearch và cung cấp dịch vụ tạo hình ảnh không giới hạn.

Việc ra mắt Grok 3 đánh dấu sự cạnh tranh khốc liệt của xAI trong lĩnh vực AI, không chỉ đối đầu với OpenAI và Google, mà còn chịu áp lực từ các doanh nghiệp Trung Quốc mới nổi. Ví dụ, DeepSeek buộc các công ty AI toàn cầu phải điều chỉnh chiến lược, biến mô hình suy luận sâu thành "tiêu chuẩn", thúc đẩy OpenAI gần đây miễn phí mô hình suy luận của mình và bắt đầu đưa ra tín hiệu mã nguồn mở.

Đối với Musk, OpenAI có lẽ là đối thủ lớn nhất của xAI. Ông thành lập xAI vào năm 2023 nhằm trở thành lựa chọn thay thế cho OpenAI, đồng thời công khai chỉ trích kế hoạch tái cấu trúc OpenAI thành một doanh nghiệp vì lợi nhuận.

Musk còn khởi kiện OpenAI hai vụ, cáo buộc công ty này đi lệch khỏi nguyên tắc sáng lập ban đầu, đồng thời đề xuất mua bộ phận phi lợi nhuận của OpenAI với giá 97,4 tỷ USD, nhưng đề xuất này đã bị hội đồng quản trị OpenAI bác bỏ vào tuần trước. Sam Altman cho rằng mức giá mua này là chiến thuật "làm chậm tiến độ của chúng tôi". Dù từng tham gia sáng lập OpenAI, Musk đã chỉ trích công ty này kể từ khi rời hội đồng quản trị vào năm 2018.

Cả hai công ty đều đang huy động vốn khổng lồ, với định giá tăng vọt không ngừng. Theo Bloomberg tuần trước, xAI của Musk đang đàm phán huy động khoảng 10 tỷ USD, sau khi hoàn tất, định giá công ty sẽ đạt 75 tỷ USD, so với mức định giá trước đó là 51 tỷ USD. Đồng thời, OpenAI đang đàm phán huy động tối đa 40 tỷ USD, dự kiến định giá sẽ tăng lên 300 tỷ USD.

Tính chất "rủng rỉnh tiền bạc" nhờ vốn đầu tư của cả hai bên cũng rất rõ ràng. SoftBank, OpenAI, Oracle và MGX được hỗ trợ bởi Abu Dhabi đã cùng nhau tuyên bố vào tháng Một kế hoạch đầu tư 100 tỷ USD tại Mỹ, tổng cộng sẽ dành 500 tỷ USD để xây dựng trung tâm dữ liệu và các cơ sở hạ tầng AI khác. Đồng thời, Dell Technologies cũng sắp hoàn tất một thương vụ trị giá hơn 5 tỷ USD để cung cấp các máy chủ tối ưu hóa cho AI cho xAI.

Xét theo tình hình hiện tại, OpenAI thực sự là đối thủ cạnh tranh chính của xAI. Hai bên có mối quan hệ cạnh tranh trực tiếp về công nghệ, định vị thị trường và chiến lược huy động vốn. OpenAI vẫn dẫn đầu nhờ dòng sản phẩm trưởng thành và thị phần vững chắc. Dù việc ra mắt Grok 3 có ưu thế nhất định về một số chỉ số, nhưng nhìn chung phần trình diễn không có nhiều đổi mới, chủ yếu là bổ sung và đuổi kịp các doanh nghiệp hàng đầu ngành. Điều thực sự hỗ trợ Grok 3 dường như chủ yếu là 200.000 GPU và nguồn vốn hỗ trợ vô tận, chứ không phải đột phá công nghệ thực sự. Buổi ra mắt này cũng không phải là "lần cuối cùng AI có thể vượt qua Grok" như Musk từng nói.

Mở đầu buổi ra mắt Grok 3, Musk một lần nữa giới thiệu sứ mệnh của xAI và Grok: hiểu bản chất vũ trụ, làm rõ những gì đang xảy ra, tìm dấu vết người ngoài hành tinh, khám phá ý nghĩa của sự sống, tìm hiểu nguồn gốc vũ trụ và xác định cách kết thúc của nó. xAI theo đuổi chân lý, hướng tới trở thành trí tuệ nhân tạo tìm kiếm chân lý tối hậu.

Tuy nhiên, dù là để thực hiện những tầm nhìn lớn lao này hay đối mặt với cạnh tranh thực tế hơn, chỉ dựa vào "sức mạnh tiền bạc" và danh hiệu "mạnh nhất" trên bảng xếp hạng là chưa đủ. Để thực sự trở thành "trí tuệ nhân tạo thông minh nhất trên Trái Đất", Musk và xAI vẫn còn một chặng đường dài phía trước.

Chào mừng tham gia cộng đồng chính thức TechFlow

Nhóm Telegram:https://t.me/TechFlowDaily

Tài khoản Twitter chính thức:https://x.com/TechFlowPost

Tài khoản Twitter tiếng Anh:https://x.com/BlockFlow_News

Thêm vào mục ưa thích

Chia sẻ lên mạng xã hội

Tác giả

硅星人Pro

Bài viết liên quan

2025.02.19

Kiểm tra Grok3, mô hình được cho là "thông minh nhất thế giới": Liệu nó thực sự là điểm kết thúc của hiệu ứng cận biên mô hình?

Grok3 tiêu tốn năng lực tính toán gấp 263 lần DeepSeek V3, chỉ có vậy thôi sao?

2025.02.18

xAI của Musk ra mắt mô hình suy luận Grok3, tự nhận vượt trội hơn o1, R1

Trước đó, Musk từng gọi Grok 3 là "trí tuệ nhân tạo thông minh nhất trên Trái Đất".

2026.07.24

TechFlow Điểm tin: Người đoạt giải Fields gia nhập OpenAI ngay ngày trao giải, doanh thu Quý 2 của Intel tăng vọt 25%, cổ phiếu tăng 13% sau giờ giao dịch

AI Agent của chúng tôi đã hoàn thành đợt tuần tra hôm nay từ 200+ nguồn thông tin toàn cầu về Crypto, AI, Công nghệ, lọc bỏ 99% nhiễu, giữ lại tín hiệu bạn thực sự cần.

2026.07.24

AI đã viết xong code thay bạn, nhưng không ai còn muốn nghiêm túc xem lại nữa

Các ông lớn đua nhau tự xây dựng công cụ để ứng phó, nhưng các giải pháp trưởng thành vẫn còn dừng lại ở giai đoạn thử nghiệm.

2026.07.24

Sự phù hợp hoàn hảo giữa nhà sáng lập và thị trường: Thị trường gấu mới là phép thử tốt nhất

Vì vậy, vấn đề chưa bao giờ là thị trường có trở lại hay không, mà là khi thị trường trở lại thì ai vẫn còn đứng vững.

2026.07.24

Tại sao trung tâm dữ liệu lại bị ghét bỏ? Các gã khổng lồ công nghệ cần mang đến cho nông thôn một câu chuyện mới.

Đã tháo gỡ bế tắc của câu chuyện trung tâm dữ liệu.

2026.07.24

Đạo luật CLARITY rơi vào bế tắc: Mánh khóe "thực thi chân không" của điều khoản đạo đức

Thiết kế "tự giám sát chính mình" này khiến thị trường nhanh chóng hạ nhiệt từ cơn hưng phấn thứ Ba xuống mức xóa bỏ mức tăng vào thứ Tư.

2026.07.24

Công tắc 4 triệu tỷ USD đã được gạt: DTCC đưa Phố Wall lên chuỗi, đây là sự thay thế cơ sở hạ tầng chứ không phải ván cược crypto

Vấn đề cơ sở hạ tầng đã được giải quyết. Điều duy nhất chưa được định giá chính là lộ trình.

2026.07.24

Bán công cụ hay bán kết quả? Các công ty AI đang hướng tới hai tương lai hoàn toàn khác nhau

Phần có thể tự động hóa thì giao cho AI, phần không thể thì chuyển sang con người đảm nhận.

2026.07.24

Báo cáo hàng ngày Bitget UEX｜Thuế quan mới của Mỹ có hiệu lực, rủi ro Trung Đông gia tăng; Kết quả kinh doanh của Intel vượt kỳ vọng, cạnh tranh AI thay đổi; Bảy gã khổng lồ cùng giảm, Tesla lao dốc

Chiến lược tổng thể khuyến nghị tập trung vào các nhóm ngành hưởng lợi như Năng lượng và Quốc phòng, đồng thời thận trọng với các cổ phiếu công nghệ có mức chi tiêu vốn cao, chờ đợi tín hiệu vĩ mô và kết quả kinh doanh trở nên rõ ràng.

Nội dung bài viết

Tuyển chọn TechFlow
Xem thêm>

Ghi chú Podcast｜Phỏng vấn mới nhất của Jensen Huang: Ngành chip còn cần mở rộng thêm 5 đến 10 lần, mô hình Trung Quốc có lợi cho tất cả mọi người

2026.07.24

Sự phù hợp hoàn hảo giữa nhà sáng lập và thị trường: Thị trường gấu mới là phép thử tốt nhất

2026.07.24

Định giá tăng vọt gần 7 lần trong một năm, "trung gian" mô hình lớn OpenRouter sắp bán mình

2026.07.24

Đạo luật CLARITY rơi vào bế tắc: Mánh khóe "thực thi chân không" của điều khoản đạo đức

2026.07.24

Giải mã báo cáo nghiên cứu của Bank of America: Nvidia và AMD đối đầu trực diện, ai định hình tiêu chuẩn mới cho CPU AI Agent?

2026.07.24

Chuyên sâu báo cáo Web3

Tôi muốn đăng bài

Yêu cầu phỏng vấn

Theo dõi chúng tôi

Cảnh báo rủi ro: mọi nội dung trên website này không cấu thành tư vấn đầu tư và chúng tôi không cung cấp bất kỳ dịch vụ tín hiệu hay dẫn dắt giao dịch nào. Theo thông báo của PBoC và 10 bộ ngành về việc tăng cường phòng ngừa rủi ro đầu cơ tiền mã hóa, xin hãy nâng cao ý thức rủi ro. Liên hệ: [email protected] Mã ICP: 琼ICP备2022009338号

Phiên bản di động

Grok3 của Musk vẫn chưa phải là "thông minh nhất Trái Đất", nhưng chắc chắn là giàu nhất

Tuyển chọn TechFlowTuyển chọn TechFlow

Grok3 của Musk vẫn chưa phải là "thông minh nhất Trái Đất", nhưng chắc chắn là giàu nhất

#01 Danh hiệu "AI thông minh nhất" đến từ bảng xếp hạng, còn thực tế thì sao?

#02 Chế độ "Big Brain" đầy đủ sức mạnh

#03 Có tiền có thể tùy hứng, nhưng để trở thành "mạnh nhất" còn cần làm nhiều hơn nữa

Bài viết liên quan

Kiểm tra Grok3, mô hình được cho là "thông minh nhất thế giới": Liệu nó thực sự là điểm kết thúc của hiệu ứng cận biên mô hình?

xAI của Musk ra mắt mô hình suy luận Grok3, tự nhận vượt trội hơn o1, R1

TechFlow Điểm tin: Người đoạt giải Fields gia nhập OpenAI ngay ngày trao giải, doanh thu Quý 2 của Intel tăng vọt 25%, cổ phiếu tăng 13% sau giờ giao dịch

AI đã viết xong code thay bạn, nhưng không ai còn muốn nghiêm túc xem lại nữa

Sự phù hợp hoàn hảo giữa nhà sáng lập và thị trường: Thị trường gấu mới là phép thử tốt nhất

Tại sao trung tâm dữ liệu lại bị ghét bỏ? Các gã khổng lồ công nghệ cần mang đến cho nông thôn một câu chuyện mới.

Đạo luật CLARITY rơi vào bế tắc: Mánh khóe "thực thi chân không" của điều khoản đạo đức

Công tắc 4 triệu tỷ USD đã được gạt: DTCC đưa Phố Wall lên chuỗi, đây là sự thay thế cơ sở hạ tầng chứ không phải ván cược crypto

Bán công cụ hay bán kết quả? Các công ty AI đang hướng tới hai tương lai hoàn toàn khác nhau

Báo cáo hàng ngày Bitget UEX｜Thuế quan mới của Mỹ có hiệu lực, rủi ro Trung Đông gia tăng; Kết quả kinh doanh của Intel vượt kỳ vọng, cạnh tranh AI thay đổi; Bảy gã khổng lồ cùng giảm, Tesla lao dốc

Nội dung bài viết

Tuyển chọn TechFlowXem thêm>

Tuyển chọn TechFlow
Xem thêm>