Gemini 3 tấn công vào ban đêm: Vượt mặt GPT 5.1, kỷ nguyên mô hình lớn của Google đã đến

2025.11.19

Chia sẻ đến

Tuyển chọn TechFlowTuyển chọn TechFlow

Gemini 3 tấn công vào ban đêm: Vượt mặt GPT 5.1, kỷ nguyên mô hình lớn của Google đã đến

Google định nghĩa đây là "một bước tiến quan trọng hướng tới AGI" và nhấn mạnh rằng đây hiện là tác nhân thông minh có khả năng hiểu đa phương tiện mạnh nhất và tương tác sâu nhất trên thế giới.

2025.11.19 - 01:34:21

GoogleAI

Chuyên sâu báo cáo Web3

Chưa kịp thấy Gemini 3 xuất hiện, Twitter đã sập trước để chào đón.

Không có mô hình nào được ra mắt với sự mong đợi lớn như Gemini 3. Với tần suất cập nhật ba tháng một lần trước đó của Gemini, cộng đồng AI từ tháng 9 đã háo hức chờ đợi Gemini 3.

Hôm nay, một bài đăng Twitter chỉ chứa từ "Gemini" của người đứng đầu quan hệ nhà phát triển Google và người phụ trách Google AI Studio đã khiến kỳ vọng tích tụ suốt nhiều tháng bùng nổ, các chủ đề liên quan trên Twitter lập tức trở nên sôi động.

Điều thú vị là, khi đến gần thời điểm ra mắt, Twitter lại "hợp cảnh" mà sập vài lần. Dù "thủ phạm" phía sau là Cloudflare, nhưng thời điểm sập mạng chính xác đến mức khiến người ta nghi ngờ có ai đó cố tình gây rối (thì thầm: dù sao Twitter cũng là sân khấu quảng bá chính cho các mô hình).

Không biết Elon Musk, người vừa tung Grok 4.1 sáng nay, lúc này cảm nghĩ thế nào, nhưng những meme của cư dân mạng đã lan tràn khắp nơi.

Vừa mới đây, Gemini 3 cuối cùng đã chính thức ra mắt, hãy cùng xem thử nó mạnh đến mức nào dưới ánh đèn soi rọi của cả thế giới.

Mô hình thông minh nhất

Sự thật chứng minh rằng Google không làm người chờ đợi thất vọng, Gemini 3 đã chính thức ra mắt, một lần nữa định nghĩa lại SOTA, ngay cả Sam Altman và Elon Musk cũng gửi lời chúc mừng.

Google định nghĩa nó là "một bước tiến quan trọng trên con đường hướng tới AGI", đồng thời nhấn mạnh đây là tác nhân thông minh có khả năng hiểu đa phương thức mạnh nhất và tương tác sâu sắc nhất trên thế giới hiện nay.

Gemini 3 không chỉ nâng cao tiêu chuẩn SOTA về khả năng suy luận cơ bản, mà còn tìm cách tái cấu trúc hệ sinh thái nhà phát triển và trải nghiệm trợ lý AI thông qua việc ra mắt nền tảng Google Antigravity hoàn toàn mới và chế độ Deep Think.

Quái vật suy luận thống trị mọi bảng xếp hạng

Gemini 3 Pro được gọi là "mô hình suy luận tiên tiến nhất", vượt xa rõ rệt so với phiên bản trước Gemini 2.5 Pro trong hầu hết các bài kiểm tra chuẩn AI chính, đồng thời áp đảo hoàn toàn các đối thủ cạnh tranh chính như Claude Sonnet 4.5 và GPT-5.1.

Gemini 3 Pro đạt đỉnh LMArena Leaderboard với số điểm đột phá 1501 Elo, giành điểm cao nhất tại Humanity’s Last Exam (đạt 37.5% mà không dùng bất kỳ công cụ nào) và GPQA Diamond (91.9%), thể hiện khả năng suy luận ở trình độ tiến sĩ. Nó cũng đặt ra tiêu chuẩn mới cho các mô hình hàng đầu trong lĩnh vực toán học, đạt mức SOTA mới là 23.4% trên MathArena Apex.

Ngoài văn bản và logic, Gemini 3 Pro còn định nghĩa lại giới hạn của suy luận đa phương thức. Nó đạt điểm cao lần lượt là 81% và 87.6% trên MMMU-Pro và Video-MMMU, điều này có nghĩa là dù phân tích biểu đồ khoa học phức tạp hay hiểu luồng video động, nó đều xử lý dễ dàng.

Đáng chú ý hơn, nó đạt 72.1% trên SimpleQA Verified, cho thấy sự tiến bộ lớn về độ chính xác thông tin —— nó không chỉ mạnh mẽ, mà còn đáng tin cậy.

Người bạn tư duy thẳng thắn, không xu nịnh

Sự tiến hóa của Gemini 3 Pro không chỉ nằm ở điểm số, mà còn ở chất lượng tương tác. Nó loại bỏ lối nói sáo rỗng và sự xu nịnh quá mức thường thấy ở các AI trước đây, trở nên thông minh, súc tích và trực tiếp: nói cho bạn những điều bạn cần nghe, chứ không phải chỉ những điều bạn muốn nghe.

Nó đóng vai trò là người bạn tư duy thực sự, mang đến cho bạn những cách thức mới để hiểu thông tin và thể hiện bản thân, từ việc dịch các khái niệm khoa học khó hiểu bằng cách tạo mã hóa hình ảnh chân thực cao, đến việc tư duy sáng tạo.

Gemini 3 Deep Think

Chế độ Gemini 3 Deep Think mở rộng thêm ranh giới trí tuệ, mang lại bước tiến lớn về khả năng suy luận và hiểu đa phương thức của Gemini 3, giúp bạn giải quyết các vấn đề phức tạp hơn.

Trong các bài kiểm tra, Gemini 3 Deep Think đều thể hiện tốt hơn thành tích vốn đã rất ấn tượng của Gemini 3 Pro tại Humanity's Last Exam (đạt 41.0% mà không dùng công cụ) và GPQA Diamond (đạt 93.8%). Ngoài ra, nó còn đạt điểm chưa từng có là 45.1% trên ARC-AGI-2 (thực thi mã, đã được xác minh bởi ARC Prize), thể hiện khả năng giải quyết các thách thức hoàn toàn mới.

Chế độ Gemini 3 Deep Think thể hiện xuất sắc trong một số bài kiểm tra chuẩn AI thách thức nhất.

Học tập, xây dựng và lập kế hoạch

Học bất cứ điều gì

Gemini từ đầu đã được thiết kế nhằm tích hợp liền mạch thông tin đa phương thức về mọi chủ đề, bao gồm văn bản, hình ảnh, video, âm thanh và mã. Gemini 3 kết hợp khả năng suy luận tiên tiến, khả năng thị giác và hiểu không gian, hiệu suất đa ngôn ngữ dẫn đầu cùng cửa sổ ngữ cảnh lên tới hàng triệu token, mở rộng thêm ranh giới suy luận đa phương thức, giúp bạn học theo cách phù hợp nhất với mình.

Ví dụ, nếu bạn muốn học cách nấu món ăn truyền thống gia đình, Gemini 3 có thể đọc hiểu và dịch các công thức viết tay bằng nhiều ngôn ngữ khác nhau, rồi tạo ra công thức để chia sẻ với gia đình.

Hoặc, nếu bạn muốn học một chủ đề mới, bạn có thể cung cấp các bài báo học thuật, bài giảng dài hoặc hướng dẫn video, nó có thể tạo thẻ ghi nhớ tương tác, hình ảnh hóa hoặc mã ở định dạng khác, giúp bạn nắm vững kiến thức liên quan.

Nó thậm chí có thể phân tích video trận đấu pickleball của bạn, tìm ra điểm cần cải thiện và lập kế hoạch tập luyện để giúp bạn nâng cao toàn diện kỹ năng chơi bóng.

Để giúp bạn hiểu rõ hơn thông tin trên mạng, chế độ AI trong tìm kiếm hiện sử dụng Gemini 3 để mang lại trải nghiệm giao diện sinh tạo mới, ví dụ như bố cục hình ảnh sống động, công cụ tương tác và mô phỏng, tất cả đều được tạo tức thì dựa trên truy vấn của bạn.

Xây dựng bất cứ thứ gì

Dựa trên thành công của phiên bản 2.5 Pro, Gemini 3 thực hiện lời hứa biến mọi ý tưởng của nhà phát triển thành hiện thực. Nó thể hiện xuất sắc trong việc tạo mã zero-shot, xử lý các gợi ý và chỉ dẫn phức tạp, từ đó hiển thị giao diện người dùng web phong phú và tương tác hơn.

Gemini 3 là mô hình mã hóa Vibe và Agent tốt nhất mà Google từng xây dựng, giúp sản phẩm của Google tự chủ hơn và nâng cao đáng kể hiệu suất của nhà phát triển. Nó đứng đầu bảng xếp hạng WebDev Arena với điểm số ấn tượng 1487 Elo. Ngoài ra, nó cũng đạt 54.2% trong bài kiểm tra Terminal-Bench 2.0, nhằm đánh giá khả năng sử dụng công cụ điều khiển máy tính qua terminal. Đồng thời, nó cũng vượt xa phiên bản 2.5 Pro (76.2%) trong bài kiểm tra SWE-bench Verified, dùng để đo lường hiệu suất của tác nhân lập trình.

Bây giờ, người dùng có thể xây dựng với Gemini 3 trong Google AI Studio, Vertex AI, Gemini CLI và nền tảng phát triển tác nhân mới của Google, Google Antigravity. Nó cũng có sẵn trên các nền tảng bên thứ ba như Cursor, GitHub, JetBrains, Manus, Replit.

Ví dụ như viết một trò chơi tàu vũ trụ 3D cổ điển với hiệu ứng hình ảnh phong phú hơn và tương tác mạnh mẽ hơn.

Hay viết giao diện web UI và ứng dụng phong phú, tương tác hơn.

Lập kế hoạch mọi việc

Kể từ khi ra mắt tác nhân Gemini 2, Gemini đã nâng cao đáng kể khả năng lập kế hoạch trong các nhiệm vụ dài hạn.

Khả năng lập kế hoạch của Gemini 3 tiếp tục được khẳng định qua bài kiểm tra Vending-Bench 2: Gemini 3 đứng đầu bảng xếp hạng này trong bài kiểm tra vận hành máy bán hàng mô phỏng, quản lý hoạt động kinh doanh ảo toàn bộ quá trình thông qua lập kế hoạch dài hạn.

Trong mô phỏng đầy đủ một năm vận hành, Gemini 3 Pro duy trì sự ổn định trong việc gọi công cụ và tính liên tục trong ra quyết định, đồng thời duy trì mục tiêu nhiệm vụ và đạt được tỷ suất lợi nhuận cao hơn.

Gemini 3 Pro thể hiện khả năng lập kế hoạch dài hạn vượt trội hơn, tạo ra lợi nhuận cao hơn so với các mô hình hàng đầu khác.

Tác nhân Gemini còn có thể giúp dọn dẹp hộp thư Gmail của bạn.

Gemini 3 hiện đã mở rộng toàn diện. Kể từ hôm nay, người dùng thông thường và người dùng đăng ký có thể sử dụng mô hình mới thông qua ứng dụng Gemini và chế độ AI trong tìm kiếm; các nhà phát triển và khách hàng doanh nghiệp cũng có thể truy cập thông qua AI Studio, Vertex AI và các kênh khác. Về chế độ "Suy nghĩ sâu" được mong đợi, dự kiến sẽ ra mắt độc quyền trong vài tuần tới dành cho người đăng ký Google AI Ultra.

Ngoài ra, theo thẻ mô hình bị rò rỉ trước đó, còn có nhiều thông tin quan trọng đáng chú ý: Google đã huấn luyện mô hình này từ đầu bằng TPU, là một mô hình MoE, với 1M đầu vào và 64k token đầu ra, MoE có nghĩa là họ có thể chịu chi phí để làm cho nó rẻ hơn.

Về giá cả, Gemini 3.0 Pro giới thiệu cơ chế định giá phân cấp dựa trên độ dài ngữ cảnh: đối với nhiệm vụ dưới 200k tokens, giá đầu vào/đầu ra là $2.00/$12.00 (trên mỗi triệu token); vượt quá 200k tokens thì lần lượt là $4.00 và $18.00.

Trải nghiệm phát triển mới "ưu tiên tác nhân"

Google Antigravity là nền tảng phát triển tác nhân hoàn toàn mới của Google, cho phép nhà phát triển thao tác ở cấp độ cao hơn, định hướng theo nhiệm vụ. Nhờ vào khả năng suy luận tiên tiến, sử dụng công cụ và lập trình tác nhân của Gemini 3, Google Antigravity biến trợ lý AI từ một công cụ trong hộp dụng cụ nhà phát triển thành một đối tác tích cực.

Mặc dù cốt lõi của Google Antigravity là trải nghiệm IDE AI (môi trường phát triển tích hợp) quen thuộc, nhưng tác nhân của nó đã được nâng lên một giao diện chuyên dụng và được cấp quyền truy cập trực tiếp vào trình soạn thảo, terminal và trình duyệt. Bây giờ, tác nhân có thể tự chủ lập kế hoạch và đồng thời thực hiện các nhiệm vụ phần mềm đầu cuối phức tạp, đồng thời tự xác minh mã của chính mình.

Ngoài Gemini 3 Pro, Google Antigravity còn tích hợp chặt chẽ với mô hình Gemini 2.5 Computer Use mới nhất của Google dành cho điều khiển trình duyệt, cùng với mô hình chỉnh sửa hình ảnh hàng đầu Nano Banana (Gemini 2.5 Image).

Trải nghiệm thực tế

Do phiên bản xem trước Gemini 3 Pro đã lên nền tảng AI Studio, chúng tôi cũng đã thử nghiệm một chút.

Prompt: SVG của KHU PHỐ NEW YORK. Sử dụng bất kỳ thư viện nào để hoàn thành nhưng đảm bảo tôi có thể dán toàn bộ vào một tệp HTML đơn và mở trong Chrome. Làm nó thú vị và chi tiết cao, thể hiện những chi tiết mà không ai ngờ tới, hãy sáng tạo tối đa và đẹp tuyệt trong một khối mã.

Prompt: Tạo một trò chơi Space Invaders cực kỳ bắt mắt.

Trước đây, hình ảnh chim bồ nông đạp xe đã làm khó nhiều mô hình lớn, lần này chúng tôi cũng thử yêu cầu Gemini 3. Prompt: Một hình SVG hoạt hình về một con bồ nông đang đạp xe.

So với các phiên bản trước, Gemini 3 đã tiến bộ đáng kể, tuy nhiên vẫn còn lỗi, ví dụ như bàn đạp xe đang quay giữa không trung.

Chúng tôi thử lại với một nhắc nhở rõ ràng hơn: Tạo mã SVG hoạt hình hoàn chỉnh, độc lập (không cần tệp hay hình ảnh bên ngoài) về một con bồ nông dễ thương đang đạp xe nhìn từ bên cạnh. Lần này, chiếc xe do Gemini 3 tạo ra dường như không có bàn đạp.

Kết luận

Trong cuộc thăm dò ý kiến của blogger X Chubby: "Đến cuối năm 2026, công ty nào sở hữu LLM tốt nhất?", Google Gemini dẫn đầu một cách rõ rệt.

Sự phục hồi niềm tin thị trường này cũng được phản ánh trong dữ liệu: CEO Alphabet Sundar Pichai trong blog chính thức đã điểm lại tiến triển hai năm qua của Gemini: Người dùng hoạt động hàng tháng của AI Overviews đã đạt 2 tỷ, ứng dụng Gemini vượt mốc 650 triệu người dùng hoạt động hàng tháng, ngoài ra hơn 70% khách hàng đám mây và hơn 13 triệu nhà phát triển đang sử dụng mô hình sinh tạo của họ.

Nhìn lại hai năm qua, từ việc vội vàng ra mắt Bard (tiền thân của Gemini) dẫn đến sụt giảm giá cổ phiếu, đến lúc nghiêm túc hợp nhất Google DeepMind, triệu hồi các nhà sáng lập, giành giải Nobel, Google đã hoàn thành một màn "quay xe" hoàn hảo của một "con voi".

Gã khổng lồ từng định nghĩa Transformer, giờ đây "All in Gemini", đã sẵn sàng cho một cuộc phản công toàn diện.

Còn liệu nó có thể chấm dứt tranh cãi về "LLM tốt nhất"? Đừng vội, hãy để viên đạn (và máy chủ) bay thêm một lúc nữa.

Chào mừng tham gia cộng đồng chính thức TechFlow

Nhóm Telegram:https://t.me/TechFlowDaily

Tài khoản Twitter chính thức:https://x.com/TechFlowPost

Tài khoản Twitter tiếng Anh:https://x.com/BlockFlow_News

Liên kết gốc

Thêm vào mục ưa thích

Chia sẻ lên mạng xã hội

Tác giả

机器之心Synced

@Synced_Global

Gemini 3 tấn công vào ban đêm: Vượt mặt GPT 5.1, kỷ nguyên mô hình lớn của Google đã đến

2025.11.19

Chia sẻ đến

Tuyển chọn TechFlowTuyển chọn TechFlow

Gemini 3 tấn công vào ban đêm: Vượt mặt GPT 5.1, kỷ nguyên mô hình lớn của Google đã đến

2025.11.19 - 01:34:21

GoogleAI

Chuyên sâu báo cáo Web3

Chưa kịp thấy Gemini 3 xuất hiện, Twitter đã sập trước để chào đón.

Không biết Elon Musk, người vừa tung Grok 4.1 sáng nay, lúc này cảm nghĩ thế nào, nhưng những meme của cư dân mạng đã lan tràn khắp nơi.

Vừa mới đây, Gemini 3 cuối cùng đã chính thức ra mắt, hãy cùng xem thử nó mạnh đến mức nào dưới ánh đèn soi rọi của cả thế giới.

Mô hình thông minh nhất

Quái vật suy luận thống trị mọi bảng xếp hạng

Đáng chú ý hơn, nó đạt 72.1% trên SimpleQA Verified, cho thấy sự tiến bộ lớn về độ chính xác thông tin —— nó không chỉ mạnh mẽ, mà còn đáng tin cậy.