
Oatman đã thích, Google Gemini 3 Pro mạnh ở điểm nào?
Tuyển chọn TechFlowTuyển chọn TechFlow

Oatman đã thích, Google Gemini 3 Pro mạnh ở điểm nào?
Google "ngủ gật" suốt 8 tháng, quay người tung ra con át chủ bài Gemini 3 Pro.
Tác giả: Miêu Chính
Google ngủ gật suốt 8 tháng, quay tay tung ra một con át chủ bài Gemini 3 Pro.
Cuối cùng thì Google cũng đã phát hành Gemini 3 Pro, rất đột ngột và còn khá "khiêm tốn".
Mặc dù trước đó Google đã ra mắt mô hình chỉnh sửa hình ảnh Nano Banana để đánh bóng tên tuổi, nhưng trong lĩnh vực mô hình nền tảng, Google đã im lặng quá lâu.
Trong suốt hơn nửa năm qua, mọi người đều bàn tán sôi nổi về động thái mới của OpenAI hoặc thán phục sự thống trị của Claude trong lĩnh vực lập trình, duy chỉ có Gemini – không được nâng cấp phiên bản suốt 8 tháng – thì hoàn toàn bị lãng quên.
Dù cho mảng kinh doanh đám mây và báo cáo tài chính của Google có ấn tượng đến đâu, thì trong cộng đồng cốt lõi các nhà phát triển AI, tầm ảnh hưởng của Google vẫn đang dần bị phai nhạt.
May mắn thay, sau khi trải nghiệm ngay từ những phút đầu tiên, Tiểu Bảng nhận thấy rằng Gemini 3 Pro thực sự không làm chúng tôi thất vọng.
Tuy nhiên, hiện tại vẫn chưa thể đưa ra kết luận vội vàng. Bởi vì cuộc đua AI hiện nay早已 vượt xa thời kỳ dùng số lượng tham số để dọa người, giờ đây tất cả đều đang cạnh tranh khốc liệt ở ứng dụng, triển khai thực tế và chi phí.
Liệu Google có thể thích nghi với phiên bản mới và môi trường mới hay không vẫn còn là một dấu hỏi.
01
Tôi yêu cầu Gemini 3 Pro dùng một câu để miêu tả chính nó, và đây là câu trả lời.
"Không còn vội vã chứng minh với thế giới mình thông minh đến mức nào, mà bắt đầu suy nghĩ cách trở nên hữu ích hơn." —— Gemini 3 Pro
Trên bảng xếp hạng LMArena, Gemini 3 Pro đạt điểm Elo 1501, dẫn đầu danh sách, thiết lập kỷ lục mới về đánh giá năng lực tổng hợp của mô hình AI. Đây là một thành tích xuất sắc, đến mức cả Altman cũng đăng tweet chúc mừng.
Trong kiểm tra năng lực toán học, mô hình này đạt độ chính xác 100% ở chế độ thực thi mã trên AIME2025 (Kỳ thi Toán học Mời gọi Hoa Kỳ). Trong bài kiểm tra kiến thức khoa học GPQADiamond, độ chính xác của Gemini 3 Pro đạt 91,9%.
Kết quả kiểm tra từ MathArenaApex – kỳ thi toán học – cho thấy Gemini 3 Pro đạt điểm 23,4%, trong khi các mô hình phổ biến khác thường dưới 2%. Ngoài ra, trong bài kiểm tra mang tên Humanity's Last Exam, mô hình đạt điểm 37,5% mà không cần sử dụng công cụ hỗ trợ.
Google đã giới thiệu chức năng tạo mã mới có tên “vibecoding” trong lần cập nhật này. Tính năng này cho phép người dùng mô tả nhu cầu bằng ngôn ngữ tự nhiên, hệ thống sẽ tự động sinh mã và ứng dụng tương ứng.
Trong thử nghiệm môi trường lập trình Canvas, khi người dùng mô tả “tạo một chiếc quạt điện có thể điều chỉnh tốc độ”, hệ thống đã tạo ra đoạn mã đầy đủ bao gồm hoạt ảnh xoay, thanh trượt điều chỉnh tốc độ và nút bật/tắt chỉ trong khoảng 30 giây.
Các ví dụ minh họa chính thức còn bao gồm mô phỏng trực quan hóa quá trình phản ứng nhiệt hạch.
Về phương thức tương tác, Gemini 3 Pro bổ sung thêm tính năng "giao diện sinh tạo" (GenerativeUI). Khác với trợ lý AI truyền thống chỉ trả lời bằng văn bản, hệ thống này có thể tự động tạo bố cục giao diện tùy chỉnh dựa trên nội dung truy vấn.
Ví dụ, khi người dùng đặt câu hỏi về máy tính lượng tử, hệ thống có thể tạo ra một giao diện tương tác bao gồm giải thích khái niệm, biểu đồ động và liên kết đến các bài báo liên quan.
Đối với cùng một câu hỏi nhưng đối tượng khác nhau, hệ thống sẽ tạo ra các thiết kế giao diện khác biệt. Ví dụ đơn giản, khi giải thích cùng một khái niệm cho trẻ em và người lớn, cách trình bày sẽ khác nhau: dành cho trẻ em sẽ dễ thương hơn, còn người lớn thì thiên về sự rõ ràng và gọn gàng.
Tính năng thử nghiệm Visual Layout trong Google Labs cho thấy ứng dụng của loại giao diện này, cho phép người dùng có được bố cục kiểu tạp chí với hình ảnh, khối nội dung và các yếu tố giao diện có thể điều chỉnh.
Lần phát hành này cũng bao gồm hệ thống tác nhân thông minh mang tên Gemini Agent, hiện đang ở giai đoạn thử nghiệm. Hệ thống này có khả năng thực hiện các nhiệm vụ nhiều bước và kết nối với các dịch vụ của Google như Gmail, Google Calendar và Reminders.
Trong kịch bản quản lý hộp thư đến, hệ thống có thể tự động lọc email, đánh dấu mức độ ưu tiên và soạn thảo phản hồi. Lập kế hoạch du lịch là một kịch bản ứng dụng khác: người dùng chỉ cần cung cấp điểm đến và thời gian sơ bộ, hệ thống sẽ kiểm tra lịch, tìm kiếm chuyến bay và lựa chọn khách sạn, rồi thêm vào lịch trình. Tính năng này hiện chỉ mở cho người dùng đăng ký Google AI Ultra tại khu vực Mỹ.
Về xử lý đa phương thức, Gemini 3 Pro được xây dựng trên kiến trúc chuyên gia trộn thưa (sparse mixture-of-experts), hỗ trợ đầu vào dạng văn bản, hình ảnh, âm thanh và video. Cửa sổ ngữ cảnh của mô hình lên tới 1 triệu token, cho phép xử lý tài liệu dài hoặc nội dung video kéo dài.
Thử nghiệm của giáo sư sử học Mark Humphries thuộc Đại học Laurier (Canada) cho thấy mô hình đạt tỷ lệ lỗi ký tự 0,56% khi nhận dạng bản thảo viết tay thế kỷ 18, giảm 50–70% so với phiên bản tiền nhiệm.
Google cho biết dữ liệu huấn luyện bao gồm tài liệu mạng công khai, mã nguồn, hình ảnh, âm thanh và video, trong giai đoạn hậu huấn luyện sử dụng công nghệ học tăng cường (reinforcement learning).
Google cũng ra mắt phiên bản tối ưu Gemini 3 Deep Think, chuyên dùng cho các nhiệm vụ suy luận phức tạp. Chế độ này hiện đang được đánh giá an toàn và dự kiến mở cho người đăng ký Google AI Ultra trong vài tuần tới.
Trong chế độ AI của Google Search, người dùng có thể nhấn vào tab "thinking" để xem quá trình suy luận của mô hình. So với chế độ tiêu chuẩn, Deep Think thực hiện nhiều bước phân tích hơn trước khi đưa ra câu trả lời.
Ngoài tài liệu chính thức, tôi cũng so sánh Gemini 3 Pro với ChatGPT-5.1.
So sánh đầu tiên là về khả năng tạo hình ảnh.
Yêu cầu: Hãy tạo cho tôi một bức ảnh iPhone17
ChatGPT-5.1
Gemini 3 Pro
Xét về cảm nhận cá nhân, ChatGPT-5.1 phù hợp hơn với mong đợi của tôi, vì vậy vòng này ChatGPT-5.1 giành chiến thắng.
So sánh thứ hai là mức độ thông minh của hai hệ thống.
Yêu cầu: Hãy nghiên cứu giúp tôi trang WeChat công chúng Alphabet Board, sau đó bình luận về chất lượng của trang này
GPT-5.1
Gemini 3 Pro
Xét về cảm nhận cá nhân, tôi thích cách phân tích của Gemini 3 Pro hơn, nhưng nó lại quá xuýt xoa; GPT-5.1 nhận ra điểm chưa hoàn thiện của Alphabet Board, đánh giá khách quan và chân thực hơn.
Cuối cùng là khả năng lập trình – hiện đang là lĩnh vực được các mô hình lớn quan tâm nhất.
Tôi chọn một dự án gần đây thu hút rất nhiều sao trên GitHub, tên là LightRAG. Dự án này cải thiện khả năng tạo câu trả lời tăng cường truy xuất (RAG) bằng cách tích hợp cấu trúc đồ thị nhằm tăng khả năng nhận thức ngữ cảnh và truy xuất thông tin hiệu quả, từ đó đạt được độ chính xác cao hơn và thời gian phản hồi nhanh hơn. Địa chỉ dự án: https://github.com/HKUDS/LightRAG
Yêu cầu: Hãy nói cho tôi biết về dự án này
GPT-5.1
Gemini 3 Pro
Đồng thời, Gemini 3 Pro cũng nhận được đánh giá cao từ các chuyên gia trong ngành.
02
Mặc dù việc phát hành Gemini 3 Pro diễn ra rất khiêm tốn, thực tế Google đã dọn đường cho Gemini 3 Pro từ rất lâu.
Trong cuộc họp báo cáo tài chính quý III, CEO Google Pichai từng nói: "Gemini 3 Pro sẽ được phát hành trong năm 2025." Không có ngày cụ thể, không thêm chi tiết nào, nhưng đã mở màn cho một vở kịch marketing lớn trong ngành công nghệ.
Google liên tục phát tín hiệu, khiến toàn bộ cộng đồng AI luôn chú ý sát sao, nhưng lại từ chối đưa ra bất kỳ lịch trình phát hành chắc chắn nào.
Từ tháng 10, các "rò rỉ bất ngờ" lần lượt xuất hiện. Từ ngày 23 tháng 10, một bản lịch rò rỉ lan truyền mạnh mẽ, trong đó có ảnh chụp màn hình lịch nội bộ với dòng chữ "Gemini 3 Pro Release" vào ngày 12 tháng 11.
Bên cạnh đó, các nhà phát triển tinh mắt còn phát hiện cụm từ “gemini-3-pro-preview-11-2025” trong tài liệu API của Vertex AI.
Ngay sau đó, hàng loạt ảnh chụp màn hình bắt đầu xuất hiện trên Reddit và X. Một số người dùng tuyên bố nhìn thấy bóng dáng mô hình mới trong công cụ Gemini Canvas, có người lại phát hiện dấu hiệu bất thường về định danh mô hình trong một vài phiên bản ứng dụng di động.
Sau đó là hình ảnh dữ liệu kiểm tra dưới đây bắt đầu lan truyền trên mạng xã hội.
Những "rò rỉ" này tuy trông có vẻ ngẫu nhiên, nhưng thực chất là một chiến dịch dọn đường được sắp đặt kỹ lưỡng.
Mỗi lần rò rỉ vừa khéo léo phơi bày một năng lực cốt lõi nào đó của Gemini 3 Pro, mỗi lần thảo luận lại đẩy cao thêm kỳ vọng. Trong khi đó, tài khoản chính thức của Google lại có thái độ đáng suy ngẫm: họ chia sẻ lại các cuộc thảo luận trong cộng đồng, dùng từ ngữ như "sắp ra mắt" để吊胃口, thậm chí các lãnh đạo phòng thí nghiệm AI của Google còn trả lời bằng hai biểu tượng cảm xúc "đang suy nghĩ" dưới bài đăng dự đoán ngày phát hành, nhưng tuyệt nhiên không chịu tiết lộ ngày chính xác.
Sau gần một tháng dọn đường, cuối cùng Google cũng chính thức trình làng Gemini 3 Pro. Dù hiệu năng mạnh mẽ, nhưng tần suất cập nhật của Google khiến người ta phần nào lo lắng.
Ngay từ tháng 3 năm nay, Google đã phát hành phiên bản xem trước Gemini 2.5 Pro, sau đó tiếp tục tung ra các phiên bản xem trước phụ như Gemini 2.5 Flash. Cho tới khi Gemini 3 Pro ra đời, dòng sản phẩm Gemini trong suốt thời gian đó không hề có bất kỳ nâng cấp phiên bản nào.
Nhưng các đối thủ của Google thì sẽ không chờ đợi.
OpenAI đã ra mắt GPT-5 vào ngày 7 tháng 8 và tiếp tục nâng cấp lên GPT-5.1 vào ngày 12 tháng 11. Trong khoảng thời gian này, OpenAI còn ra mắt trình duyệt AI Atlas, thẳng tiến vào sân nhà của Google.
Tốc độ cập nhật của Anthropic còn dày đặc hơn: ra mắt Claude 3.7 Sonnet (mô hình suy luận lai đầu tiên) vào ngày 24 tháng 2, ra mắt Claude Opus 4 và Sonnet 4 vào ngày 22 tháng 5, phát hành Claude Opus 4.1 vào ngày 5 tháng 8, ra mắt Claude Sonnet 4.5 vào ngày 29 tháng 9, và tiếp tục phát hành Claude Haiku 4.5 vào ngày 15 tháng 10.
Liên tiếp các đòn tấn công khiến Google phần nào bị động, nhưng xét về mặt hiện tại, Google đã trụ vững.
03
Lý do lớn nhất khiến Google mất tới 8 tháng mới cập nhật Gemini 3 Pro có lẽ đến từ sự thay đổi nhân sự.
Vào khoảng tháng 7–8 năm 2025, Microsoft đã phát động một cuộc tấn công mạnh mẽ vào đội ngũ nhân tài của Google, thành công tuyển dụng hơn 20 chuyên gia và quản lý cốt cán từ DeepMind.
Trong số này có Dave Citron – Giám đốc cấp cao Sản phẩm của DeepMind, người phụ trách triển khai các sản phẩm AI trọng yếu, cùng Amar Subramanya – Phó Chủ tịch Kỹ thuật của Gemini, một trong những người phụ trách kỹ thuật chính cho mô hình trọng yếu nhất của Google.
Mặt khác, nhóm phát triển Nano Banana của Google từng tiết lộ rằng, sau khi phát hành Gemini 2.5 Pro, Google đã dành thời gian dài do dự trong lĩnh vực tạo ảnh bằng AI, từ đó làm chậm tiến độ cập nhật mô hình nền tảng.
Google cho rằng, chỉ khi vượt qua ba thách thức lớn trong tạo ảnh là tính nhất quán nhân vật (Character Consistency), chỉnh sửa trong ngữ cảnh (In-context Editing) và hiển thị văn bản (Text Rendering), thì hiệu suất của mô hình nền tảng mới được cải thiện thực sự.
Nhóm Nano Banana cho biết, mô hình không chỉ cần "vẽ đẹp", quan trọng hơn là phải "hiểu lời người" và "chịu sự kiểm soát", để từ đó AI tạo ảnh thực sự bước vào giai đoạn ứng dụng thương mại.
Nhìn lại Gemini 3 Pro lúc này, đây là một bài thi đạt yêu cầu, nhưng trong chiến trường AI khốc liệt từng phút từng giây, chỉ đạt yêu cầu là chưa đủ.
Google đã chọn thời điểm này để nộp bài, thì phải sẵn sàng đối mặt với những giám khảo khắt khe nhất – những người dùng và nhà phát triển đã bị các sản phẩm cạnh tranh "nuông chiều" đến mức khó tính. Những tháng tới đây, cuộc đua sẽ không còn là so sánh tham số mô hình, mà là trận chiến sinh tử về năng lực tích hợp hệ sinh thái. Con voi Google này không chỉ phải học cách khiêu vũ, mà còn phải nhảy nhanh hơn tất cả mọi người.
Chào mừng tham gia cộng đồng chính thức TechFlow
Nhóm Telegram:https://t.me/TechFlowDaily
Tài khoản Twitter chính thức:https://x.com/TechFlowPost
Tài khoản Twitter tiếng Anh:https://x.com/BlockFlow_News














