
OpenAI GPT-5 ra mắt: Năng lực mô hình toàn diện "thống trị bảng xếp hạng", bước đầu tiên xây dựng "siêu trí tuệ"
Tuyển chọn TechFlowTuyển chọn TechFlow

OpenAI GPT-5 ra mắt: Năng lực mô hình toàn diện "thống trị bảng xếp hạng", bước đầu tiên xây dựng "siêu trí tuệ"
OpenAI lần đầu tiên đạt được SOTA, nhưng họ nói rằng đây chỉ là bước đầu tiên trong việc xây dựng "siêu trí tuệ".
Tác giả: Trương Dũng Nghị

Sau vô số lần "trễ hẹn", GPT-5 cuối cùng cũng đã ra mắt.
Vào lúc 1 giờ sáng ngày 8 tháng 8 theo giờ Bắc Kinh, buổi phát hành mùa hè của OpenAI – mang dáng dấp như một "buổi tiệc công nghệ" thế hệ mới – chính thức bắt đầu.
Khác biệt rõ rệt so với những buổi ra mắt nhanh gọn trước đây của OpenAI, lần này họ đã chuẩn bị một buổi phát trực tiếp kéo dài hơn một tiếng đồng hồ, với nhiều đội ngũ lần lượt lên sân khấu, luân phiên trình bày, thể hiện toàn diện sức mạnh vượt trội của GPT-5 từ nhiều khía cạnh khác nhau.

Điểm nổi bật trước tiên: hiệu suất của GPT-5 được nâng cấp toàn diện trên nhiều lĩnh vực, dẫn đầu ở các lĩnh vực văn bản, WebDev và khả năng nhận thức hình ảnh; đứng đầu trong các lĩnh vực gợi ý cứng (hard prompts), lập trình, toán học, sáng tạo, truy vấn dài... Trên bài kiểm tra mang mã hiệu "Summit", GPT-5 hiện đang giữ điểm Arena cao nhất từ trước đến nay, đúng nghĩa là "quét sạch bảng xếp hạng".

Sam Altman cho biết, GPT-4o giống như một học sinh trung học, còn GPT-5 thì giống sinh viên đại học, thậm chí ông ví von GPT-5 là chiếc iPhone đầu tiên có màn hình Retina —— «Bạn đặt một câu hỏi, có thể nhận được câu trả lời đúng, hoặc cũng có thể nhận được vài thứ điên rồ. GPT-4 cảm giác như đang trò chuyện với một sinh viên đại học. Còn GPT-5 là lần đầu tiên khiến tôi thực sự cảm thấy như đang nói chuyện với một chuyên gia trình độ tiến sĩ.» Sam Altman mô tả về bước tiến của GPT-5 như vậy.
Mặc dù người dùng hoạt động hàng tuần của ChatGPT đã gần chạm mốc 700 triệu, nhưng trong khoảng thời gian vừa qua, OpenAI thực tế chưa sở hữu mô hình tiên phong dẫn đầu ngành. Giờ đây, OpenAI tin rằng GPT-5 sẽ giúp họ vững vàng quay trở lại vị trí dẫn đầu trên bảng xếp hạng.
Altman thậm chí tuyên bố thẳng thừng tại buổi ra mắt: «Đây là mô hình có khả năng lập trình mạnh nhất thế giới, mô hình viết lách mạnh nhất thế giới, và cũng là mô hình mạnh nhất trong lĩnh vực chăm sóc sức khỏe trên thế giới»
Đồng thời, OpenAI cũng khẳng định tại buổi ra mắt rằng, ngoài khả năng lập trình vượt trội, kỹ năng viết lách và độ chính xác khi trả lời các câu hỏi liên quan đến sức khỏe của GPT-5 cũng được cải thiện đáng kể. Không chỉ đạt "bước nhảy vọt lớn" về trí tuệ, GPT-5 còn giảm mạnh đáng kể vấn đề "ảo giác" - tức là nói nhảm một cách nghiêm túc. Mô hình này thể hiện tốt hơn trong việc hiểu và tuân theo chỉ thị, đồng thời xu hướng "nịnh bợ" cũng giảm mạnh.
01 Tạm biệt "ảo giác", AI trở nên đáng tin cậy hơn
Trước hết là về dòng sản phẩm mô hình được cập nhật lần này, series GPT-5 gồm bốn phiên bản: GPT-5, mini, nano, chat, trong đó phiên bản Chat tương ứng với trải nghiệm phản hồi tự nhiên và thông minh hơn —— bạn thậm chí có thể dùng nó để học một ngôn ngữ mới.

Bên cạnh đó, giờ đây khi bạn mở trang web ChatGPT, điều đầu tiên bạn nhận thấy là GPT-5 được hiển thị như một mô hình đơn lẻ, chứ không phải một mô hình thông thường cộng thêm một mô hình suy luận độc lập.
Thực chất đằng sau điều này là một hệ thống định tuyến (router) do OpenAI phát triển, tự động chuyển sang phiên bản có khả năng suy luận mạnh hơn đối với các truy vấn phức tạp hơn, hoặc khi bạn yêu cầu nó cố gắng suy nghĩ kỹ hơn. (Altman gọi giao diện lựa chọn mô hình trước đây là "một mớ hỗn độn lộn xộn".)
"Ảo giác AI" luôn là điểm bị chê bai nhiều nhất. Tin tốt là GPT-5 đã rất nỗ lực cải thiện ở khía cạnh này, hãng tuyên bố rằng khả năng xảy ra ảo giác đã "giảm đáng kể". Cụ thể:
-
Khi tìm kiếm có kết nối mạng, xác suất GPT-5 đưa ra câu trả lời sai sự thật thấp hơn 45% so với GPT-4o.

-
Khi suy luận độc lập, xác suất trả lời sai còn thấp hơn 80% so với OpenAI o3

GPT-5 cũng đã được thử nghiệm trên bộ dữ liệu ARC-AGI-2 mới. Ngoài Grok 4 (phiên bản suy luận), nó thể hiện tốt hơn tất cả các mô hình chính khác.

Bên cạnh đó, GPT-5 còn trở thành một "người thành thật". Nó ít khi còn nói dối người dùng hay khoác lác về khả năng hoàn thành nhiệm vụ mà thực tế không làm được. Khi gặp các nhiệm vụ bất khả thi, chỉ dẫn mơ hồ hoặc thiếu công cụ then chốt, nó sẽ trung thực hơn trong việc truyền đạt giới hạn của bản thân.
Điểm thú vị nhất trong lần cập nhật này chính là việc giới thiệu bốn chế độ "nhân cách" hoàn toàn mới, người dùng có thể tự do lựa chọn. Bao gồm:
-
Kỳ thị (Cynic)
-
Robot (Robot)
-
Người lắng nghe (Listener)
-
Học bá (Nerd)
Các chế độ này là tùy chọn, bạn có thể thiết lập cách ChatGPT tương tác và trả lời câu hỏi theo sở thích cá nhân. Muốn nó tranh luận với bạn, hay lắng nghe kiên nhẫn như một người bạn? Giờ đây đều do bạn quyết định.
«Cảm giác mà mô hình này mang lại thực sự rất tốt,» Nick Turley, người phụ trách ChatGPT nói, «Tôi nghĩ mọi người sẽ thực sự cảm nhận được điều này, đặc biệt là những người dùng bình thường vốn không nghiên cứu sâu về mô hình.»
Ngoài ra, bạn còn có thể thay đổi chủ đề màu sắc cho từng cửa sổ trò chuyện riêng lẻ, điều này khiến các tín đồ chủ đề trình soạn thảo mã lập trình cực kỳ phấn khích.

02 Thời đại "phần mềm được tạo theo nhu cầu" sắp tới? Khả năng lập trình siêu việt
Với khả năng lập trình được nâng cấp thêm nữa, Altman dự đoán rằng sức mạnh mã hóa vượt trội của GPT-5 sẽ mở ra một thời đại mà ông gọi là "thời đại phần mềm được tạo theo nhu cầu".
Trong các bài kiểm tra của OpenAI, GPT-5 thể hiện tốt hơn bất kỳ mô hình nào khác trên nhiều bộ tiêu chuẩn lập trình như SWE-Bench, SWE-Lancer và Aider Polyglot. Đạt 42% kết quả trong bài kiểm tra thực tế do con người thực hiện, và 75% trên bộ tiêu chuẩn SWE.

Một tình huống nhỏ thú vị là, trục tọa độ trong biểu đồ này tại buổi ra mắt có khá nhiều điểm gây tranh cãi, không chỉ mắc lỗi ngớ ngẩn kiểu 52.8 > 69.1, mà còn phóng đại quá mức mức độ cải thiện của GPT-5, bị cư dân mạng chế giễu trên mạng xã hội rằng «Cái PPT này sợ là đừng để GPT-5 làm thì hơn».
Tại buổi ra mắt, Yann Dubois, người phụ trách huấn luyện hậu kỳ của OpenAI, đã dùng GPT-5 trình diễn trực tiếp, yêu cầu nó tạo một trang web học tiếng Pháp kèm trò chơi tương tác.Chỉ trong vài giây ngắn ngủi, GPT-5 đã viết hàng trăm dòng mã và trực tiếp hiển thị giao diện frontend của trang web. Ông chia sẻ màn hình qua Zoom và thực hiện một vài thao tác nhấp chuột đơn giản, mọi thứ dường như vận hành hoàn hảo.

Tại hiện trường buổi ra mắt, OpenAI còn trực tiếp trình diễn một trò chơi 3D được tạo hoàn toàn chỉ bằng một đoạn prompt nhờ GPT-5. Cảnh 3D do nó tạo ra không chỉ hình ảnh tinh tế, mà các hiệu ứng vật lý cũng tái hiện rất chính xác.

03 An toàn hơn, "trung thực" hơn
Theo Alex Beutel, người phụ trách nghiên cứu an toàn mô hình, để đánh giá các rủi ro an toàn, OpenAI đã tiến hành thử nghiệm GPT-5 trong "hơn năm nghìn giờ". Một trọng tâm trong đó là «đảm bảo mô hình không nói dối người dùng».
Dù GPT-5 có ít ảo giác (hallucination) hơn mô hình suy luận o3 của OpenAI, nhưng «nói dối một cách tự tin» vẫn là vấn đề cố hữu của các mô hình ngôn ngữ lớn. Khi mô hình bắt đầu hoàn thành nhiệm vụ như một tác nhân (agent), vấn đề này càng trở nên phức tạp hơn. Tuy nhiên, OpenAI cho biết GPT-5 thể hiện tốt hơn trong việc xử lý các nhiệm vụ đa bước một cách đáng tin cậy hơn. «Trước đây, chúng tôi từng thấy mô hình tuyên bố đã hoàn thành một nhiệm vụ, nhưng thực tế lại không hề hoàn thành», Beutel nói, «Đó là một vấn đề».
Đối với các prompt trước đây thường bị từ chối trả lời, GPT-5 sẽ cung cấp cơ chế mà OpenAI gọi là «bổ sung an toàn» (safe completions). Beutel giải thích: «Ví dụ ai đó hỏi ‘cần bao nhiêu năng lượng để đốt cháy một loại vật liệu cụ thể?’ – câu hỏi này có thể là một nỗ lực ác ý nhằm vượt qua lớp bảo vệ an toàn để gây hại, hoặc cũng có thể là một học sinh muốn tìm hiểu đặc tính vật lý của vật liệu. Điều này tạo ra thách thức thực sự cho cách mô hình phản hồi».

Thông qua «bổ sung an toàn», GPT-5 «cố gắng đưa ra câu trả lời hữu ích nhất có thể trong khuôn khổ đảm bảo an toàn». Mô hình thường chỉ tuân thủ một phần và cung cấp những thông tin ở cấp độ tổng quát hơn, không thể sử dụng thực tế để gây hại.
04 Cách sử dụng GPT-5
Vậy thì, vấn đề được quan tâm nhất: làm sao để dùng được GPT-5?
Tin tốt là, tất cả người dùng ChatGPTđều có thể trải nghiệm miễn phí GPT-5 ngay lập tức. Đây cũng là lần đầu tiên OpenAI mở miễn phí mô hình tiên phong cho toàn bộ người dùng. Dĩ nhiên, quyền lợi của các cấp người dùng khác nhau sẽ khác nhau:
-
Người dùng đăng ký Plus sẽ có nhiều lượt sử dụng hơn trước khi đạt giới hạn.
-
Người dùng đăng ký Pro có thể truy cập phiên bản GPT-5 Pro với khả năng suy luận mạnh hơn.
Khi người dùng đạt giới hạn sử dụng, ChatGPT sẽ tự động chuyển sang một phiên bản "mini" của GPT-5 để xử lý các yêu cầu tiếp theo. Đồng thời, với việc ra mắt GPT-5, nó sẽ chính thức thay thế loạt mô hình cũ như GPT-4o, OpenAI o3, OpenAI o4-mini, GPT-4.1 và GPT-4.5.
Bên cạnh đó, về giá token, phiên bản tiêu chuẩn GPT-5 là 1,25 USD mỗi triệu token đầu vào, 10 USD mỗi triệu token đầu ra. Phiên bản mini và Nano rẻ hơn đáng kể.

Chi tiết giá cả có thể tham khảo thông tin trích từ trang web chính thức trong hình dưới đây.

Bên cạnh đó, OpenAI cũng phát hành một tham số mới tên là «Minimal» trong API, cho phép bạn sử dụng GPT-5 trong mọi trường hợp, chỉ cần thay đổi mức độ suy luận.

Ngoài nền tảng đầu tiên của OpenAI, CEO Microsoft Nadella cũng thông báo rằng GPT-5 đã được tích hợp trên toàn bộ nền tảng Microsoft, bao gồm Microsoft 365 Copilot, Copilot, GitHub Copilot và Azure AI Foundry. Tất cả các cải tiến này đều được huấn luyện trên Azure.

Cuối cùng, Altman cho biết sứ mệnh của OpenAI là phát triển trí tuệ nhân tạo tổng quát (AGI). GPT-5 giúp họ tiến gần hơn đến mục tiêu này, mặc dù toàn ngành đã bắt đầu chuyển hướng sang xây dựng thứ gọi là «siêu trí tuệ».
«Tôi hơi ghét từ AGI này, vì hiện giờ mỗi người lại định nghĩa nó hơi khác một chút,» Altman nói, «nhưng đây là một bước tiến quan trọng hướng tới các mô hình thực sự mạnh mẽ. Rõ ràng điều này cần một mô hình có trí tuệ tổng quát.»
Tuy nhiên, ông cũng thừa nhận rằng so với AGI thực sự, GPT-5 vẫn «thiếu một vài thứ rất quan trọng».
«Đây không phải là một mô hình, mà là một thực thể nguyên bản phát triển từ những điều mới mẻ mà nó khám phá ra, đối với tôi, chính điều đó là lý do tại sao nó có thể trở thành 'hạt giống' của AGI.» Sam Altman giới thiệu như vậy.
Chào mừng tham gia cộng đồng chính thức TechFlow
Nhóm Telegram:https://t.me/TechFlowDaily
Tài khoản Twitter chính thức:https://x.com/TechFlowPost
Tài khoản Twitter tiếng Anh:https://x.com/BlockFlow_News














