
Mô hình mạnh nhất của OpenAI GPT-5 đã đến, sử dụng miễn phí
Tuyển chọn TechFlowTuyển chọn TechFlow

Mô hình mạnh nhất của OpenAI GPT-5 đã đến, sử dụng miễn phí
Altman hô hào bước tiến lớn hướng tới AGI, Microsoft dẫn đầu trong việc kết nối.
Bài viết: Lý Đan, Wall Street Insights
Sản phẩm được mong đợi nhất năm nay từ OpenAI đã chính thức ra mắt.
Vào thứ Năm, ngày 7 tháng 8 theo giờ Mỹ, OpenAI thông báo ra mắt mô hình trí tuệ nhân tạo (AI) hàng đầu thế hệ mới GPT-5. Đây là hệ thống AI "tích hợp" đầu tiên của OpenAI, kết hợp lần đầu tiên khả năng suy luận của dòng mô hình o với khả năng phản hồi nhanh chóng của dòng mô hình GPT.
Sam Altman, CEO của OpenAI, đánh giá rất cao GPT-5 tại buổi công bố mô hình mới, gọi đây là "mô hình tốt nhất thế giới", một "bước nâng cấp lớn" so với các mô hình trước đó, và cho biết sự ra đời của nó đánh dấu một "bước tiến quan trọng" trên hành trình hiện thực hóa trí tuệ nhân tạo chung (AGI) của OpenAI.
Theo OpenAI, GPT-5 thể hiện xuất sắc trong nhiều bài kiểm tra chuẩn, đạt trình độ tiên phong trong các lĩnh vực như lập trình, toán học và sức khỏe. GPT-5 đạt độ chính xác 74,9% trong bài kiểm tra mã nguồn SWE-bench Verified, vượt nhẹ so với mô hình mới Claude Opus 4.1 mà Anthropic công bố hôm thứ Ba tuần này. Đồng thời, vấn đề ảo giác (hallucination) của GPT-5 được cải thiện đáng kể, tỷ lệ thông tin sai chỉ ở mức 4,8%, thấp xa so với 20,6% của mô hình tiền nhiệm GPT-4o.
Kể từ thứ Năm tuần này, GPT-5 sẽ mở cửa cho tất cả người dùng miễn phí và người dùng đăng ký gói Plus, Pro, Team của ChatGPT để sử dụng làm mô hình mặc định, và sẽ ra mắt trên các gói Enterprise và Edu trong vòng một tuần.
Tương tự như GPT-4o, sự khác biệt giữa phiên bản miễn phí và trả phí của GPT-5 nằm ở mức độ sử dụng. Người dùng Plus có hạn mức sử dụng cao hơn, còn người dùng Pro có thể sử dụng không giới hạn và truy cập phiên bản nâng cấp GPT-5 Pro. Với người dùng miễn phí, các chức năng suy luận đầy đủ có thể mất vài ngày mới được triển khai hoàn toàn. Khi người dùng miễn phí đạt đến giới hạn sử dụng GPT-5, OpenAI sẽ chuyển họ sang mô hình nhỏ hơn là GPT-5 mini.
OpenAI cũng cho biết vào hôm thứ Tư rằng họ sẽ cung cấp sản phẩm ChatGPT cho các cơ quan chính phủ liên bang Hoa Kỳ với mức phí tượng trưng 1 đô la mỗi năm. Cụ thể là phiên bản doanh nghiệp của ChatGPT, bao gồm các tính năng bảo mật và riêng tư được tăng cường.
Ngay sau khi OpenAI công bố GPT-5, Microsoft đã tuyên bố bắt đầu tích hợp GPT-5 vào bộ sưu tập sản phẩm rộng lớn của mình từ thứ Năm tuần này, bao gồm các nền tảng như 365 Copilot, Copilot, GitHub Copilot và Azure AI Foundry, cho phép người dùng doanh nghiệp và cá nhân của Microsoft ngay lập tức trải nghiệm các lợi thế về khả năng suy luận cấp cao và lập trình của GPT-5.
GPT-5 nổi bật ở ba lĩnh vực: Lập trình, Viết sáng tạo, Sức khỏe
Bản thông cáo phát hành GPT-5 của OpenAI mở đầu bằng khẳng định rằng GPT-5 là "mô hình thông minh nhất, nhanh nhất và thiết thực nhất của OpenAI, với khả năng tư duy tích hợp bên trong, mang lại trí tuệ cấp chuyên gia cho mọi người."
Theo giới thiệu của OpenAI, với tư cách là "mô hình mạnh mẽ nhất" của công ty, GPT-5 đã đạt được những bước tiến đáng kể trong ba lĩnh vực then chốt.
Đầu tiên là năng lực lập trình. GPT-5 là mô hình mã hóa mạnh nhất từ trước đến nay của OpenAI, thể hiện xuất sắc trong việc tạo giao diện phía trước phức tạp và gỡ lỗi kho mã nguồn lớn, có thể tạo ra các trang web, ứng dụng App và trò chơi đẹp mắt, đáp ứng nhanh chỉ với một lệnh nhắc duy nhất. Những người thử nghiệm sớm nhận thấy sự cải thiện trong các lựa chọn thiết kế như khoảng cách, kiểu chữ và khoảng trống.
Trong bài kiểm tra chuẩn SWE-bench Verified lấy dữ liệu từ GitHub về các nhiệm vụ lập trình thực tế, GPT-5 đạt độ chính xác 74,9% ngay ở lần thử đầu tiên sau khi suy luận, cao hơn so với 69,1% của mô hình suy luận o3 và 30,8% của GPT-4o.

Các bình luận chỉ ra rằng điều này có nghĩa là hiệu suất của GPT-5 vượt nhẹ so với Claude Opus 4.1 mà Anthropic ra mắt hôm thứ Ba và Gemini 2.5 Pro của Google DeepMind, hai mô hình này đạt điểm tương ứng là 74,5% và 59,6% trong bài kiểm tra SWE-bench Verified.
Tuy nhiên, trong bài kiểm tra Humanity's Last Exam – đánh giá năng lực chuyên sâu về toán học, nhân văn và khoa học tự nhiên – phiên bản nâng cấp GPT-5 pro với chức năng suy luận mở rộng đạt điểm 42% khi sử dụng công cụ hỗ trợ. Con số này hơi thấp hơn so với mô hình Grok 4 Heavy của xAI với điểm 44,4%.

Altman nói rằng GPT-5 đặc biệt giỏi khởi động toàn bộ phần mềm App theo nhu cầu, còn gọi là "lập trình theo ngữ cảnh", tức là dùng AI sinh mã chức năng từ lời nhắc bằng ngôn ngữ tự nhiên, từ đó đẩy nhanh tốc độ phát triển.
Là ví dụ minh họa, các nhà nghiên cứu của OpenAI đã yêu cầu GPT-5 tạo một ứng dụng web giúp người dùng tiếng Anh học tiếng Pháp, với chủ đề hấp dẫn, bao gồm thẻ ghi nhớ, bài kiểm tra, trò chơi rắn săn mồi cổ điển và phương pháp theo dõi tiến độ học hàng ngày.
Họ gửi cùng một lời nhắc vào hai cửa sổ GPT-5, và chỉ vài phút sau đã tạo ra hai ứng dụng khác nhau. Các lãnh đạo của OpenAI cho biết các ứng dụng này "có một số thiếu sót", nhưng người dùng có thể điều chỉnh phần mềm do AI tạo ra theo sở thích cá nhân, chẳng hạn như thay đổi nền hoặc thêm nhiều tab hơn.
Về viết sáng tạo, GPT-5 có thể xử lý các nhiệm vụ viết có cấu trúc phức tạp, như thơ ngũ âm nhịp iamb không vần hay thơ tự do trôi chảy tự nhiên. Nick Turley, Phó Chủ tịch phụ trách ChatGPT của OpenAI, cho biết GPT-5 thể hiện "gu thẩm mỹ tốt hơn" trong các nhiệm vụ sáng tạo, với phản hồi tự nhiên hơn.

Tư vấn sức khỏe là lĩnh vực cải tiến thứ ba quan trọng.
GPT-5 có thể chủ động hơn trong việc đánh dấu các vấn đề sức khỏe tiềm ẩn, giúp người dùng giải mã kết quả y tế, dù OpenAI nhấn mạnh rằng ChatGPT không thể thay thế nhân viên y tế chuyên nghiệp.
Trong bài kiểm tra có tên HealthBench Hard Hallucinations, GPT-5 có khả năng suy luận chỉ mắc lỗi ảo giác với tỷ lệ thông tin sai là 1,6%. Con số này thấp hơn nhiều so với GPT-4o và mô hình o3, với tỷ lệ lỗi lần lượt là 15,8% và 12,9%.

Xác suất ảo giác giảm mạnh nhờ chế độ huấn luyện an toàn mới
OpenAI cho biết GPT-5 đáng tin cậy và thực dụng hơn các mô hình trước đó, có thể trả lời chính xác hơn các câu hỏi thực tế và xác suất xảy ra ảo giác giảm đáng kể.
Sau khi bật tìm kiếm mạng cho các lời nhắc ẩn danh đại diện cho lưu lượng sản xuất ChatGPT, khả năng phản hồi của GPT-5 chứa lỗi sự thật thấp hơn khoảng 45% so với GPT-4o; sau khi suy luận, khả năng phản hồi của GPT-5 chứa lỗi sự thật thấp hơn khoảng 80% so với o3. Như biểu đồ dưới đây cho thấy, tỷ lệ thông tin sai trong phản hồi của GPT-5 chỉ là 4,8%, so với 20,6% của GPT-4o và 22% của o3.

OpenAI cũng cho biết họ đã giới thiệu một hình thức huấn luyện an toàn mới cho GPT-5, gọi là hoàn thành an toàn (safe completions). Hình thức này dạy mô hình đưa ra câu trả lời hữu ích nhất có thể trong phạm vi an toàn. Đôi khi, điều này có thể có nghĩa là chỉ trả lời một phần câu hỏi của người dùng, hoặc chỉ cung cấp câu trả lời ở mức độ cao.
Nếu cần từ chối, GPT-5 đã được huấn luyện để thông báo rõ ràng cho người dùng lý do từ chối và cung cấp các phương án thay thế an toàn.
Trong các thí nghiệm kiểm soát và các mô hình sản xuất của OpenAI, họ đều nhận thấy phương pháp hoàn thành an toàn này tinh tế hơn, có thể định hướng tốt hơn đối với các vấn đề có mục đích kép, tăng độ vững chắc trước ý định mơ hồ và giảm thiểu việc từ chối quá mức không cần thiết.
Michelle Pokrass, trưởng nhóm hậu huấn luyện của OpenAI, cho biết: "GPT-5 đã được huấn luyện để nhận biết khi nào một nhiệm vụ không thể hoàn thành, tránh việc phỏng đoán, và có thể giải thích rõ ràng hơn về những giới hạn của mình, từ đó giảm các khẳng định vô căn cứ so với các mô hình trước đây."
Giới thiệu bốn tính cách tùy chọn cho cuộc trò chuyện ChatGPT
OpenAI cho biết GPT-5 cải thiện trong việc thực thi lệnh, đồng thời nâng cao khả năng thực hiện các chỉ dẫn tùy chỉnh. OpenAI sẽ ra mắt bản xem trước nghiên cứu hoàn toàn mới với bốn tính cách được đặt sẵn cho tất cả người dùng ChatGPT.
Bốn tùy chọn tính cách ban đầu — Kẻ hoài nghi (Cynic), Người máy (Robot), Người lắng nghe (Listener) và Kẻ mọt sách (Nerd) — đều là tùy chọn, người dùng có thể điều chỉnh bất kỳ lúc nào trong cài đặt để phù hợp với phong cách giao tiếp giữa ChatGPT và người dùng.
Bốn tính cách trên ban đầu áp dụng cho trò chuyện văn bản, sau đó sẽ mở rộng sang trò chuyện giọng nói, cho phép người dùng thiết lập cách tương tác của ChatGPT mà không cần viết lời nhắc tùy chỉnh — dù là ngắn gọn chuyên nghiệp, chu đáo hỗ trợ, hay hơi mỉa mai châm biếm.
OpenAI cho biết tất cả các tính cách mới này đều đạt hoặc vượt qua tiêu chuẩn đánh giá nội bộ nhằm giảm hành vi nịnh bợ.
Altman ca ngợi đột phá lịch sử: Quay lại dùng GPT-4 thì hiệu quả rất tệ
Tại buổi họp báo hôm thứ Năm, Altman đánh giá cực kỳ cao GPT-5, coi đây là một cột mốc quan trọng trên con đường hướng tới AGI. Ông nói:
"Ở bất kỳ thời điểm nào trong lịch sử trước đây, việc sở hữu thứ gì đó như GPT-5 là điều không thể tưởng tượng nổi." "Lần đầu tiên, cảm giác giống như đang trò chuyện với một chuyên gia trong bất kỳ lĩnh vực nào."
Altman thậm chí còn không ngại hạ bệ GPT-4 để nâng tầm GPT-5 tại buổi họp báo. Ông nói:
"Tôi đã thử quay lại dùng GPT-4, nhưng hiệu quả thực sự rất tệ."
GPT-5 sử dụng kiến trúc hệ thống thống nhất, đi kèm bộ định tuyến thời gian thực, có thể tự động quyết định phản hồi nhanh hay tiến hành suy luận sâu "suy nghĩ" dựa trên loại hội thoại, độ phức tạp và nhu cầu công cụ. Điều này loại bỏ nhu cầu người dùng phải chọn cài đặt phù hợp, khiến ChatGPT dễ sử dụng hơn.
Trong các bài kiểm tra chuẩn nội bộ về giá trị kinh tế, GPT-5 sử dụng chế độ suy luận có thể đạt hoặc vượt trình độ chuyên gia trong khoảng một nửa số trường hợp, bao gồm hơn 40 nghề nghiệp như luật, logistics, bán hàng và kỹ thuật. Phó Chủ tịch OpenAI Nick Turley nói: "Mô hình này thực sự mang lại cảm giác rất tốt."
Altman ví von rằng việc sử dụng GPT-5 giống như lúc nào cũng có một đội ngũ chuyên gia với bằng cấp toàn tiến sĩ bên cạnh. Ông cũng nói: "Trong nhiều lĩnh vực mới, con người bị giới hạn bởi ý tưởng, nhưng thực tế lại thiếu khả năng thực thi."
Microsoft tích hợp toàn diện để chiếm ưu thế
Microsoft đã tuyên bố ngay trong ngày phát hành GPT-5 rằng họ sẽ tích hợp mô hình này vào loạt sản phẩm rộng rãi của mình. Về ứng dụng doanh nghiệp, Microsoft 365 Copilot sẽ tận dụng GPT-5 để xử lý tốt hơn các vấn đề phức tạp, duy trì sự tập trung trong các cuộc hội thoại dài và hiểu bối cảnh người dùng. Người dùng doanh nghiệp có thể xử lý email, tài liệu và tệp tin thông qua chức năng suy luận.
Đối với người tiêu dùng, chế độ thông minh mới của Microsoft Copilot sẽ tận dụng GPT-5 để giúp người dùng tìm ra giải pháp tối ưu. Người dùng có thể trải nghiệm miễn phí GPT-5 thông qua copilot.microsoft.com hoặc ứng dụng Copilot trên các thiết bị Windows, Mac, Android và iOS.

Các nhà phát triển sẽ được hỗ trợ GPT-5 thông qua GitHub Copilot và Visual Studio Code để viết, kiểm thử và triển khai mã. Nền tảng Azure AI Foundry sẽ cung cấp tất cả các mô hình GPT-5, đi kèm bộ định tuyến mô hình do AI điều khiển, lựa chọn mô hình tối ưu dựa trên độ phức tạp, nhu cầu hiệu suất và hiệu quả chi phí của từng nhiệm vụ.
Đội ngũ AI Red Team của Microsoft đã kiểm tra mô hình suy luận GPT-5 bằng các giao thức an toàn nghiêm ngặt, kết quả cho thấy mô hình này thể hiện một trong những cấu hình an toàn AI mạnh nhất trong lịch sử các mô hình OpenAI, trong nhiều dạng tấn công như tạo phần mềm độc hại, tự động hóa gian lận.
Chào mừng tham gia cộng đồng chính thức TechFlow
Nhóm Telegram:https://t.me/TechFlowDaily
Tài khoản Twitter chính thức:https://x.com/TechFlowPost
Tài khoản Twitter tiếng Anh:https://x.com/BlockFlow_News














