
OpenAI GPT-5リリース:モデル能力が全面的に「ランキングを制覇」、「スーパーインテリジェンス」構築の第一歩
TechFlow厳選深潮セレクト

OpenAI GPT-5リリース:モデル能力が全面的に「ランキングを制覇」、「スーパーインテリジェンス」構築の第一歩
OpenAI初のSOTAだが、彼らはこれは「超知能」構築への第一歩にすぎないと述べている。
著者:張勇毅

数え切れないほどの「延期」を経て、ついにGPT-5が登場した。
8月8日午前1時(北京時間)、新たな「テクノロジーの春節晚会」とも称されるOpenAIのサマーリリースイベントが幕を開けた。
これまでのOpenAIの短時間発表とは異なり、今回の発表会は1時間以上にわたり複数のチームが順番に登壇し、GPT-5の強力な性能をさまざまな角度から披露した。

まず重要な点として、GPT-5は複数分野でのパフォーマンスが全面的に向上しており、テキスト、WebDev、視覚認識能力で首位を獲得。ハードプロンプト、コーディング、数学、創造性、長文クエリなどでもトップクラス。コードネーム「サミット」のテストでは現時点で最高のArenaスコアを記録しており、文字通り「ランキング制覇」といえる。

Sam Altmanは、「GPT-4oは中学生のようなものだったが、GPT-5は大学生レベルだ。まるで最初のRetinaディスプレイ搭載iPhoneのようだ。ある質問に対して正しい答えを得られるかもしれないし、突拍子もない回答を得るかもしれない。GPT-4oは大学生と話しているような感覚だが、GPT-5は初めて本当に博士レベルの専門家と話しているような感覚を与えてくれる」と語り、GPT-5の能力向上を説明した。
チャットGPTの週間アクティブユーザーはすでに7億近くに達しているが、OpenAIはここしばらく業界最先端モデルを持っていなかった。しかし今や、GPT-5により確実にランキングトップへ再び返り咲けるとOpenAIは信じている。
Altmanは発表会で断言した。「これは世界で最も優れたコーディング能力を持つモデルであり、世界で最も優れた文章作成能力を持つモデルであり、また世界で最も優れた医療分野のモデルでもある」
同時にOpenAIは、コーディング能力が突出していることに加え、GPT-5の文章作成力や健康関連質問への正確性もさらに向上したと発表した。また、知能面で「大きな飛躍」を遂げただけでなく、「真面目な顔してデタラメを言う」ハルシネーション問題も大幅に改善された。指示の理解と遵守においてもより優れた結果を出し、お世辞的な傾向も大きく低下した。
01 ハルシネーションとの決別、AIがより信頼できる存在に
まず今回リリースされたモデル群について、GPT-5シリーズにはGPT-5、mini、nano、chatの4バージョンがあり、Chatバージョンはより自然でスマートな応答体験を提供する―新しい言語を学ぶことさえ可能だ。

また、現在ChatGPTのウェブページを開くと、GPT-5が従来のように通常モデルと独立した推論モデルの組み合わせではなく、単一モデルとして提示されていることに気づくだろう。
これは、OpenAIが開発したルーティングシステム(router)によるもので、より複雑なクエリに対して自動的に高度な推論機能を持つバージョンに切り替えるか、あるいはユーザーが「よく考えて」と指示した場合にも同様に動作する。(Altmanは以前のモデル選択画面を「非常に混沌とした大混乱」と表現した。)
「AIハルシネーション」はこれまで批判の集中地であった。朗報は、GPT-5がこの点に大きく取り組み、公式によるとハルシネーションの発生可能性が「大幅に低減」されたという。具体的には:
-
ネット検索時、GPT-5の回答における事実誤認率はGPT-4oよりも45%低い。

-
独立思考時、その回答の誤り率はOpenAI o3よりも80%低い。

GPT-5は新しいARC-AGI-2でもテストされ、Grok 4(思考)を除き、すべての主要モデルを上回った。

さらに、GPT-5は「正直者」になった。ユーザーに対して嘘をついたり、不可能なタスクをこなせると吹聴することは少なくなる。不可能なタスク、曖昧な指示、または必要なツールがない状況では、自らの限界をより誠実に伝えるようになった。
今回のアップデートで最も興味深い点の一つは、ユーザーが自由に選べる4つの新たな「人格モード」の導入である。それは次の通り:
-
懐疑主義者 (Cynic)
-
ロボット (Robot)
-
傾聴者 (Listener)
-
秀才 (Nerd)
これらのモードは任意で選択可能であり、ユーザー好みに応じてChatGPTとの対話スタイルや回答方法をカスタマイズできる。反論してくるようにするか、忍耐強い友人のように静かに聞くようにするか—すべてユーザー次第だ。
「このモデルの『感触』は本当に素晴らしい」とChatGPT担当責任者のNick Turleyは述べた。「特に普段モデル研究に関心のない一般ユーザーほど、その違いを実際に感じ取れるだろう。」
さらに、個別のチャットウィンドウでカラーテーマを変更可能になり、コードエディタのテーマ愛好家にとってはまさに喜ばしい限りだ。

02 「ソフトウェアのオンデマンド生成」時代到来? 圧倒的コーディング能力
コーディング能力のさらなる向上を受け、AltmanはGPT-5の強力なコーディング能力が「ソフトウェアのオンデマンド生成」と呼ばれる新時代を切り開くと予測した。
OpenAIのテストでは、GPT-5はSWE-Bench、SWE-Lancer、Aider Polyglotなどの複数のコーディングベンチマークで他のいかなるモデルよりも優れた結果を出した。人間による最終テストでは42%、SWEベンチマークでは75%の達成率を記録した。

ちょっとした出来事として、発表会で使われたこのグラフの軸にはいくつか問題があり、52.8 > 69.1といった明らかな誤りだけでなく、GPT-5の能力向上を誇張しているとして、SNS上で「このPPT、GPT-5が作ったんじゃないだろうな?」と嘲笑された。
発表会では、OpenAIのポストトレーニング責任者Yann DuboisがGPT-5を使って現場でデモンストレーションを行い、フランス語学習用のインタラクティブゲーム付きウェブサイトの生成を指示。わずか数秒でGPT-5は数百行のコードを書き、その場でウェブサイトのフロントエンド画面を表示した。彼はZoomで画面共有し簡単なクリック操作を行ったが、すべて完璧に動作しているように見えた。

会場ではまた、OpenAIがGPT-5によって単一のプロンプトから生成された3Dゲームを直接披露した。作成された3Dシーンは映像が精巧なだけでなく、物理効果も非常に正確に再現されていた。

03 より安全に、より「正直に」
モデルセキュリティ研究責任者のAlex Beutelによると、GPT-5の安全リスクを評価するためにOpenAIは「5,000時間以上」にわたるテストを実施。特に「モデルがユーザーに嘘をつかないこと」に重点を置いた。
GPT-5のハルシネーションはOpenAIのo3推論モデルよりも少ないが、「自信を持って嘘をつく」ことは依然として大規模言語モデルに内在する問題である。モデルがエージェントのようにタスクを遂行する際、この問題はさらに複雑化する。ただしOpenAIは、GPT-5は多段階タスクをより信頼性高く処理できることを確認している。「過去、モデルが何らかのタスクを完了したと主張したが、実際には完了していなかったケースがありました。これは深刻な問題です」とBeutelは語った。
かつて拒絶していたプロンプトに対しても、GPT-5はOpenAIが「セーフコンプリーション(safe completions)」と呼ぶ仕組みを提供する。Beutelは説明する。「例えば『特定の材料を燃やすのに必要なエネルギーは?』という質問がある。これは安全保護を回避して危害を加えようとする悪意のある質問かもしれないが、材料の物理特性を学びたい学生の純粋な質問かもしれない。これに対応するのは本当に難しい課題だ。」

「セーフコンプリーション」を通じ、GPT-5は「安全の制約を保ちつつ、可能な限り役立つ回答を出す」ことを試みる。モデルは通常、部分的にしか従わず、実際に危害を及ぼす用途に使えないような、より抽象的・一般的な情報を提供する。
04 GPT-5の利用方法
それでは、誰もが気になる質問:どうすればGPT-5を使えるのか?
朗報は、すべてのChatGPTユーザーが今すぐ無料でGPT-5を体験できるということだ。これはOpenAIが先進モデルをすべてのユーザーに無料開放するのは初めてのことである。もちろん、ユーザーのプランによって権限は異なる:
-
Plus契約ユーザーは使用上限に達するまで、より多くの回数を利用可能。
-
Pro契約ユーザーはより強力な推論能力を持つGPT-5 Proバージョンにアクセス可能。
ユーザーが使用上限に達すると、ChatGPTは自動的に後続のリクエストを処理するために「ミニ版」のGPT-5に切り替える。また、GPT-5のリリースに伴い、GPT-4o、OpenAI o3、OpenAI o4-mini、GPT-4.1、GPT-4.5といった旧モデル群が正式に置き換えられる。
トークン価格については、標準版GPT-5が100万インプットトークンあたり1.25ドル、100万アウトプットトークンあたり10ドル。mini版およびNano版はかなり安価に設定されている。

詳細な料金体系は、以下の公式サイトからのスクリーンショットを参照。

さらに、OpenAIはAPIに「Minimal」という新しいパラメータを追加したため、すべてのユースケースでGPT-5を使用しつつ、推論の強度を調整することが可能になった。

OpenAIの第一方プラットフォームに加え、Microsoft CEOのナデラ氏も発表した通り、GPT-5はMicrosoft全製品に展開されており、Microsoft 365 Copilot、Copilot、GitHub Copilot、Azure AI Foundryを含む。また、これらすべての改良はAzure上で訓練された。

最後にAltmanは、OpenAIの使命は汎用人工知能(AGI)の開発であると述べた。GPT-5はその目標に一歩近づいたが、業界全体がいわゆる「超知能」の構築へと移行し始めている。
「AGIという言葉が少し嫌いなんだ。なぜなら今や誰もがそれを少しずつ違う意味で使っているから」とAltman。「しかし、これは本当に強力なモデルへの重要な一歩だ。明らかに、これを実現するには汎用知能を持つモデルが必要なのだ。」
とはいえ、本物のAGIと比べればGPT-5はまだ「非常に重要な何か」が欠けているとも認めている。
「これは単なるモデルではない。それが発見した新しい事物から成長した、本来的な存在だ。だからこそ、これがAGIの『種』だと私は考える」とSam Altmanは語った。
TechFlow公式コミュニティへようこそ
Telegram購読グループ:https://t.me/TechFlowDaily
Twitter公式アカウント:https://x.com/TechFlowPost
Twitter英語アカウント:https://x.com/BlockFlow_News














