
強化版Sora画像生成モデルがリリース:ChatGPTで直接使えるだけでなく、ミーム作成者の仕事まで奪う
TechFlow厳選深潮セレクト

強化版Sora画像生成モデルがリリース:ChatGPTで直接使えるだけでなく、ミーム作成者の仕事まで奪う
公式が先頭に立ってネタ絵を作成する。
DeepSeekが24時間前にV3モデルの0324バージョンを発表した直後、北京時間3月26日未明にOpenAIは新たな製品リリース予告を発表し、まるでそれに応じたかのような対抗意識を見せた。

正式な発表前にはGPT-5のリリースを予想する噂もあったが、過去のOpenAIの製品発表ペースから見ると、今回は大規模なアップデートではない。しかし、ChatGPTに統合された新Soraの発表は、予想外の「エンタメ効果」をもたらした。
現時点でChatGPTに統合されたSoraは、独立アプリ版と比べて機能が画像生成に限定されている。だがOpenAIによれば、このモデルは以前のものと比べて質的な飛躍を遂げているという。
開発チームはGPT-4oの「マルチモーダル」(テキスト、画像、音声、動画などあらゆるデータ形式を処理・生成可能な)能力を基盤として、今回のSoraを開発した。そのためユーザーは単に要求を口にするだけでなく、写真をアップロードしたり撮影したりしてプロンプトとして使用できる。
実際、ライブデモではSam Altmanら3人がスマホで自撮りし、「アニメ風のバージョンを生成してください」とSoraに指示した。

さらに彼らは、その画像に「Feel The AGI」(AGIを感じろ)というテキストを追加するよう指示し、初の新版Soraによるミーム画像を現場で作成した。
このリアルタイム生成されたミーム画像は、テキストが正確かつ明瞭であるだけでなく、太字などの現代的ネットミームに必要な要素を正しく理解しており、そのまま各種グループチャットに送れる完成度だ。

OpenAIが率先してミーム作りを行うことで、コメント欄でも多くのユーザーが熱意を掻き立てられ、同じプロンプトをGrokに与えて同様のスタイルのコンテンツを生成しようとしたが、明らかに新版Soraより劣る結果となり、逆にユーモラスな効果を生んでいる。

ミーム制作以外にも、OpenAIは新Soraがテキストレンダリング面で改善されたことを紹介し、画像内のテキスト生成において綴り間違いがなく、整合性のある文章を生成できる確率が大幅に向上したと説明した。
別のデモでは、相対性理論を理解するための漫画カードの生成をSoraに依頼した。
従来の画像生成モデルでは、テキスト部分が混乱したり「AIが勝手に文字を作成」したりする問題が多かったが、新版Soraは元々の画像生成において、テキストに明らかな乱れが一切なく、自然で流暢な日本語さえも生成できており、日本ユーザーを中心に大きな反響を呼んだ。

画像生成モデルにとって、テキストを正しく描画することは長年の課題だった。見出しやテキスト要素にスペルミスや誤りがあれば、画像全体が使用不能になる可能性がある。
またこのケースでは、「相対性理論」など「世界に存在する既知の知識」を適切に参照していることも示された。

「私が画像を描く場合、自分の技術レベルと蓄積されたすべての世界知識に制限されます……」メディア取材に対し、ChatGPTマルチモーダル製品責任者のJackie Shannonはこの機能の必要性を説明した。
「このモデルは世界知識を内包しているため、『ニュートンのプリズム実験』とは何かを説明しなくても、正確な画像を生成できるのです。」

上記の体験改善に加え、OpenAIは新版Soraが属性とオブジェクトの関係を正しく維持する能力を大幅に強化したことも紹介した。例えば、バインディング能力が低いモデルでは、「青い星と赤い三角形」を生成する指示に対して、赤い星だけを生成し三角形を欠落させることがある。
OpenAIによると、既存の多くの画像モデルは特に5〜8個程度の複数アイテムを描画する際に、色と形状を混同しやすい。一方、新版Soraは15〜20個のオブジェクトの属性を正しく紐づけ、それぞれの複雑な要求を理解しながら誤解されず、成功率を大きく高めている。

こうしたユーザーエクスペリエンスの改善に加え、もう一つの注目点は、新版Soraの画像生成にかかる時間が以前より長くなったことだ。しかしOpenAIは、これは妥協すべき価値あるトレードオフだと述べている。
「遅延面での改善余地は確かにありますが……生成される画像の品質、機能、および世界知識が、ユーザーが数秒待つことの価値を十分に補っていると考えています。」Shannonは語った。
画像生成における安全性の問題――昨年から今年にかけて、有名人の偽りのわいせつな画像やホットニュースのフェイク画像、Google Geminiによる写真の透かし除去といった問題が繰り返されてきた――について、OpenAIチームは新版Soraが写真の透かしを削除できる一方で、生成型ディープフェイク画像の作成を阻止し、関連するリクエストを拒否すると強調した。また、生成されたすべての画像には標準のC2PAメタデータが含まれ、それがOpenAIによって作成されたことを明示する。
現在、ChatGPTに統合された新版Soraの画像生成機能は、ProおよびPlusサブスクリプションユーザーに開放されており、OpenAIは近いうちに無料版およびAPIでも提供する予定だと約束している。
今すぐ自分が登場するミーム画像を生成してもらいたいと思うのは、私だけではないだろう。
TechFlow公式コミュニティへようこそ
Telegram購読グループ:https://t.me/TechFlowDaily
Twitter公式アカウント:https://x.com/TechFlowPost
Twitter英語アカウント:https://x.com/BlockFlow_News










