
ウルトラマンも「いいね!」、Google Gemini 3 Proのすごさとは?
TechFlow厳選深潮セレクト

ウルトラマンも「いいね!」、Google Gemini 3 Proのすごさとは?
グーグルは8か月間寝たふりをしていたが、いきなりエースカードGemini 3 Proを投げ出した。
著者:苗正
グーグルは8か月間寝たふりをしていたが、いきなりエースカードGemini 3 Proを放った。
ようやくグーグルがGemini 3 Proをリリースした。突然で、しかも非常に「控えめ」だった。
確かにグーグルはGemini 3 Proの前に画像編集モデルNano Bananaを発表し、存在感をアピールした。しかし基盤モデルに関しては、グーグルは長期間沈黙を続けていた。
ここ半年以上、誰もがOpenAIの新展開に注目したり、Claudeがコード分野で圧倒的な支配力を誇ることに感嘆していたが、バージョンアップがない状態で8か月も放置されたGeminiについては誰も言及しなかった。
たとえグーグルのクラウド事業や財務報告がどれほど優れていても、AI開発者のコアコミュニティの中では、グーグルの存在感は徐々に薄れていった。
幸運なことに、小榜が第一報で実際に体験してみたところ、Gemini 3 Proは私たちをがっかりさせなかった。
ただし、まだ早急な結論を下すのは早い。というのも、現在のAI競争はもはやパラメータ数で驚かせる時代ではなく、応用、実用化、コストの競争が主軸になっているからだ。
グーグルが新しいバージョンと環境に適応できるかどうかは、依然不透明である。
01
Gemini 3 Proに「自分自身を一言で表現してみて」と依頼したところ、次のように答えた。
「自分がどれだけ賢いかを世界に証明することに焦るのをやめ、どうすればもっと役立つ存在になれるかを考え始めるようになった。」――Gemini 3 Pro
LMArenaランキングにおいて、Gemini 3 Proは1501のEloスコアで首位に立ち、AIモデルの総合能力評価における新たな記録を樹立した。これは非常に優れた成績であり、オルトマン氏もツイートで祝賀の意を示している。
数学能力テストでは、AIME2025(米国数学招待試験)のコード実行モードで100%の正確性を達成した。GPQADiamond科学知識テストでは、Gemini 3 Proの正解率は91.9%であった。
MathArenaApex数学コンテストのテスト結果によると、Gemini 3 Proは23.4%の得点を記録した一方、他の主要モデルは一般的に2%未満の得点しか獲得できていない。また、「Humanity's Last Exam」というテストでは、ツールを使用しない条件下で37.5%の得点を達成した。
今回のアップデートでグーグルは、「vibecoding」と呼ばれるコード生成機能を導入した。この機能により、ユーザーが自然言語で要件を説明すると、システムがそれに応じたコードとアプリケーションを自動生成する。
Canvasプログラミング環境でのテストでは、「回転速度を調整可能な扇風機を作成してください」という指示に対し、システムは約30秒で回転アニメーション、速度調整スライダー、電源ボタンを含む完全なコードを生成した。
公式が紹介する事例には、核融合プロセスの可視化シミュレーションも含まれている。
インタラクション方式において、Gemini 3 Proは「ジェネレーティブUI(GenerativeUI)」という新機能を追加した。従来のAIアシスタントがテキスト回答のみを返すのとは異なり、このシステムは問い合わせ内容に基づいてカスタマイズされたインターフェースレイアウトを自動生成できる。
例えば、量子コンピューティングに関する質問に対して、システムは概念の説明、動的グラフ、関連論文リンクなどを含むインタラクティブなインターフェースを生成する可能性がある。
同じ質問でも対象ユーザーが異なる場合、システムは異なるインターフェースデザインを生成する。簡単な例として、同じ概念を子供と大人に説明する際には、それぞれ可愛らしいスタイルまたは簡潔で明瞭なスタイルを採用する。
Google Labsで提供されるVisual Layout実験機能は、このようなインターフェースの活用例を示しており、ユーザーは写真付きのモジュールや調整可能なUI要素を持つ雑誌風のビューを取得できる。
今回のリリースには、Gemini Agentと呼ばれるエージェントシステムも含まれており、現在実験段階にある。このシステムは複数ステップのタスクを実行可能で、Gmail、Google Calendar、Remindersなどのグーグルサービスと連携できる。
受信トレイ管理のシナリオでは、システムがメールを自動的にフィルタリングし、優先順位を付け、返信の下書きを作成できる。旅行計画ももう一つの利用シーンで、ユーザーが目的地とおおよその日時を提示するだけで、システムがカレンダーを確認し、フライトとホテルの選択肢を検索して予定を登録する。この機能は現時点では米国在住のGoogle AI Ultraサブスクリプションユーザーにのみ提供されている。
マルチモーダル処理面では、Gemini 3 Proはスパース混合専門家アーキテクチャに基づき、テキスト、画像、音声、動画の入力に対応している。モデルのコンテキストウィンドウは100万トークンあり、長い文書や動画コンテンツの処理が可能である。
カナダのロリエ大学歴史学教授マーク・ハンフリーのテストによると、18世紀の手書き原稿を認識する際の文字誤り率は0.56%であり、前世代モデルと比べて50~70%低下している。
グーグルによれば、トレーニングデータには公開ネットワーク文書、コード、画像、音声、動画コンテンツが含まれており、後続訓練段階では強化学習技術が使用された。
また、グーグルは複雑な推論タスク専用の最適化バージョン「Gemini 3 Deep Think」も発表した。このモードは現在安全性評価中であり、数週間以内にGoogle AI Ultraサブスクライバー向けに開放される予定である。
Google SearchのAIモードでは、「thinking」タブをクリックすることで、このモードの推論プロセスを確認できる。標準モードと比較して、Deep Thinkモードは回答生成前にさらに多くの分析ステップを経る。
公式資料以外にも、私はGemini 3 ProとChatGPT-5.1を比較してみた。
最初の比較は画像生成である。
プロンプト:iPhone17の画像を生成してください
ChatGPT-5.1
Gemini 3 Pro
主観的には、ChatGPT-5.1の方が私の要求に合っていたため、このラウンドはChatGPT-5.1の勝利である。
次の比較は両者のエージェント能力である。
プロンプト:微信公众号「字母榜」を調査して、そのレベルについてコメントしてください
GPT-5.1
Gemini 3 Pro
主観的にはGemini 3 Proの解釈の方が好みだが、あまりに称賛しすぎており、GPT-5.1は小榜の不足点も指摘しており、より客観的で現実的である。
最後はコード能力の比較で、これは現在すべての大規模モデルが最も注目している領域である。
私が選んだプロジェクトはGitHub上で最近スター数が急上昇している「LightRAG」である。これはグラフ構造を統合することでコンテキスト感知と効率的な情報検索を強化し、検索拡張生成を改善し、より高い正確性と迅速なレスポンス時間を実現している。プロジェクトURL:https://github.com/HKUDS/LightRAG
プロンプト:このプロジェクトについて教えてください
GPT-5.1
Gemini 3 Pro
同時に、Gemini 3 Proは業界関係者からも高い評価を受けている。
02
Gemini 3 Proのリリースは非常に控えめだったが、実際にはグーグルは長期間にわたりGemini 3 Proのプレリリース活動を行ってきた。
グーグルの第3四半期決算電話会議にて、CEOのピチャイ氏はこう述べた。「Gemini 3 Proは2025年内にリリースされます。」具体的な日付もなく、詳細もなかったが、これによりテック業界における一大マーケティングキャンペーンの幕が上がった。
グーグルは断続的にサインを発信し、AIコミュニティ全体の注目を集め続けたが、確定したリリース日程は一切明かさなかった。
10月から、次々と「うっかりリーク」が相次いだ。10月23日、11月12日に「Gemini 3 Pro Release」とある内部カレンダーのスクリーンショットが広く拡散された。
さらに鋭い開発者はVertex AIのAPIドキュメント内で「gemini-3-pro-preview-11-2025」という表記を発見した。
その後、RedditやX上でさまざまなスクリーンショットが出現した。Gemini Canvasツール内で新モデルを見かけたというユーザー、モバイルアプリの特定バージョンで異常なモデル識別子を発見したという人もいた。
そして、以下のテストデータがソーシャルメディアで広まった。
これらの「リーク」は偶然のように見えるが、実は綿密に練られたプレリリース戦略の一環だった。
各リークはGemini 3 Proの核となる能力の一部を丁度よいタイミングで披露し、毎回の議論が期待値をさらに高めていった。一方、グーグル公式アカウントの態度は興味深いものだった。彼らはコミュニティの議論をリツイートし、「近日リリース」といった言葉でユーザーの期待を煽り、Google AI研究所の幹部までもがリリース日に関する予測ツイートに「思考」絵文字を2つ返信したが、正確な日付を口にすることはなかった。
約1か月間にわたるプレリリース活動の末、グーグルはついに新鮮なGemini 3 Proを披露した。しかし、Gemini 3 Proの性能は強力ながらも、グーグルの更新頻度は少々不安を残すものだった。
今年3月にグーグルはすでにGemini 2.5 Proのプレビュー版をリリースし、その後Gemini 2.5 Flashプレビュー版など派生プレビュー版も順次リリースした。Gemini 3 Proが登場するまで、Geminiシリーズはこの期間中にバージョン番号のアップデートが一切なかった。
しかし、グーグルの競争相手たちは待ってくれない。
OpenAIは8月7日にGPT-5をリリースし、11月12日にさらにGPT-5.1へとアップグレードした。またこの期間中、OpenAIは自社のAIブラウザAtlasをリリースし、グーグルの牙城に直接挑戦した。
Anthropicの進化スピードはさらに密集している:2月24日にClaude 3.7 Sonnet(初のハイブリッド推論モデル)をリリース、5月22日にClaude Opus 4およびSonnet 4を発表、8月5日にClaude Opus 4.1をリリース、9月29日にClaude Sonnet 4.5を発表、10月15日にはClaude Haiku 4.5をリリースした。
この一連の攻勢により、グーグルはやや混乱をきたしたが、現時点では持ちこたえている。
03
Gemini 3 Proのアップデートに8か月もかかった最大の理由は、おそらく人事の変更にある。
2025年7月から8月にかけて、マイクロソフトはグーグルに対して激しい人材獲得攻勢を仕掛け、DeepMindの核心専門家および幹部20名以上を引き抜いた。
その中には、DeepMindの上級製品ディレクター(Senior Director of Product)であるデイブ・シトロン(Dave Citron)や、同社の主要AI製品の実装を担当していたGeminiのエンジニアリング副社長(VP of Engineering)アマール・スブラマニヤ(Amar Subramanya)も含まれる。彼はGoogle最重要モデルGeminiの核心エンジニアリング責任者の一人だった。
もう一つの要因として、Nano Bananaチームは、Gemini 2.5 Proリリース後の長期間、グーグルがAI画像生成分野に集中していたため、基盤モデルのアップデートが遅れたと述べている。
グーグルは、キャラクターの一貫性(Character Consistency)、コンテキスト内編集(In-context Editing)、テキストの乱码(Text Rendering)という画像生成分野の3つの難関を突破した後にこそ、基盤モデルのパフォーマンスがさらに向上すると考えていた。
Nano Bananaチームは、モデルが「美しく描ける」だけでなく、「人間の言葉を理解し」「人の操作に従える」ことが重要だと強調し、AI画像生成が真に商業利用段階に到達するための鍵になると述べた。
こうして振り返ると、Gemini 3 Proは合格点の回答ではあるが、今や「一刻千金」のAI戦場では、合格ラインはもはや十分ではない。
グーグルがこの瞬間に答案を提出した以上、最も厳しい採点者たち――すでに競合製品によって「味覚」が肥えてしまったユーザーと開発者たち――に直面する準備をしなければならない。これから数ヶ月間の戦いは、もはやモデルパラメータの競争ではなく、エコシステム統合能力の肉弾戦となる。この巨大な象(グーグル)は踊ることを学ぶだけでなく、誰よりも速く踊らなければならないのだ。
TechFlow公式コミュニティへようこそ
Telegram購読グループ:https://t.me/TechFlowDaily
Twitter公式アカウント:https://x.com/TechFlowPost
Twitter英語アカウント:https://x.com/BlockFlow_News














