
Gemini 3 深夜襲来:GPT 5.1 を上回り、大規模モデルのグーグル時代が到来
TechFlow厳選深潮セレクト

Gemini 3 深夜襲来:GPT 5.1 を上回り、大規模モデルのグーグル時代が到来
Googleはこれを「AGIへの重要な一歩」と定義し、現時点で世界で最も優れた多モーダル理解能力と最も深いインタラクション機能を持つエージェントであると強調している。
Gemini 3がまだ登場していないのに、Twitterが先にクラッシュした。
どのモデルのリリースよりもGemini 3への注目は並外れており、Geminiがこれまで3か月ごとにアップデートしていた頻度から、AIコミュニティは9月からGemini 3の登場を待ち望んでいた。
本日、Googleの開発者関係責任者でありGoogle AI Studioの責任者でもある人物が「Gemini」という単語のみを含むツイートを投稿。数か月間にわたって蓄積された期待がついに爆発し、Twitter上の関連トピックは瞬く間に沸騰した。

興味深いことに、リリース直前になってTwitterが何回か「タイミングよく」クラッシュした。背後にはCloudflareがいたとはいえ、このタイミングの良さは誰かが意図的に仕組んだのではないかと疑ってしまうほどだ(小声:そもそもTwitterは各社モデルの主要な宣伝拠点なのだから)。
今朝Grok 4.1を発表したばかりのマスク氏が今どんな気持ちなのかは分からないが、ネットユーザーのネタ画像はすでにあふれ返っている。

そしてついに、Gemini 3が正式に登場した。万众の注目のなかで登場したその実力は一体どれほどのものだろうか。
最もスマートなモデル
実際にGoogleは待つ人々を裏切らず、Gemini 3の正式リリースにより再びSOTAを定義。オルトマン氏やマスク氏もお祝いのメッセージを送った。


Googleはこれを「AGIへの重要な一歩」と位置づけ、現時点で世界最強のマルチモーダル理解能力と最も深いインタラクションを持つエージェントであると強調している。
Gemini 3は基礎的な推論能力においてSOTA基準を更新するだけでなく、新たにGoogle AntigravityプラットフォームとDeep Thinkモードを導入することで、開発者エコシステムとAIアシスト体験の再構築を目指している。
全分野で圧倒的な推理モンスター
Gemini 3 Proは公式に「最先端の推論モデル」と称されており、主流のAIベンチマークテストのほとんどで前世代のGemini 2.5 Proを大きく上回り、Claude Sonnet 4.5やGPT-5.1といった主要競合製品を全面的に凌駕している。
Gemini 3 ProはLMArena Leaderboardで1501Eloという画期的な高得点を記録。また、「Humanity’s Last Exam」(ツールを使わず37.5%達成)や「GPQA Diamond」(91.9%)でも最高スコアを獲得し、博士レベルの推論能力を示した。数学分野でも最先端モデルに新たな基準を設け、MathArena Apexで23.4%という最新SOTA水準を達成している。
テキストや論理だけでなく、Gemini 3 Proはマルチモーダル推論の限界も再定義した。MMMU-ProとVideo-MMMUではそれぞれ81%および87.6%の高得点を記録しており、複雑な科学チャートの解析から動画ストリームの理解まで、すべて難なくこなせる。
特に注目すべきは、SimpleQA Verifiedで72.1%を記録したことであり、事実の正確性における飛躍的な進歩を示している――つまり、強さだけでなく信頼性も兼ね備えている。

お世辞をしない思考のパートナー
Gemini 3 Proの進化は単なるスコア向上ではなく、インタラクションの質にも現れている。従来のAIによく見られる陳腐な表現や過剰なお世辞を捨て、賢く、簡潔かつ率直になった――聞きたくないことでも、必要なことを伝える。
真の思考パートナーとして機能し、曖昧な科学概念を高精細なビジュアル付きコードで翻訳したり、創造的なブレインストーミングを行ったりと、情報の理解や自己表現の新しい方法を提供する。
Gemini 3 Deep Think
Gemini 3のDeep Thinkモードは知能の境界をさらに広げ、推論およびマルチモーダル理解能力の大きな進歩をもたらし、より複雑な問題解決を支援する。
テストでは、Gemini 3 Deep Thinkは「Humanity's Last Exam」(ツール未使用で41.0%)や「GPQA Diamond」(93.8%)で既に優れた成績を収めていたGemini 3 Proをさらに上回る結果を出した。さらに、ARC-AGI-2(コード実行、ARC Prize認証済み)でも前例のない45.1%を記録し、未知の課題に取り組む能力を示した。

Gemini 3 Deep Thinkモードは、最も困難なAIベンチマークテストでも優れたパフォーマンスを発揮。
学習・開発・計画
何でも学べる
Geminiは当初からテキスト、画像、動画、音声、コードなど、あらゆるトピックのマルチモーダル情報をシームレスに統合することを目指していた。Gemini 3は、高度な推論能力、視覚および空間理解能力、業界トップの多言語性能、百万トークン規模のコンテキストウィンドウを組み合わせることで、マルチモーダル推論の限界をさらに押し広げ、あなたに最適な学習方法を提供する。
たとえば、家族伝統の料理を学びたい場合、Gemini 3は異なる言語の手書きレシピを解釈・翻訳し、家族と共有できるレシピを生成できる。
あるいは、新しいテーマを学ぶために学術論文や長編の講義動画、チュートリアルを提供すれば、インタラクティブな暗記カードやビジュアル、あるいはコード形式で知識を整理し、理解を深めるサポートができる。
ピッケルボールの試合動画を分析して改善点を見つけ出し、トレーニング計画を作成し、あなたの技術全体を向上させる助けとなる。
ウェブ上の情報をよりよく理解するために、検索内のAIモードはGemini 3を活用して新しいジェネレーティブUI体験を実現。没入型のビジュアルレイアウト、インタラクティブなツール、シミュレーションなどを、あなたの検索クエリに応じて即座に生成する。
何でも開発できる
2.5 Proの成功を基に、Gemini 3は開発者のあらゆるアイデアを現実にする約束を果たす。ゼロショット生成において優れたパフォーマンスを発揮し、複雑なプロンプトや指示を処理して、より豊かでインタラクティブなWebユーザーインターフェースをレンダリングできる。
Gemini 3は、Googleがこれまでに構築した最良のVibeコーディングおよびAgentコーディングモデルであり、Google製品の自律性を高め、開発者の生産性を大幅に向上させる。WebDev Arenaランキングで首位を獲得し、1487Eloという目覚ましいスコアを記録。Terminal-Bench 2.0テストでも54.2%を達成しており、これはターミナル経由でのコンピュータ操作やツール利用能力を評価するもの。また、SWE-bench Verifiedテストでも2.5 Pro版(76.2%)を大きく上回る結果を出しており、これはコーディングエージェントの性能を測るものである。
現在、ユーザーはGoogle AI Studio、Vertex AI、Gemini CLI、およびGoogleの新エージェント開発プラットフォームGoogle Antigravity内でGemini 3を使用して開発できる。Cursor、GitHub、JetBrains、Manus、Replitなどのサードパーティプラットフォームでも利用可能。
例えば、視覚効果が豊かでインタラクション性の高いレトロな3D宇宙船ゲームを作成。
あるいは、より洗練されインタラクティブなWeb UIやアプリケーションを開発。
何でも計画できる
Gemini 2エージェント以降、Geminiは長期タスクにおける計画能力を著しく向上させた。
Gemini 3の計画能力はVending-Bench 2テストでさらに証明されている:仮想の自販機経営シミュレーションテストでこのランキングの頂点に立ち、長期にわたる計画を通じてバーチャルビジネス運営を管理した。
年間の完全シミュレーションにおいて、Gemini 3 Proは一貫したツール呼び出しと意思決定の一貫性を維持しながら、タスク目標に集中し続け、より高い投資リターンを実現した。

Gemini 3 Proは他の最先端モデルと比較して、より卓越した長期計画能力を発揮し、より高いリターンを創出。
Gemini AgentはGmailの受信トレイ整理もサポートできる。
Gemini 3は現在全面的に公開されている。一般ユーザーおよび有料ユーザーはそれぞれGemini Appおよび検索AIモードから新モデルを利用可能。開発者および企業顧客もAI Studio、Vertex AIなどを通じてアクセスできる。注目の「ディープシンキングモード」については、今後数週間以内にGoogle AI Ultra有料ユーザーに限定して順次提供予定。
また、以前リークされたモデルカードによれば、他にも注目すべき重要な情報がある:GoogleはTPUを使用してこのモデルをゼロから訓練しており、MoE(Mixture of Experts)構造を採用しているため、入力1M、出力64kトークンを実現。MoEであることで、コストを抑えて安価に運用できるようになる。

価格面では、Gemini 3.0 Proがコンテキスト長に基づく段階的価格体系を導入:200kトークン以下のタスクは、入力/出力ともに100万トークンあたり$2.00/$12.00。200kトークンを超える場合はそれぞれ$4.00および$18.00。

全新の「エージェントファースト」開発体験
Google Antigravityは、Googleの新エージェント開発プラットフォームであり、開発者がより高いレベル、つまりタスク指向の層で作業できるようにする。Gemini 3の高度な推論能力、ツール使用能力、エージェントプログラミング能力を活用することで、Google AntigravityはAIアシストを単なる開発者ツールから、積極的なパートナーへと変貌させる。
Google Antigravityの中核は馴染み深いAI IDE(統合開発環境)体験だが、エージェントは専用インターフェースに昇格され、エディタ、ターミナル、ブラウザへの直接アクセス権限が与えられている。これにより、エージェントはあなたに代わって自律的に計画を立て、複雑なエンドツーエンドのソフトウェアタスクを同時に実行し、自身のコードを検証できるようになった。
Gemini 3 Proに加え、Google AntigravityはGoogle最新のブラウザ制御用モデルGemini 2.5 Computer Useおよびトップクラスの画像編集モデルNano Banana(Gemini 2.5 Image)とも緊密に連携している。
実際の体験
Gemini 3 Proのプレビュー版がAI Studioプラットフォームに登場したので、実際に試してみた。
Prompt : NEW YORK SKYLINEのSVG。必要なライブラリは何でも使ってよいが、すべてのコードを一つのHTMLファイルに貼り付け、Chromeで開けるようにすること。興味深く、非常に詳細なものにし、誰も予想しないようなディテールを表示し、創造性と美しさを最大限に発揮せよ。コードブロック一つで完成させること。

Prompt: 視覚的に驚くほど美しいSpace Invadersゲームを作成。

カツオドリが自転車に乗るアニメーションは多くの大規模モデルを難しくしてきたが、今回もGemini 3に挑戦させた。Prompt:An animated SVG of a pelican riding a bicycle.

以前のバージョンと比べてGemini 3は大きく進歩しているが、依然バグがあり、たとえば自転車のペダルが空中で空回りしている。
より明確なプロンプトに変更:Create a single, complete, self-contained animated SVG code (no external files or images) of a cute pelican riding a bicycle from a side view。このときGemini 3が生成した自転車にはペダルがなかった。

最後に
XのブロガーChubbyが行った「2026年末までに、どの会社が最も優れたLLMを持っているか?」という投票では、Google Geminiが大きくリードしている。

こうした市場の信頼の回復はデータにも表れている。Alphabet CEOのサンダー・ピチャイ氏は公式ブログでGeminiの過去2年の進展を振り返った:AI Overviewsの月間アクティブユーザーはすでに20億人、Geminiアプリの月間アクティブユーザーは6.5億人を突破。さらに70%以上のクラウド顧客と1300万人の開発者が生成AIモデルを利用している。
ここ2年間を振り返れば、Bard(Geminiの前身)発表時の急ごしや対応と株価暴落から、痛感を経てGoogle DeepMindとの統合、創業者の復帰、ノーベル賞受賞まで、Googleは教科書的な「象のターン」を完遂した。

かつてTransformerを定義し、今や「All in Gemini」を掲げる巨人は、全面的な反撃の準備を終えた。
果たしてそれが「最高のLLM」を巡る議論に終止符を打てるのか? それにはまだ早い。もう少し、弾丸(とサーバー)が飛び続けるのを待とう。
TechFlow公式コミュニティへようこそ
Telegram購読グループ:https://t.me/TechFlowDaily
Twitter公式アカウント:https://x.com/TechFlowPost
Twitter英語アカウント:https://x.com/BlockFlow_News












