
マスクのGrok3はまだ「地球上で最も賢い」存在ではないが、確かに最もお金持ちである
TechFlow厳選深潮セレクト

マスクのGrok3はまだ「地球上で最も賢い」存在ではないが、確かに最もお金持ちである
金があれば気ままに振る舞えるが、「最強」になるためにはやるべきことがまだたくさんある。

画像出典:無界AI生成
マスク氏が「地球上で最も賢いAI」と呼ぶGrok 3が登場した。
数百万人が視聴するライブ配信の中で、マスク氏はGrok 3を発表した。共に発表に参加したのは、xAIの共同設立者である華裔研究者Tony Wu氏とJimmy Ba氏だ。ベンチマークテストの結果から見ると、Grok 3は確かに驚異的な性能を示しており、背後には20万枚のGPUからなる計算クラスタがあり、その規模も圧倒的だ。
Grok 3のリリースには、一連のモデルが含まれている:Grok 3、Grok 3 mini、および推論モード(Think)、DeepSearch、Big Brainなどのアップデートも含まれる。
#01、「最も賢いAI」の称号はランキング由来。実際の評価は?

ベンチマーク評価において、Grok 3は数学的推論やSTEMおよび科学分野のテストで、GPT-4o、Gemini-2 Pro、Claude3.5 Sonnet、DeepSeek-V3など他のモデルを上回るパフォーマンスを示した。小型版のGrok 3 Miniでさえ、トップクラスの水準にある。

初期バージョンのGrok 3は、大規模モデル競技場「Chatbot Arena」でも高得点を記録している。これはクラウドソーシング型のテストプラットフォームであり、異なるAIモデル同士が競い合い、ユーザーが最良の回答に投票する仕組みだ。Grok-3は1400点突破を果たした初のモデルとなり、全カテゴリーで首位を獲得した。

Grokは2023年のリリース以来、MMILUスコアが急速に向上し、特に2024年にGrok 2で顕著な進展を見せ、GPTシリーズとの差を急速に縮めていることがわかる。

「Grok 3は非常に強力な推論能力を持っており、これまでに行ったテストでは、我々が知る限りの既存製品をすべて上回っています。これは良い兆候です」と、マスク氏は先週ドバイで開催された世界政府サミットでのビデオ通話で述べた。
Grok 3には推論モード(Think)も搭載されており、Grok 3 ReasoningおよびGrok 3 mini Reasoningを通じて、DeepSeek-R1などの推論モデルのように「考えること」ができる。Grok 3のモデルは、可能な解決策をすべて検討し、自己批判を行い、解決策を検証し、バックトラッキングを行い、第一原理から思考するといったプロセスを通じて複雑な問題を解決できる。ただし、蒸留を防ぐため、Grok 3の一部推論過程はあえて曖昧化されている。

Grok 3 Reasoningは、o3-miniの最上位版であるo3-mini-highを多数の一般的なベンチマークテストで上回っており、新しい数学ベンチマークAIME2025も含まれている。

チームは、Grok 3のThinkモードを使って、地球から火星へ打ち上げて地球に戻るまでの軌道を示すアニメーション3Dグラフを生成するデモを行った。次の打ち上げウィンドウにおける軌道を可視化したものだ。
このデモでは、Grok 3がMatplotlibを使用したPythonスクリプトを提供し、コードの説明も行った。コードはケプラーの法則を数値的に解いているように見える。コード実行後、Grokは地球と火星の2つの惑星をアニメーション化し、緑色のボールで宇宙船の旅を表現した。

デモは現場で即興生成されたため、解決策が完全に正確かどうかは検証されていないが、地球と火星の移動軌道を描いたペンダントを着けていたマスク氏は、実際の解法に近いと評価した。

Grok 3を事前体験したAndrej Karpathy氏は、Grok 3のThinkモードがDeepSeek-R1、Gemini 2.0 Flash Thinking、Claudeなどが達成できなかったタスクを実現したと指摘したが、顶尖レベルのOpenAIモデル、例えばo1-proであれば同様のことは可能だと述べている。

OpenAI、Gemini、Perplexityに続いて、Grokも独自のディープサーチ「Deep Search」をリリースした。xAIチームはDeep Searchを「次世代検索エンジン」と位置付け、Grok Agentの第1世代製品としている。単なる情報検索ツールではなく、プログラミング、研究、日常的な疑問の解決を支援することを目指している。
デモを見る限り、Grok 3のDeep Searchに特筆すべき独自性はそれほどなく、主に従来の検索エンジンのキーワードマッチング方式とは異なり、ユーザーのクエリの意味や意図を深く理解し、複数の情報源から内容を取得して相互検証を行い、正確性を確保することを強調している。また、従来の検索エンジンよりも制御性が高く、ユーザーが情報源を指定できる点も特徴だ。
xAIチームは特に、Deep Searchの検索プロセスがユーザーに対して透明性があることを強調しており、AIの「思考」プロセスをユーザーが確認できるとしている。
Andrej Karpathy氏は、Grok 3のDeepSearchは概ねPerplexityのDeepResearchと同等だが、OpenAIが最近発表したDeep Researchのレベルにはまだ達していないと評価している。
#02、フルパワーの「Big Brain」モード
より複雑なクエリに対しては、「Big Brain」モードを利用し、より多くの計算リソースを用いて推論を行う。xAIはこれらの推論モデルを、数学、科学、プログラミングの問題に最も適していると説明しており、「フルパワー版」とも言える存在だ。

xAIチームは、Grok 3がBig BrainモードでTetris(テトリス)とBejeweled(宝石迷宮)を融合した全く新しいゲームを創造するデモを披露した。ライブ中での即興生成であったため、Grokが小さなコーディングエラーを犯す可能性があり、ゲームが期待通りに動作しない場合もあるとxAIチームは説明している。実際にライブテストではゲームは正常に動作したが、表示色に問題があり、またテトリスのように一列そろって消去するメカニズムが実装されているかは不明だった。
xAIチームはライブ配信中に、AIゲームスタジオを設立する計画を正式に認めた。マスク氏も前日にX上で関連投稿を行っていた。

#03、資金があれば自由に動けるが、「最強」になるにはまだまだやるべきことが多い

Grok 3はxAIのColossusクラスタに基づいており、第1期の10万枚のGPUクラスタは122日で構築され、さらに92日で20万枚に拡張された。Grok 3の訓練には約20万枚のGPUが使用され、1月初旬にプリトレーニングが完了した。これ以前、マスク氏はX上で、Grok 3の開発には前作Grok 2の「10倍」の計算資源が使用され、トレーニングデータセットも拡張され、裁判所の判例文書も含まれていると投稿していた。ライブ配信中、彼はGrok 3の計算資源がGrok 2の約15倍に相当すると述べた。
マスク氏はまた、xAIが現在のクラスタの5倍の電力を持つ新たなAIクラスタを建設中であることも明らかにした。

音声モードに関しては、具体的なリリース日は示されなかったが、マスク氏は「おそらく1週間程度でリリースされるだろう」と述べた。
詳細としては、音声はGrokに類似したモデルによって直接生成され、話された内容を理解し、直接音声を出力する。この方式により、AIは細部を記憶し、より自然な形で会話を継続できるようになる。音声モード機能はアプリおよびAPIの両方で提供される予定だ。
xAIは今後数週間以内にGrok-3のAPIをリリースする計画だ。このAPIにはGrok-3の推論モデルとDeep Search機能が含まれる。xAIチームは企業向け応用シナリオに大きな期待を寄せ、Grok-3の強力な能力とDeep Searchの統合が企業ユーザーに大きな価値をもたらすと考えている。

注目に値するのは、xAIが最近、データ共有に同意すれば最低5ドルのチャージで150ドル分のAPIクレジットをプレゼントするキャンペーンを開始したことだ。明らかに、xAIはこの程度の利益を譲ることを惜しまず、むしろユーザーとデータの獲得を重視している。
オープンソース計画について、マスク氏はこれまでの戦略を継続し、Grok 3が成熟・安定した段階で(数ヶ月以内に実現予定)Grok 2をオープンソース化すると述べた。

現時点では、XおよびGrokのウェブサイトやアプリを通じて体験可能だが、すべてのGrok 3モデルおよび関連機能がすでにリリースされているわけではない(一部はテスト段階)。Grok 3はまずXプラットフォームのPremium+サブスクリバー向けに提供され、さらに「Super Grok」という独立したサブスクリプションサービスも導入される。Super GrokはGrokユーザーに最先端の機能と早期アクセス権を提供し、月額30ドルまたは年額300ドル。DeepSearchでのより多くのクエリ回数や無制限の画像生成サービスなどが解放される。
Grok 3のリリースは、xAIがAI分野で激しい競争に乗り出したことを示している。それはOpenAIやグーグルとの競争だけでなく、新興中国企業からのプレッシャーにも直面している。例えば、DeepSeekは世界中のAI企業が戦略を見直すきっかけとなり、深層推論モデルを「標準」とする流れを作り出し、OpenAIが最近自社の推論モデルを無料公開するきっかけともなり、オープンソース化への動きも促している。

マスク氏にとって、OpenAIはxAI最大のライバルかもしれない。マスク氏は2023年にxAIを設立し、OpenAIの代替となる存在を目指し、OpenAIが非営利組織から営利企業へ再編する計画を公に批判している。
マスク氏はまた、OpenAIに対して2件の訴訟を提起しており、当初の設立理念から逸脱したと非難し、非営利部門を974億ドルで買収する提案を行ったが、この提案は先週OpenAI取締役会によって拒否された。サム・アルトマン氏は、この買収提案は「私たちの歩みを遅らせる」戦略だと述べている。マスク氏はかつてOpenAIの設立に関与していたが、2018年に取締役会を退任して以降、一貫して同社を批判してきた。
そして、この二社はいずれも驚異的な資金調達を行い、評価額は急上昇している。ブルームバーグが先週報じたところによれば、マスク氏のxAIは約100億ドルの資金調達交渉を進めている。調達完了後、同社の評価額は750億ドルに達する見込みで、前回の評価額は510億ドルだった。一方、OpenAIは最大400億ドルの資金調達を交渉中で、評価額は3000億ドルに達すると予想されている。
資本による「財力」の優位性も明らかだ。ソフトバンク、OpenAI、オラクル、アブダビが支援するMGXは今年1月、米国に1000億ドルを投資し、最終的には5000億ドルを投じてデータセンターその他のAIインフラを建設する計画を共同発表した。また、デル・テクノロジーズもxAIにAI最適化サーバーを提供する50億ドル超の取引を目前にしている。
現状を考えると、OpenAIは確かにxAI最大の競争相手だ。技術、市場ポジショニング、資金調達戦略のいずれにおいても直接的な競争関係にある。OpenAIは成熟した製品ラインと強力な市場シェアにより依然リードしている。Grok 3のリリースは特定の指標では優位性を示しているものの、全体のデモを見る限り、目新しい革新はそれほどなく、むしろ業界トップ企業に追いつき、並ぶことに重点が置かれている。Grok 3を支えているのは、どうやら20万枚のGPUと途切れることのない資本支援であり、真の技術的飛躍ではないようだ。今回のリリースは、マスク氏が言う「AIがGrokを超える最後の機会かもしれない」というものではなかった。
Grok 3リリースの冒頭で、マスク氏は改めてxAIとGrokの使命を紹介した:宇宙の本質を理解し、何が起きているのかを解明し、エイリアスの痕跡を探し、生命の意味を追究し、宇宙の起源を理解し、その終焉の方法を確立すること。xAIは真実の追求を原動力とし、究極の真実探究型AIとなる。
しかし、こうした壮大なビジョンを実現しようと、あるいはより現実的な競争に勝とうとも、「金銭力」とランキング上の「最強」の肩書きだけでは不十分だ。真の「地球上で最も賢いAI」になるには、マスク氏とそのxAIはまだ長い道のりを歩まなければならない。
TechFlow公式コミュニティへようこそ
Telegram購読グループ:https://t.me/TechFlowDaily
Twitter公式アカウント:https://x.com/TechFlowPost
Twitter英語アカウント:https://x.com/BlockFlow_News










