
AIエージェントの「GPT モーメント」、ManusがAI業界全体を震撼させる
TechFlow厳選深潮セレクト

AIエージェントの「GPT モーメント」、ManusがAI業界全体を震撼させる
ユーザーに最も近く、最高のAIエージェントを創造する。
著者:shiyun、張勇毅

2025年はAIエージェントの元年である――この言葉が、北京時間3月6日未明、現実のものとなった。
「DeepSeekに続いて、また一つテック業界を夜通しで沸かせた出来事だ」
多くのユーザーがSNS上でこう評している。
すべての人が徹夜して待っていたのは、ある製品の使用招待コード――それがMonica.imが開発した世界初のAIエージェント製品「Manus」だった。
開発チームによると、「Manus」とは真に自律的なAIエージェントであり、さまざまな複雑かつ多様なタスクを解決できる。従来のAIアシスタントとは異なり、Manusは提案や答えを提供するだけでなく、タスクの成果物を直接届けることができる。

Manusの紹介動画はわずか4分間だが、そのインパクトは計り知れない
画像出典:Monica.im
「Manus」という名前の由来はラテン語で「手」を意味する。つまり知識だけではなく、実際に「手を動かす」ことが求められる。これこそがエージェントとAIボット(チャットボット)との本質的な進化なのである。
Manusのすごさはどこにあるのか?最も直感的なのは公式ウェブサイトやユーザー自身が公開したユースケースを見てみることだろう。以下はGeekParkがまとめた一部の例である:
旅行プランニング:旅行情報を統合するだけでなく、カスタマイズされた旅行ガイドを作成。例えば、4月の日本旅行を計画し、パーソナライズされたアドバイスと詳細なガイドを提供する。
株式分析:深掘りした株式分析を行い、視覚的に魅力的なダッシュボードで包括的な洞察を提示。例えば、テスラ株を深く分析し、可視化ダッシュボードを作成する。
教育コンテンツ作成:中学校の教師向けに、運動量の定理などの複雑な概念を説明するための動画教材を作成し、より効果的な授業を支援する。
保険プラン比較:明確な保険プラン比較表を作成し、最適な意思決定のためのアドバイスを提供し、ユーザーが自分に最も合った保険商品を選べるよう支援する。
サプライヤー調達:ネット全体で深くリサーチを行い、ユーザーのニーズに最も合ったサプライヤーを見つけ出し、真正に公平な代理人としてサービスを提供する。
財務報告分析:リサーチとデータ分析を通じて特定企業(例:アマゾン)に対する市場の感情変化を捉え、過去四半期の市場センチメント分析を提供する。
スタートアップ企業リスト整理:関連サイトにアクセスし、条件に合う企業を識別して表形式にまとめる。例えば、YC W25バッチのB2B企業すべてをリストアップする。
オンラインストア運営分析:アマゾンストアの販売データを分析し、実行可能なインサイト、詳細な可視化、カスタム戦略を提供して、売上向上を支援する。
エージェントが一連の思考チェーンとツール呼び出しを経て、最終的に非常に完成度が高くプロフェッショナルな結果を出力するとき、ユーザーたちは「本当に人間の仕事を代行できるようになった」と感嘆する。
公式ウェブサイト情報によると、GAIAベンチマークテスト(汎用AIアシスタントが現実世界の問題を解決する能力を評価)において、Manusはすべての3つの難易度レベルで新たな最先端(SOTA)パフォーマンスを達成した。
一言でまとめれば――Manusが目指しているのは、デジタル世界における文字通りの「代理人」であり、そしてそれを実際に実現しているのである。
想像通り、未明にリリースされたManusは、瞬く間にAI業界全体を震撼させた!
01 Manus、あなたの「デジタル代理人」
まず、ManusがこれまでのLLMと体験面で大きく異なる点は:
単なる「答え」を出すのではなく、最終的な成果物を直接提供する能力を重視していることである。
現在Manusはマルチエージェント構造を採用しており、動作方式は以前Anthropicが発表したComputer Useと類似している。完全に独立した仮想マシン上で動作し、仮想環境内でコードの作成・実行、ウェブブラウジング、アプリ操作などさまざまなツールを呼び出して、完成した成果物を直接提供する。
公式発表の動画では、Manusが実際の使用シーンで完了した3つの業務事例が紹介されている:
最初のタスクは履歴書の選考である。
15通の履歴書の中から、強化学習アルゴリズムエンジニア職にふさわしい候補者を推薦し、その強化学習に関する専門知識に基づいて候補者をランク付けする。
このデモでは、圧縮ファイルを解凍して、一つずつ履歴書を手動でアップロードする必要はない。Manusはすでに人間の「インターン生」のように振る舞っており、自動でファイルを解凍し、各履歴書をページごとに読み込みながら重要な情報を記録する。

Manusはインターンのように、「上司が投げてきた圧縮ファイルを解凍する」という隠れた指示を自動で理解する
画像出典:GeekPark
Manusが出力する結果には、自動生成されたランキング提案だけでなく、経験などの重要な観点に基づいて候補者を異なるレベルに分類することも含まれている。ユーザーがExcel形式での表示を希望すると、ManusはPythonスクリプトを現場で作成して、対応する表を自動生成できる。
さらにManusは記憶機能により、このプロセス中に「ユーザーは結果を表形式で受け取ることを好む」といった情報を記録し、次回同様のタスクを処理する際には、優先的に表形式で結果を提示する。

Manusはコンテンツ生成プロセス中のユーザーの好みを記憶できる
画像出典:GeekPark
二つ目の事例は、中国人ユーザーに特に最適化された不動産選びである。
ユーザーはニューヨークで不動産を購入したいとし、安全なコミュニティ環境、低犯罪率、優れた小中学校の教育資源を求めている――もちろん最も重要な予算も、毎月の固定収入内で負担可能でなければならない。
この要求に対して、Manus AIは複雑なタスクを「やることリスト」に分解する。安全な地域の調査、高品質の学校の特定、予算計算、物件検索などを含む。そしてネット検索を通じて、ニューヨークで最も安全な地域に関する記事を丁寧に読み、関連情報を収集する。
次に、ManusはPythonプログラムを作成して、ユーザーの収入に基づいて購入可能な不動産予算を計算する。不動産サイトの価格情報と組み合わせ、予算範囲内の物件リストをフィルタリングする。

Manusは自動で検索し、ユーザーの条件に合わない物件を除外できる
画像出典:GeekPark
最後に、Manusは収集したすべての情報を統合し、コミュニティの安全性分析、学校の質評価、予算分析、おすすめ物件リスト、関連リソースリンクなどを含む詳細なレポートを作成する――まるでプロの不動産仲介人のように。しかもManusは「完全にユーザーの利益を最優先する」という属性を持っているため、使い勝手もより優れている。
最後の事例では、Manusが株価分析の能力を示している。
与えられたタスクは、過去3年間におけるNVIDIA、Marvell Technology、TSMCの株価相関性を分析することである。これら3銘柄は密接に関連していることは広く知られているが、初心者のユーザーにとってはその因果関係を素早く整理するのは難しい。
Manusの操作は、本物の証券アナリストと非常に似ており、まずAPIを通じてYahooファイナンスなどの情報サイトにアクセスして株価の過去データを取得する。同時にデータの正確性をクロスチェックし、単一情報源による誤導を避け、最終的な結果への重大な影響を防ぐ。
この事例でも、ManusはPythonコードの作成、データ分析、可視化の能力を活用し、金融分野の専門ツールも導入して、最終的にはデータ可視化チャートと詳尽な総合分析レポートを組み合わせて、ユーザーに因果関係をフィードバックする――まさに金融分野の「インターン生」が日常的に行う業務そのものである。
さらに、Manusの公式サイトでは他にも十数の利用シーンが紹介されており、スケジュール整理、パーソナライズされた旅行ルートの提案、複雑なツールの学習を通じて日常業務を自動化できる。
このプロセスの中で、Manusが従来のツールと根本的に異なる点は、自ら計画を立ててタスク遂行能力を確保する点にある。
自己学習能力によって、Manusの業務能力の成長の論理は、まさに人間と似ている――現時点では特定分野で専門家レベルの精通はまだできないかもしれないが、すでに巨大な可能性が見えている。
自己学習能力が加わったことで、AIエージェントの汎用性は飛躍的に向上した。ユーザーの実際のテストでは、ある動画の内容をそのままManusに説明するだけで、最終的に対応する情報をもとに、検索エンジンの制限を超えて、特定の抖音(ドウイン)短編動画のリンクを正確に見つけ出せる。
現在のバージョンのManusは完全にクラウド上で非同期に動作しているため、ユーザー側の端末プラットフォームの形状や計算能力などの要因に制約されない――つまり、Manusに指示を出した後、PCを一時的にシャットダウンしても、Manusがタスクを完了した時点で自動的に結果を通知してくれる。
この操作の論理も非常に馴染み深い――まるで退社後にWeChatでインターンに「ファイル整理して送って」と頼むようなものだ。ただし今や、このインターンは本当に24時間365日対応でき、しかも「職場改革」を心配する必要もない。
02 マルチエージェント+セルフチェック、AIエージェントの流れを確立
これらの事例から明らかなように、Manusの真のキラーアプリは、Computer Useですでに登場していた「AIエージェント」の概念ではなく、「人間の働き方を模倣する」能力である。
「計算を実行する」よりも、Manusの作業ロジックはむしろ「命令を考えて実行する」に近い。人類が現在まったく不可能なことを達成しているわけではない。だからこそ、既に現行バージョンのManusを体験した一部のユーザーが、それを「インターン生」と表現するのである。
Manusの公式サイトでは多数の実行可能なタスクが紹介されており、その中にはB2Bビジネスにおいて、注文ニーズをグローバルなサプライヤーと迅速かつ正確にマッチングする方法も紹介されている。
通常の製品では、プラットフォーム内にグローバルなサプライチェーン企業の情報を統合し、ユーザーの供給者/需要者マッチングを支援することが業界標準のロジックである。しかしManusのケースでは、まったく異なる実現方法が見られる。
Manus AIは「Multiple Agent」と呼ばれるアーキテクチャを使用し、独立した仮想マシン上で動作する。計画エージェント、実行エージェント、検証エージェントの分業協働メカニズムにより、複雑なタスクの処理効率を大幅に向上させ、並列計算によって応答時間を短縮する。
このアーキテクチャでは、各エージェントは独立した言語モデルまたは強化学習モデルに基づいている可能性があり、相互にAPIまたはメッセージキューで通信する。また各タスクはサンドボックス内で実行され、他のタスクへの干渉を防ぎつつ、クラウドでの拡張をサポートする。各独立モデルは人間がタスクを処理するプロセスを模倣でき、まず考え計画を立て、複雑な命令を理解して実行可能なステップに分解し、適切なツールを呼び出す。
言い換えれば、Manusのこのマルチエージェントアーキテクチャにより、複数のアシスタントが協力して、リソースの検索、接続、情報の有効性検証などの作業を分担して、ユーザーの業務プロセス全体を完結させる。これは単に「インターン生」を雇うというだけでなく、むしろ小さな「部門長」になったようなものである。
B2Bビジネスの事例では、Manusはウェブクローリングおよびコードの作成・実行能力を利用して、インターネットの大海原からユーザーのニーズに応じて、潜在的なサプライヤーの製品品質、価格、納期能力などから最適な货源をマッチングする。その結論をグラフで直感的に提示するだけでなく、これらのデータに基づいてさらに詳細な操作アドバイスを提供できる。

ManusがB2Bシーンのニーズに対応する能力は、単一プラットフォームの内蔵ツールよりも優れているかもしれない
画像出典:GeekPark
Monicaチームがどのような技術で動画のような効果を実現したのかは、現時点では不明だが、チームは北京時間3月6日に明らかにする予定である。
03 「継ぎ接ぎ」の極致が、爆発を生む
Manusの背後にあるMonica.imとは、一体どんな会社なのか?
MonicaはAll-in-OneのAIアシスタントであり、製品形態はブラウザプラグインから徐々にApp、ウェブ版へと拡大している。主な利用シーンは、ユーザーがブラウザで小さなアイコンを開くだけで、主要な大規模モデルに簡単にアクセスできるというもの。細分化されたシーンでのユーザーのニーズを正確に理解することで、Monicaは大規模モデルの「手の届きやすい果実」を摘み取った。
創業者は肖弘(愛称:小紅、英語名:Red)。1992年生まれの若手連続起業家で、華中科技大学卒業。2015年に卒業後すぐに起業するが、当初は順調ではなかった(キャンパスSNS、中古マーケットなど)。2016年、微信公众号運営者向けに編集・データ分析ツールを提供し、百万ユーザーを獲得して黒字化に成功。2020年にその製品はあるユニコーン企業に売却された。
2022年の大規模モデルの波に乗って、正式にMonicaを設立し、海外市場に特化。独立開発者が制作した「ChatGPT for Google」を通じて、製品は急速に冷始動を完了した。
2024年、GPT-4o、Claude 3.5、OpenAI o1シリーズがリリースされると、Monicaは即座に最新のSOTAモデルをユーザーに提供した。モデル接続の進展とともに、プロフェッショナル検索、DIY Bot、Artifactsによるミニアプリ作成、記憶機能などがユーザーに支持される。YouTube、Twitter、Gmail、The Informationなど異なる機能を持つウェブページで、それぞれに最適化された対話形式と機能を提供し、数百のウェブページにわたってパーソナライズされたAI体験を更新した。
2024年、Monicaのユーザー数は倍増し、1,000万人に達した。また着実な収益を維持しており、海外の同種製品の中でもトップクラスである。
Monicaの強力なパフォーマンスは、一つの事実を証明している:
「殻」を極めることは、TPF(Technology Pushed to the Frontier)であり、PMF(Product-Market Fit)でもあり、最終的にユーザー価値につながる。

Monicaホームページ
画像出典:Monica
ManusはおそらくMonicaチームのこのような考え方を引き継いでいる――創業者の肖弘はメディア人張小珺のインタビューで、「製品はチャットボットだけの形態ではいけない。エージェントは新しい形態であり、それにふさわしい新しい製品が必要だ」と述べている。
彼はAIプログラミング製品のCursorとDevinからインスピレーションを得た。GeekParkの取材によると、前者はコパイロット(共同操縦)モード、後者はオートパイロット(自動操縦)モードであり、後者の方が人間のニーズに合っている。エージェントもDevinのように、一般大衆を対象とし、真にAIが主体となって実行すべきだ。しかし過去の問題は、モデルが十分に賢くなかったことである。
しかし、既存のモデル能力をベースにしたシーンのパッケージ化サービスこそ、Monicaチームの強みかもしれない。肖弘によると、現在エージェント製品を開発しているチームは少ない。なぜならそれは多くの複合能力を必要とするからだ。例えば、チャットボット、AIプログラミング、ブラウザ関連(すべてブラウザ上で動作するため)、モデルの限界に対する優れた認識力などが必要である――現在どの程度の水準に達しているか、今後どう発展していくか、といったことだ。
「これらの能力をすべて兼ね備えた企業は多くない。そしてそうした能力を持つ企業は、おそらく今ある具体的な事業に集中している。しかし我々には、たまたまタイミングが合って、これを一緒に形にできたメンバーがいたのだ」と彼は言う。
なぜMonicaがそれを実現できたのか、彼はこう総括する。「第一に、私たちは幸運だったと思う。第二に、ある意味で、もし今みんなが推論(reasoning)に集中しているなら、それによってスタートアップに少し時間が残されたのではないか?モデルの能力がどこまで外に漏れ出るのか、まだ分からない」
彼は、現時点ではエージェントはまだ初期段階にあると考えている。第一に、現在のエージェントはまだ計画段階にあり、物理世界での実行には至っていない。第二に、大規模モデルの能力はまだ向上途中であり、何が起こるか予測できない。
「私は確かに、エージェントがこのようにして作られることを知らなかった。それは未知の出来事だった」と彼は言う。
興味深いことに、「どうやってエージェントを作るか分からない」と言っていたMonicaが、今やAI業界全体を震撼させる製品を生み出した。
Manusが最終的なAIエージェントかどうかはわからないが、DeepSeekの爆発的人気に続いて、人々のAIに対する期待を再び一段階引き上げたことは間違いない。
TechFlow公式コミュニティへようこそ
Telegram購読グループ:https://t.me/TechFlowDaily
Twitter公式アカウント:https://x.com/TechFlowPost
Twitter英語アカウント:https://x.com/BlockFlow_News











