
Manus 最新の会話全文:Agent支払いを試みる、企業のRRRは約1億ドル
TechFlow厳選深潮セレクト

Manus 最新の会話全文:Agent支払いを試みる、企業のRRRは約1億ドル
万物Agentの時代に、Manusがまた一歩先んじた。
著者|Li Yuan
編集|靖宇

シンガポールに移ったManusは、汎用AIエージェントに関する思考を続けてきた。
本日シンガポールで開催されたStripe Tourにおいて、Manus共同創業者兼チーフサイエンティストの季逸超(Peak)が、Stripeのアジア太平洋および日本担当最高収益責任者であるPaul Harapinと対談した。
この席上、Manus AIは最近の経営データを公開。収益ランレート(RRR、Revenue Run Rate)がすでに9,000万ドルに達しており、まもなく1億ドルを超える見込みであることを明らかにした。
Manus AIの肖弘は即刻(Jike)でも特別に説明し、「Revenue Run Rateとは当月の売上×12を指すものであり、現金収入(Cash Income)とは異なる。多くのAI製品には年間契約オプションがあり、これらは前受金として扱われるべきであり、売上としては計上できない。もし我々がこのような【誤った方法】で開示すれば、1.2億ドルよりも大きな数字を算出できるだろう」と述べた。
経営データに加え、季逸超はManusチームが汎用エージェントの次のステップをどのように考えているか、またAIエージェントとAGIの将来における違いについても語った。
「現在、人々はほとんどすべてのものを『エージェント』と呼んでいます。例えばマイク一つでも、誰かが『環境認識機能を持つ録音エージェント』と呼ぶでしょう」と、季逸超は冗談めかして語った。
彼はまた、汎用エージェントの能力を拡張するための次の二つの主軸を提示した:第一に、複数のエージェントによる協働によって実行規模を広げる(大規模調査中に数百の並列サブエージェントを派生させるなど)こと。第二に、エージェントにより広範な「ツール面」を開くこと。つまり能力を少数の事前設定APIに縛らず、プログラマーのようにオープンソースエコシステムを呼び出し、ライブラリをインストールし、可視化後に図を見て自己点検・修正を行うような柔軟性を持たせることである。
季逸超はさらに、今日のデジタル世界は依然として「人向け」のパラダイムで構築されていると指摘した。API非対応のウェブページ、CAPTCHA、手続きの「ミニゲーム化」などが多数の摩擦を生み出しており、ボトルネックはモデルの知能ではなく、むしろエコシステムや制度的制約にあると述べた。
それが、ManusがStripeのイベントに参加する理由の一つでもある。双方はエージェント内での支払い処理の実現に向けて協力しており、「調査→意思決定→注文/決済」を一連のループとしてつなぎ、インフラ同士の連携によって世界の摩擦を解消しようとしているのだ。
以下は対話のハイライトをGeekParkが編集・整理したものである:
問:観客の皆さんに、まずご自身を簡単に紹介してください。「コンテキストエンジニアリング」に関する最近のブログは非常に鼓舞されました。AIエージェントを開発している方々にとっては必読だと思います。私がエンジニアたちと昼食をとるときも、彼らはいつもそれについて話していますので、私はもう別のテーブルに行かざるを得ません(笑)。しかし会場でManusにあまり馴染みのない方もいらっしゃると思いますので、あなたの経歴やビジョンを共有いただけますか?
答: ありがとうございます、Paul。今日はお招きいただき光栄です。Manusは汎用AIエージェントの構築を目指しています。
多くの研究機関や企業が「脳」を構築しようとしており、つまり大規模言語モデルを作ろうとしています。しかし私たちから見ると、消費者の立場ではこれは実はあまり良いものではありません。AIには本当に行動を起こし、物事を成し遂げてほしい。だからこそ、Manusを構築しました。
私たちのアプローチは、AIに人類史上最大の発明の一つである汎用コンピュータを使わせることです。AIにコンピュータを与えれば、人間ができることのすべてができるようになります。Manusは実際にタスクを完遂できます。たとえばプレゼン資料の作成、旅行の計画立案、SNS運営の支援なども可能です――ただし、実際にそれを行うことはお勧めしませんが。
ユーザーの皆さんは本当にManusを気に入ってくれています。3月にManusをリリースして以来、収益ランレート(RRR)はすでに約9,000万ドルに達しており、まもなく1億ドルを突破します。
私たちのような小規模スタートアップにとって、これは非常に大きな成果だと感じています。しかし何より重要なのは、AIエージェントがもはや研究分野の流行語ではなく、実際に使われ始め、地に足がついた存在になりつつあるという事実です。
Manus構築の過程で得た小さなエピソードをお話ししましょう。
私たちはエージェントコーディングの応用から多くのインスピレーションを得ました。例えばCursorのようなAIプログラミングツールは、以前から注目を集めていました。
エンジニアである私たち自身はもちろんCursorを使いますが、驚いたことに、会社の非エンジニアの同僚たちも多くがCursorを使っているのです。もちろん彼らはソフトウェア開発をしているわけではなく、データの可視化や文章作成に使っています。左側のコード部分は無視して、単にAIと会話しながら作業を進めているのです。
これにより、こうしたアプローチを一般化し、非プログラマーにも力を与えるべきだと気づきました。これがまさにAIのユースケースの一つです。
問:AIエージェントとAGIについて語られることが増えています。この二つの概念をより明確に区別していただけますか?AIエージェントとAGIとは、あなたやManusにとってそれぞれ何を意味するのでしょうか?
答: これは非常に良い質問だと思います。
現在、人々はほぼすべてのものを「エージェント」と呼びます。例えばマイク一つでも、「環境認識機能を持つ録音エージェント」と表現されます。
しかし少なくとも私たちの主張では、エージェントはアプリケーション型AIの一部にすぎません。まずは一般的なAIアプリケーションのカテゴリを振り返ってみましょう。
ほとんどの人がすでに二つのタイプに慣れ親しんでいます。一つはチャットボット、例えばChatGPT。もう一つは生成系ツール、MidJourneyやSoraなどです。これらのシステムでは通常、ユーザーとモデルの二つの役割しかありません。ユーザーがモデルとやり取りし、出力を受け取るだけです。一方、エージェントの違いは、ユーザーとモデルに加えて、第三の重要な要素——「環境」を導入する点にあります。
この「環境」という概念はエージェントの種類によって異なります。例えばデザイン指向のエージェントでは、環境はキャンバスやコードの断片かもしれません。一方、Manusの場合、私たちの目標はエージェントを仮想マシン、さらにはインターネット全体にまで登場させることです。これによりエージェントは環境を観察し、次に何をするかを判断し、行動を通じて環境を変化させることができるようになります。これこそがエージェントの強さです。
たとえばManusでは、必要に応じてブラウザを開き、ウェブページを公開し、航空券を予約してくれます。この例が好きなのですが、航空券の予約は簡単そうに聞こえますが、実際にはAIが直接現実世界を変化させているのです。結果はモデルの出力ではなく、あなたが手にする航空券そのものです。AIが本当にあなたの世界に介入しているのです。これが私たちが言う「エージェント」です。
簡単に言えば、エージェントとはユーザーを代表して環境と相互作用するAIシステムのことです。
AGIについては、これも頻繁に話題になりますが、多くの人がそれをスーパーインテリジェンスと同一視しています。私たちの考えでは、AGIとは特別な設計を経ずに、AIモデルの汎用的な能力を使って多様なタスクを遂行できるシステムのことです。
「エージェントコーディング」は実はAGIへの道筋の一つだと考えています。これは特定の垂直領域の能力ではなく、コンピュータにこれを与えれば、コンピュータ上でほぼすべてのことができるようになるからです。従って私たちにとって、AGIを実現する条件とは、この能力を発揮できるほど十分に整備された環境を構築することです。
問:AIは今日、実際にどのシナリオで真に機能しているのでしょうか?今後どこで機能するようになるでしょうか?そして「iPhoneモーメント」はいつ訪れるのでしょう?
答: エージェントに関して言えば、モデル能力だけを見ると、現在のフラッグシップモデルはすでに非常に驚異的で、ほぼ「超人」レベルです。数学競技会や論理的推論において、私たちの大多数を凌駕することができます。
しかし、モデルはいまだに「瓶の中の脳」のようなものだと私は思います。真の力を発揮するには、現実世界とのインタラクションが必要です。しかし残念ながら、ここから問題が始まります。
例えば、AIに事務的なタスクを依頼すると、繰り返し作業には非常に優れています。Deep Researchのような製品は、情報を集約して結果を出すだけで、その出力は単に表示されるだけです。
たとえば、現在のほとんどすべてのものは人間のために設計されています。物理世界だけでなく、デジタル世界もそうです。ウェブツールはまるでミニゲームのようで、APIや標準インターフェースが提供されていません。CAPTCHAはいたるところにあり、エージェントを遮断しています。
そのため、AIは閉じられた自足的なタスクでは非常にうまく機能しますが、現実世界に関わると障壁に直面するのです。
「iPhoneモーメント」はいつ訪れるでしょうか? 私はこれは技術的な問題ではなく、むしろ制度的制約に近いものだと考えます。このような課題は、私たちのようなエージェントスタートアップが単独で解決できるものではありません。
これは段階的な変化を要し、エコシステム全体の進化が必要です。Stripeのような企業がインフラレベルで取り組むことも必要です。例えば、私たちは現在、StripeのAgentic Payment APIを統合しようとしています。皆で協力して取り組んでいます。
問:では、ユーザーがManusを使う典型的なシーンについて具体的に教えていただけますか?どのように使われており、そこにはどのような力が現れているのでしょうか?
答: はい、私たちは現行世代のエージェントに属していますが、すでに多くの素晴らしいユースケースが生まれています。
例えば、私たちは最近シンガポールに移りましたが、住居を探すために不動産仲介業者を雇う必要があります。これは人間のエージェント(笑)です。
しかし、これらの仲介業者はすでにManusを使い始めています。顧客のニーズに基づき、Manusを使って会社の所在地や従業員が住みたいエリアを分析し、それに応じた推薦を生成しています。
これはとても興味深いと感じます。なぜならこれは一種の「ロングテール需要」だからです。通常、このような特定のシナリオ専用のAI製品は存在しませんが、Manusは汎用エージェントであるため、こうした需要にも応えられます。ロングテール需要は非常に注目に値すると考えています。
マクロ的にはロングテールかもしれませんが、個々のユーザーにとってはそれが日常業務そのものです。このようなシーンには特に価値があります。
これは現代の検索エンジンの状況に似ています。よくある内容を検索する場合、GoogleでもBingでも結果の質はほぼ同じです。それでも人々はある検索エンジンを選ぶのは、特定の瞬間に自分に合う結果をくれたからかもしれません。また、非常にパーソナルまたは専門的な内容を検索する場合は、差がより顕著になります。だからこそ、汎用エージェントの強みはここにあると考えます。
では、どうすればもっと良くなるでしょうか? 私たちは長い間考えてきました。なぜなら、すべてはプログラミングに帰着すると考えているからです。AIにコンピュータを渡せば、環境とのインタラクションの手段は結局プログラミングになるのです。
改善すべき点は二つあると考えます。第一はスケーリングです。しかし、エージェントの能力を百倍に拡大できたらどうでしょうか?
最近、Manusは「Wide Research」という新機能をリリースしました。基本的なアイデアは、一つのエージェントが数百のエージェントを派生させて共同作業を行うことを可能にすることです。AIに小さなことを頼む場合、多くの場合自分でできるレベルです。しかし、非常に大規模なタスク、例えば大規模な調査などになると、一人では到底不可能です。そんなときに数百のエージェントが並列して作業すれば、非常に強力になります。
第二に、エージェントがコンピュータをより柔軟に使えるようにすることです。もしAIエージェントに事前に設定されたツールしか与えなければ、その行動範囲はそれらのツールに制限されてしまいます。しかし、プログラマーになったつもりで、オープンソースコミュニティのすべてのリソースを利用できると想像してみてください。
例えば3Dプリントの際に、モデルのパラメータを直接変更するのは難しいですが、GitHub上で適切なライブラリを見つけ、インストールするだけで問題を解決できます。Manusでは汎用性を最適化しており、「ツールのネットワーク効果」という概念を提唱しています。
面白い例があります。多くのユーザーがManusを使ってデータの可視化を行っています。アジアでは時折、グラフ内の中国語表示時にフォントエラーが発生することがあります。一部の上級ユーザーは、韓国語出力時には特定のフォントを使うといったハードコーディングルールを書くかもしれませんが、このような方法ではシステムがどんどん硬直化してしまいます。
私たちが採用したのは、システムに「画像を見る」という非常にシンプルな能力を追加することでした。結果は驚きでした。今日のモデルは十分に賢いため、可視化画像を生成した後に自分でチェックし、エラーに気づいて自動的に修正するのです。ツールの柔軟性を高めることが、ハードコーディングルールよりも多くの問題を解決できることがわかりました。
問:これは本当にわくわくする時代ですね。私ももう少し若ければいいのに(笑)。医学研究についても触れましたが、Manusはこの分野でも強いと聞いています。医療研究にManusを使っているユーザーを観察していますか?
答: すでに多くの人がManusを使って研究しています。医学研究に限らずです。非常に興味深いのは、確かに多くの「ディープリサーチ」製品が存在し、大量の情報を収集・分析してマークダウンファイルやドキュメントを出力しますが、それだけでは不十分なのです。
多くの場合、研究者が本当に必要なのは、上司やチームに直接提出できる成果物です。そこでManusでは、研究結果の出力を強化しました。例えば医学研究では、正式な報告書、スライド形式のレポートなどを生成する必要があります。そのため、研究者のニーズに応えるためにAIの出力能力を最適化しなければなりません。これは一種の「ツール化」体験です。
多くのユーザーが、まずManusで研究を行い、その後すぐにウェブサイトを生成しています。これは従来のウェブサイト構築方法とはまったく違うと感じるでしょう。
ウェブサイトを構築することはそれ自体難しくありませんが、問題はデータの信頼性と正確性をどう確保するかです。そのため、一回の会話、一つの共有されたコンテキストの中でプロセス全体を完結させるのが最善だと考えます。そうすれば、研究内容や洞察がシームレスに最終成果物へと変換されます。これがManusで実現していることです。
問:多くの国で、AI時代における人間の未来や経済的影響について議論されています。雇用の置き換えについてどのようにお考えですか? また、どのような新しい仕事が生まれるでしょうか?
答: 友人や投資家からもよくこの質問を受けます。Manusをリリース当初、このようなエージェントがあれば人々の時間を節約でき、楽にお金を稼げるだろうと考えていました。
しかし実際には、そのビジョンは完全には実現していません。多くのユーザーアンケートを通じて分かったのは、ユーザーたちは使用後、むしろより多く働くようになったということです。なぜなら効率が上がり、もともと得意だったことをさらに多くできるようになったからです。これが一点目です。
第二に、Manusはまったく新しい空間を切り開いていると考えます。私たちは常に仮想マシンやクラウドコンピューティングについて話してきました。Manusは「個人用クラウドプラットフォーム」のような役割を果たしていると感じます。クラウドコンピューティングは数十年存在していますが、それは主にエンジニアの特権でした。私たちだけがプログラミングを通じてクラウドの力を引き出せたのです。一般の知識労働者は利用できませんでした。
しかし、ManusのようなAIエージェントのおかげで、人々は自然言語で指示を出し、AIに実行させることができるようになりました。これはまったく新しい生産性を解放したことになります。それが私たちが提供しているものです。
最後に「代替」についてですが、これは実際には非常に難しいと考えます。不動産仲介業者は毎日Manusを使って日常業務をこなしています。しかし、AIが仲介業者がクライアントと接する際のコミュニケーションスタイルを完全に代替することはできません。私たち自身がAI企業であり、Manusのリリースビデオの脚本さえManusが書いたのですが、映像に登場するのは私自身です。それは信頼の問題だからです。信頼は、完全にAIに委ねることはできないのです。
TechFlow公式コミュニティへようこそ
Telegram購読グループ:https://t.me/TechFlowDaily
Twitter公式アカウント:https://x.com/TechFlowPost
Twitter英語アカウント:https://x.com/BlockFlow_News














