
Transcription complète de la dernière conversation Manus : tentative de paiement via Agent, RRR de l'entreprise proche de 100 millions de dollars
TechFlow SélectionTechFlow Sélection

Transcription complète de la dernière conversation Manus : tentative de paiement via Agent, RRR de l'entreprise proche de 100 millions de dollars
L'ère de l'agent universel, Manus a encore une longueur d'avance.
Auteur|Li Yuan
Éditeur|Jingyu

Manus, installé à Singapour, n’a pas cessé de réfléchir aux agents IA généraux.
Lors de l’événement Stripe Tour organisé aujourd’hui à Singapour, Ji Yichao (Peak), cofondateur et scientifique en chef de Manus, a participé à une discussion avec Paul Harapin, directeur des revenus pour l’Asie-Pacifique et le Japon chez Stripe.
Au cours de cet échange, Manus AI a dévoilé ses données opérationnelles récentes : son taux de revenus annualisé (RRR, Revenue Run Rate) atteint désormais 90 millions de dollars américains, approchant rapidement la barre du milliard.
Xiao Hong de Manus AI a précisé sur JiKe que « Revenue Run Rate » désigne le chiffre d’affaires mensuel multiplié par 12, et ne correspond pas au cash encaissé. De nombreux produits IA proposent une option de paiement annuel, qui doit être comptabilisée comme un dépôt prépayé, non comme un revenu. « Si nous divulguions selon cette [méthode incorrecte], nous pourrions afficher un montant supérieur à 120 millions de dollars », a-t-il ajouté.
Au-delà des données financières, Ji Yichao a partagé la vision de l’équipe Manus sur les prochaines étapes du développement des agents généraux, ainsi que la différence fondamentale entre les agents IA et l’AGI.
« Aujourd’hui, tout est presque appelé agent. Par exemple, quelqu’un pourrait appeler un microphone un "agent d’enregistrement avec perception environnementale". » plaisante Ji Yichao.
Il a également identifié deux axes principaux pour étendre les capacités des agents généraux : premièrement, utiliser la collaboration entre plusieurs agents pour élargir l’échelle d’exécution (par exemple, générer des centaines de sous-agents parallèles dans une vaste étude) ; deuxièmement, offrir aux agents un « champ d’outils » plus vaste, en ne limitant pas leurs capacités à quelques API prédéfinies, mais en leur permettant, comme les programmeurs, d’utiliser l’écosystème open source, d’installer des bibliothèques, voire de s’auto-analyser et corriger après visualisation.
Ji Yichao a souligné que le monde numérique actuel est encore conçu selon le paradigme « fait pour les humains » — sites web sans API, CAPTCHA omniprésents, processus « gamifiés » créant de nombreuses frictions. Le goulot d’étranglement ressemble davantage à une contrainte écologique ou institutionnelle qu’à une limite intellectuelle du modèle.
C’est aussi l’une des raisons pour lesquelles Manus participe à l’événement Stripe : les deux parties travaillent conjointement à intégrer le paiement dans l’agent lui-même, afin de créer une boucle fermée allant de la « recherche → décision → commande/règlement », et réduire ainsi les frictions du monde grâce à une collaboration au niveau des infrastructures.
Ci-dessous, les extraits clés de cet entretien, édités par GeekPark :
Question : Pourriez-vous vous présenter brièvement aux spectateurs ? Votre dernier billet de blog sur l'« ingénierie du contexte » est très inspirant, je pense qu’il est incontournable pour toute personne ici développant un agent IA. À chaque fois que j’allais déjeuner avec des ingénieurs, ils ne parlaient que de cela, donc maintenant je dois m’asseoir ailleurs (rire). Mais pour ceux qui ne connaissent peut-être pas bien Manus, pourriez-vous partager votre parcours et votre vision ?
Réponse : Merci Paul. C’est un plaisir d’être ici. Manus construit un agent IA général.
De nombreux instituts de recherche et entreprises tentent de créer un « cerveau » — un grand modèle linguistique. Mais selon nous, du point de vue utilisateur, ce n’est pas idéal. L’IA devrait pouvoir agir concrètement et accomplir des tâches. C’est pourquoi nous avons créé Manus.
Nous avons choisi de donner à l’IA accès à l’une des plus grandes inventions de l’humanité : l’ordinateur universel. En dotant l’IA d’un ordinateur, elle peut faire tout ce que font les humains. Manus peut vraiment accomplir des missions. Par exemple, il peut vous aider à créer une présentation, planifier un voyage, voire gérer vos réseaux sociaux — même si je ne vous recommande pas de le faire vraiment.
Nos utilisateurs adorent Manus. Nous avons lancé Manus en mars, et atteignons déjà un taux de revenus annualisé (RRR) d’environ 90 millions de dollars, bientôt dépassera 100 millions.
Pour une petite startup comme la nôtre, c’est énorme. Mais surtout, cela montre que l’agent IA n’est plus seulement un mot à la mode dans la recherche, mais qu’il est véritablement adopté et mis en œuvre.
Je peux partager une petite anecdote sur la construction de Manus.
Nous avons tiré beaucoup d’inspiration des applications d’« Agent coding ». Des produits comme Cursor, par exemple, ont déjà attiré beaucoup d’attention.
En tant qu’ingénieurs, nous utilisons naturellement Cursor. Mais ce qui nous a surpris, c’est que de nombreux collègues non-ingénieurs dans l’entreprise l’utilisaient aussi. Bien sûr, ils ne développaient pas de logiciels, mais l’utilisaient pour la visualisation de données, voire pour rédiger des articles. Ils ignoraient la partie code à gauche, interagissant simplement avec l’IA pour accomplir leurs tâches.
Cela nous a fait réaliser : nous devrions généraliser cette approche pour permettre aux non-programmeurs d’en bénéficier. C’est là une application clé de l’IA.
Question : On entend de plus en plus parler d’agents IA et d’AGI. Pouvez-vous nous aider à mieux distinguer ces deux concepts ? Qu’est-ce que signifient l’agent IA et l’AGI pour vous et pour Manus ?
Réponse : Nous pensons que c’est une excellente question.
Aujourd’hui, on appelle presque tout « agent ». Par exemple, quelqu’un dirait qu’un microphone est un « agent d’enregistrement avec perception environnementale ».
Mais nous soutenons que l’agent devrait être un sous-ensemble des applications IA. Reculons un peu pour examiner les catégories courantes d’applications IA.
La plupart connaissent deux types : les chatbots comme ChatGPT, et les outils génératifs comme MidJourney ou Sora. Dans ces systèmes, il n’y a généralement que deux rôles : l’utilisateur et le modèle. Vous interagissez avec le modèle et obtenez une sortie. Ce qui différencie l’agent, c’est qu’il introduit un troisième élément clé : l’environnement.
Le concept d’« environnement » varie selon le type d’agent. Pour un agent de conception, l’environnement peut être une toile ou un bout de code ; pour Manus, notre objectif est que l’agent apparaisse dans une machine virtuelle, voire sur tout Internet. Ainsi, l’agent peut observer l’environnement, décider de la prochaine action, et modifier l’environnement par ses actions. C’est ce qui le rend puissant.
Dans Manus, par exemple, vous exprimez un besoin, et il ouvre un navigateur, publie une page web, vous réserve un billet d’avion. J’aime cet exemple car, bien que réserver un billet semble simple, cela revient à ce que l’IA change directement le monde réel — le résultat n’est pas une sortie de modèle, mais un billet dans votre main. L’IA intervient réellement dans votre monde. Voilà ce que nous appelons un agent.
En résumé, un agent est un système IA capable d’interagir avec l’environnement au nom de l’utilisateur.
Quant à l’AGI, ce terme est souvent mentionné, et beaucoup l’associent à une intelligence superpuissante. Nous pensons que l’AGI est un système capable d’utiliser les compétences générales d’un modèle IA pour accomplir diverses tâches sans être spécifiquement conçu pour chacune.
Nous estimons que « l’agent coding » est en réalité une voie vers l’AGI. Ce n’est pas une capacité verticale, mais si vous la donnez à un ordinateur, elle peut presque tout faire sur celui-ci. Pour nous, la condition pour l’AGI est de construire un environnement suffisamment complet pour permettre à cette capacité de s’exprimer.
Question : Où l’IA joue-t-elle réellement un rôle aujourd’hui ? Où jouera-t-elle un rôle à l’avenir ? Quand arrivera le moment « iPhone » ?
Réponse : En ce qui concerne les agents, si l’on se concentre uniquement sur les capacités du modèle, les modèles phares actuels sont déjà impressionnants, presque « surhumains ». Ils peuvent surpasser la majorité d’entre nous dans les compétitions mathématiques ou le raisonnement logique.
Mais je pense que les modèles restent comme des « cerveaux en bocal ». Pour exercer pleinement leur force, ils doivent interagir avec le monde réel. Malheureusement, c’est là que commencent les problèmes.
Par exemple, demandez à une IA d’accomplir des tâches administratives : elle excelle dans les tâches répétitives. Des produits comme Deep Research, qui agrègent des informations et fournissent un résultat, dont la sortie apparaît simplement là, sans interaction.
Prenons un exemple : presque tout aujourd’hui est conçu pour les humains, pas seulement le monde physique, mais aussi le monde numérique. Les outils web sont comme des petits jeux, sans API ni interface standard. Les CAPTCHA sont partout, bloquant constamment les agents.
Je pense donc que l’IA excelle dans les tâches autonomes et fermées, mais rencontre des obstacles dès qu’elle touche au monde réel.
Quand viendra le moment « iPhone » ? Je pense que ce n’est pas un problème technique, mais plutôt une limitation institutionnelle. Ce n’est pas quelque chose qu’une startup comme la nôtre peut résoudre seule.
Je crois qu’il faut une évolution progressive, exigeant que tout l’écosystème évolue ensemble. Cela nécessite aussi des entreprises comme Stripe d’agir au niveau des infrastructures. Par exemple, nous intégrons actuellement la nouvelle API de paiement « Agentic » de Stripe. Il faut que tous coopèrent.
Question : Pourrions-nous parler concrètement des scénarios typiques d’utilisation de Manus ? Comment les utilisateurs l’utilisent-ils ? Quelle puissance cela révèle-t-il ?
Réponse : Oui, bien que venant de la génération actuelle d’agents, nous voyons déjà de nombreux cas d’usage remarquables.
Par exemple, nous venons juste de déménager à Singapour et devons engager un agent immobilier pour nous aider à trouver un logement. Un vrai agent (rire).
Mais désormais, ces agents utilisent Manus : selon les besoins des clients, ils utilisent Manus pour analyser la localisation de l’entreprise, les zones où les employés veulent vivre, et générer des recommandations.
Je trouve cela intéressant car cela relève de la « demande longue traîne ». Généralement, aucun produit IA spécialisé n’est conçu pour ce genre de situation spécifique, mais comme Manus est un agent général, il peut répondre à ces besoins. Nous pensons que la longue traîne mérite une attention particulière.
À l’échelle macro, cela peut sembler marginal, mais pour l’utilisateur concerné, c’est précisément son travail quotidien. Ces scénarios sont particulièrement précieux.
C’est comme l’actuel paysage des moteurs de recherche. Si vous cherchez des contenus courants, que ce soit Google ou Bing, la qualité des résultats est similaire. Alors pourquoi choisir l’un plutôt que l’autre ? Peut-être parce qu’un moteur fournit à un moment donné un résultat plus adapté. Et si vous recherchez des contenus très personnalisés ou spécialisés, la différence devient plus évidente. C’est précisément là que réside l’avantage de l’agent général.
Comment l’améliorer ? Nous y avons longuement réfléchi, car nous pensons que tout passe par la programmation. Si vous donnez un ordinateur à l’IA, sa façon d’interagir avec l’environnement est essentiellement la programmation.
Nous pensons qu’on peut progresser sur deux fronts. Premièrement, l’échelle. Mais que se passerait-il si on pouvait multiplier par cent les capacités de l’agent ?
Récemment, Manus a lancé une nouvelle fonctionnalité appelée Wide Research. Son principe de base est de permettre à un agent d’en générer des centaines d’autres pour accomplir une tâche ensemble. Vous savez, si l’IA vous aide à faire de petites choses, souvent vous pouvez les faire vous-même. Mais si la tâche est énorme, impossible pour une seule personne — comme une vaste recherche — alors faire travailler des centaines d’agents en parallèle devient extrêmement puissant.
Deuxièmement, nous devons aussi permettre aux agents d’utiliser l’ordinateur de manière plus flexible. Par exemple, si vous limitez un agent IA à des outils prédéfinis, son espace d’action est confiné à ces outils. Mais imaginez que vous soyez un programmeur, avec accès à toutes les ressources de la communauté open source.
Par exemple, lors d’une impression 3D, modifier directement les paramètres du modèle peut être difficile, mais si vous trouvez la bonne bibliothèque sur GitHub et l’installez, vous résolvez le problème. Chez Manus, nous optimisons la généralité, et proposons un concept appelé « effet réseau des outils ».
Un exemple intéressant : de nombreux utilisateurs utilisent Manus pour la visualisation de données. Vous savez, en Asie, on rencontre parfois des problèmes, comme des erreurs de police lors de l’affichage chinois dans les graphiques. Certains utilisateurs experts pourraient écrire des règles codées en dur, par exemple quelle police utiliser pour le coréen. Mais cette approche rigidifie progressivement le système.
Nous avons choisi d’ajouter au système une capacité très simple : regarder les images. Le résultat fut surprenant — les modèles actuels étant très intelligents, ils vérifient eux-mêmes l’image générée, détectent les erreurs, puis corrigent automatiquement. Nous avons découvert qu’ajouter de la flexibilité aux outils résolvait bien plus de problèmes que des règles codées en dur.
Question : C’est une époque passionnante. Je suis vraiment enthousiaste, j’aimerais juste être assez jeune pour avoir trente ans à nouveau (rire). En parlant de recherche médicale, je sais que Manus excelle aussi dans ce domaine. Avez-vous observé des utilisateurs employant Manus pour la recherche médicale ?
Réponse : Beaucoup utilisent déjà Manus pour la recherche, pas seulement médicale. Nous trouvons cela intéressant car il existe déjà de nombreux produits dits de « recherche approfondie », qui rassemblent des informations et font une analyse, mais vous donnent finalement seulement un fichier markdown ou un document. Ce n’est pas suffisant.
Souvent, ce que les chercheurs veulent vraiment, c’est un résultat directement livrable à leur patron ou à leur équipe. C’est pourquoi nous avons renforcé la sortie des résultats de recherche sur Manus. Par exemple, en recherche médicale, il faut souvent produire un rapport formel, comme une présentation. Nous devons donc optimiser la capacité de sortie de l’IA pour répondre aux besoins des chercheurs. C’est une expérience « outillée ».
Par exemple, de nombreux utilisateurs utilisent d’abord Manus pour la recherche, puis génèrent directement un site web. Cela diffère complètement des méthodes traditionnelles de création de sites.
Créer un site en soi n’est pas difficile ; le difficile, c’est d’assurer la fiabilité et l’exactitude des données. Nous pensons donc qu’il est préférable de réaliser tout le processus dans une même session, dans un contexte partagé. Ainsi, votre recherche et vos analyses se transforment sans friction en résultat final. C’est exactement ce que fait Manus.
Question : De nombreux pays discutent d’un sujet : dans l’ère de l’IA, quel est l’avenir humain et l’impact économique ? Que pensez-vous du remplacement des emplois ? Quelles nouvelles opportunités vont émerger ?
Réponse : Nos amis et investisseurs nous posent souvent cette question. Lorsque nous avons lancé Manus, nous pensions initialement qu’un tel agent permettrait aux gens d’économiser du temps et de gagner facilement de l’argent.
Mais en réalité, cette vision ne s’est pas tout à fait réalisée. Grâce à de vastes enquêtes utilisateurs, nous avons constaté que, après utilisation, les gens travaillent en fait davantage. Car devenus plus efficaces, ils accomplissent plus de tâches dans lesquelles ils excellaient déjà. C’est le premier point.
Deuxièmement, nous pensons que Manus ouvre un tout nouvel espace. Nous parlons souvent de machines virtuelles et de cloud computing. Nous estimons que Manus joue un rôle de « plateforme personnelle de cloud computing ». Le cloud existe depuis des décennies, mais reste un privilège des ingénieurs, seuls capables d’en exploiter la puissance via la programmation. Les travailleurs intellectuels ordinaires n’y avaient pas accès.
Mais désormais, avec des agents IA comme Manus, les gens peuvent donner des instructions en langage naturel, et l’IA exécute. Cela libère une productivité entièrement nouvelle. C’est ce que nous apportons.
Enfin, concernant le « remplacement », je pense que c’est difficile. Prenons les agents immobiliers : ils utilisent quotidiennement Manus pour leurs tâches. Mais vous savez, l’IA ne pourra jamais remplacer la manière dont un agent communique avec ses clients. Nous sommes une entreprise d’IA, et même la vidéo de lancement de Manus a été écrite par Manus, mais c’est moi qui apparaît à l’écran, car il s’agit de confiance. Et la confiance, on ne peut pas la confier entièrement à l’IA.
Bienvenue dans la communauté officielle TechFlow
Groupe Telegram :https://t.me/TechFlowDaily
Compte Twitter officiel :https://x.com/TechFlowPost
Compte Twitter anglais :https://x.com/BlockFlow_News














