
Chia sẻ cuối năm của đồng sáng lập Manus Trương Đào: Từ Monica đến Manus, hai lần chuyển đổi tạo nên thành tích "hàng đầu toàn cầu"
Tuyển chọn TechFlowTuyển chọn TechFlow

Chia sẻ cuối năm của đồng sáng lập Manus Trương Đào: Từ Monica đến Manus, hai lần chuyển đổi tạo nên thành tích "hàng đầu toàn cầu"
Manus xuất phát từ một câu tiếng Latinh, có nghĩa là "tâm và tay", nhấn mạnh sự thống nhất giữa tri thức và hành động – không chỉ suy nghĩ mà còn phải tác động đến thế giới thông qua thực tiễn.
整理 & 编译:深潮TechFlow
嘉宾:张涛,Manus 联创
播客源:潜云思绪|微信视频号
原标题:《分享一下我们是如何从 Monica 经过两次转型,来到 Manus 这个点子,以及发布后的一些经历,作为 2025 年末的一个总结吧》
播出日期:2025年12月24日

如果你没有时间,这是 Gemini 制作的太长不看版总结:

要点总结
本篇播客基于 Manus 联创张涛的分享,深度回顾了公司在 AI 浪潮中从浏览器插件 Monica 进化到通用 AI 智能体(Agent)Manus 的三次关键转型与成长历程,。
- 商业里程碑:Manus 在发布不到一年的时间内,实现了严格口径下的 1 亿美元年度经常性收入(ARR),公司整体年收入运行率达到 1.25 亿美元,并位列 A16Z 全球 AI 应用排行榜前列。
- 产品演进与反思:从解决用户“复制粘贴”痛点的插件 Monica 出发,团队曾投入巨大资源开发 AI 浏览器 Rift,但因用户迁移成本过高及 AI 与用户争夺设备控制权等问题,最终果断选择放弃,转而探索通用智能体方向。
- 技术创新与理念:秉持 “心与手”(Mens et Manus) 的知行合一理念,Manus 核心设计为 AI 配备独立的 云端虚拟电脑,使其能通过代码作为中介自主决策、操纵工具并交付实际结果,而非仅停留在“大脑”层面的思考。
- 全球影响与未来展望:Manus 在多项国际技术基准测试中展现出超越主流模型的性能优势,并在九个月内实现了从数据可视化到 全栈网页及移动应用开发 的功能跃迁。
本篇自白不仅记录了一家中国初创公司在全球 AI 竞争中的崛起,也为 AI 智能体的未来形态——“更少的结构,更多的智能”提供了深刻的实践洞察。
精彩观点摘要
- 在创业过程中,寻找机会点是非常关键的。
- 产品名字 Manus 就来源于“Mens et Manus”,意思是“心与手”,强调知行合一——不仅要思考,还要通过实践去影响世界。
- Manus 已实现严格口径下的 1 亿美元 ARR(年度经常性收入,即如果产品按月或按年订阅收费,ARR就是把这些“固定、可持续的订阅收入”按一年口径统计出来的数。)。
- Cursor 所代表的 AI 编程能力不仅能够赋能专业工程师,还释放了一种新的潜力——它可以解决许多日常任务,比如数据分析、文件转换等。
- 我们意识到应该转向为普通用户服务,我们的目标是构建一个通用的 AI 智能体 (AI Agent),通过代码作为中间媒介来解决各种日常任务。
- AI 不应该和用户争夺电脑的使用权,AI 应该拥有自己的设备,独立运行。
- Manus 的工作方式:它能够独立思考每一个步骤,决定如何完成任务。用户只需提供任务目标,剩下的工作由 AI 来完成。
- Manus 的核心设计理念是为 AI 配备一台属于它自己的云端电脑。在这台云端电脑上,AI可以自主运行每一轮的智能体循环。
- 虽然 Manus 仅发布了 14 天,但 Anthropic 已经将我们列入了“世界级编程工具 (World Class Coding)”的分类,与 GitLab、GitHub 等神级公司并列。
- 如果想要真正对现实世界产生影响,仅仅依靠思考是不够的,否则就会变成“缸中之脑”,永远停留在脑内的思考和回忆中。
- 我们希望为大模型赋予一双“手”,让它能够操纵工具,完成复杂任务,从而交付实际结果。
公司产品与行业认可
- 介绍公司主打产品 Master 和 Monica,以及它们在 A16Z榜单中的表现。
- 提及 Manus 在消费量榜单中的排名及其市场表现。
张涛:
关于 AI 应用的创业方向,这可能为有志于创业的朋友们提供一些参考。我们公司的主打产品之一是 Master,它由一家人工智能公司开发,但实际上,我们不仅有 Master 一款产品。在今年 Andreessen Horowitz(A16Z)评选的 AI 应用 Top 50 榜单中,Master 排名第 31 位。此外,我们的另一款产品 Monica 也成功上榜,使得我们成为少数拥有两款产品进入 Top 50 的公司之一。

除了主榜单外,A16Z 还发布了一个基于用户消费量的榜单,统计北美地区创业公司使用 AI 工具的情况。这个榜单显示,Manus 在消费量排名中位列第 33 位。这从侧面证明了 Manus 在用户覆盖率和营收方面的全球表现,取得了显著的成绩。

技术优势与基准测试
- Manus 在 Scale AI 发布的远程劳动力指数(ROI)中的表现。
- Manus 的多个版本(1.0 和 1.5)在基准测试中超越其他主流模型(Claude 4.5、GPT-5、Gemini 3 Pro 等)。
- 通过 Elo 分数展示产品的技术优势。
张涛:
此外,我们的产品在行业内的多个基准测试(Benchmark)中也表现领先。比如,Scale AI 发布的远程劳动力指数(ROI)评估了先进的 AI 智能体(AI Agent)完成真实世界任务的能力。
换句话说,这些任务的完成可以直接带来经济收益。在这一评测中,我们的产品 Manus 的 1.5 版本以及 1.0 版本均超过了其他领先的模型,比如 Claude 4.5、GPT-5、Gemini 3 Pro 等。如果以 Elo 分数衡量,我们的产品甚至领先了 60 分以上,达到断崖式的优势。
(在 AI 领域,Elo 分数通常被用来比较不同模型在某些任务上的表现。具体来说:
- 每个模型会在某些基准任务中进行“对战”,例如回答问题、生成内容或完成具体任务。
- 根据模型在任务中的表现,比如准确性、效率或用户满意度,系统会调整模型的 Elo 分数。
- 分数越高,表示模型在这些任务上的表现越优越。)
商业成就与发展里程碑
- Manus 实现严格口径下的 1 亿美元年度经常性收入 (ARR),以及公司整体年收入达到 1.25 亿美元。
- 回顾公司成立背景及发展历程,包括 GPT-3 和 ChatGPT 的发布对公司创立的影响。
张涛:
除了这些数据支持,我们在上周正式宣布,Manus 已实现严格口径下的 1 亿美元 ARR(年度经常性收入)。这一指标不包括一次性收入,比如增值包等。如果加上其他产品的收入和增值包,公司整体年度运行率已经达到 1.25 亿美元。对于一家成立仅三年且 Manus 发布不到一年的公司来说,这无疑是一个重要的里程碑。
回顾这段发展历程,可以追溯到 2021 年 3 月 25 日。当时 OpenAI 发布了 GPT-3 模型。虽然如今 GPT 已经家喻户晓,但在 2021 年,除了 AI 领域的专业人士,大众对 GPT 还知之甚少。包括我自己,当时通过一个叫 Copy.ai 的产品才了解到 GPT-3 的强大功能。这个产品可以自动生成文案,而它背后的技术就是 OpenAI 的 GPT 模型。
2022 年 10 月 30 日,OpenAI 基于 GPT-3 推出了 ChatGPT,这款产品一经发布便震惊了全世界,我们的公司也因机缘巧合而诞生。我们的 CEO 张涛在 ChatGPT 发布前的一周,通过一些随机途径接触到了 GPT-3 模型。他觉得这个技术非常神奇,应该基于它开发一些产品。由于张涛之前的创业项目是浏览器插件(微版助手),他的初步想法是结合 GPT-3 的能力开发一个浏览器插件。但就在这个想法刚刚形成时,ChatGPT 发布了。于是,公司开始围绕 ChatGPT 的生态展开探索。
Monica:早期产品探索与创新
- Monica 的开发背景及功能亮点,例如侧边栏交互、上下文内使用 AI 等。
- Monica 的市场表现,包括用户数及收入。
- Monica 的局限性(浏览器插件市场规模有限)及公司对 AI 浏览器 Rift 的探索。
- Rift 浏览器项目开发的过程及最终取消的原因(用户迁移成本高、AI与用户争夺设备使用权)。
张涛:
作为一家小型创业公司,我们无法直接与 OpenAI 竞争。因此,我们选择从 ChatGPT的痛点入手,寻找差异化的切入点,逐步打造出自己的产品。
在创业过程中,寻找机会点是非常关键的。当时我们团队发现了一个痛点:用户在使用 ChatGPT 等 AI 产品时,常常需要在聊天机器人生成内容后手动复制粘贴到工作环境中,比如撰写邮件、编辑文档等。这种操作需要频繁切换浏览器标签页或应用程序,体验非常割裂。AI 的功能在 ChatGPT 中,但用户的工作环境却在其他地方,这种不连贯的使用体验让我们意识到存在一个优化的机会。
于是,我们开发了公司的第一个 AI 产品——Monica。Monica 是一个浏览器插件,它位于浏览器的侧边栏中,用户可以直接在侧边栏中与 AI 进行交互,比如像聊天机器人一样提问。同时,我们整合了多家领先的大模型,比如 Claude 和其他主流模型,使 Monica 成为一个多功能的 AI 工具。
Monica 的优势不仅体现在侧边栏的交互上,还可以与用户正在浏览的网页进行互动。例如,用户可以让 Monica总结网页内容、翻译网页文本等。这种“上下文内使用 AI”(in-context)的设计解决了早期 AI 工具使用过程中的割裂问题。
此外,随着市场上大模型的种类越来越多,用户可能不愿意订阅多个产品。Monica 提供了一种便捷的解决方案:用户只需订阅 Monica,就可以使用多个厂商的模型。这种整合的功能极大地提升了用户体验,也成为 Monica 在中期发展的重要价值点。

Monica 还支持许多其他功能。例如,当用户在观看 YouTube 视频时,插件可以在视频的右侧生成一个内容摘要,提供视频的主要信息和具体时间线。用户可以点击时间线,快速跳转到相关内容。这种功能让用户能够高效地浏览视频内容。
在阅读 PDF 文件时,尤其是学术论文(如《Attention is All You Need》这篇引领当前 AI 浪潮的经典论文),Monica 的 ChatPDF 功能非常实用。用户可以上传 PDF 文件,边阅读边与文章内容进行交互,比如提问、翻译或让 AI 解释特定段落。这对于需要阅读大量论文的 AI 初学者来说非常友好。
另一个我个人特别喜欢的功能是文章简化功能。很多时候,长篇文章难以阅读,而 Monica 的简化功能可以将长段落变成短段落,同时保留文章的结构和章节内容。与传统的文章摘要工具不同,Monica 的简化功能不会压缩文章成几段简短文字,而是尽量保留原文的完整性,包括段落结构和配图。用户在阅读时可以随时查看原文段落,这种设计更贴近人类的阅读习惯,能够帮助用户更快速地消化信息。
当然,以上只是 Monica 功能的一小部分。我们还围绕各种场景进行功能设计,比如看视频、发社交媒体(如 Reddit、LinkedIn、Twitter)、撰写邮件等。早在 Google 为 Gmail 添加 AI 功能之前一年多,Monica 就已经能够帮助用户在 Gmail 中自动生成邮件内容。即使在 Google 推出自己的 Gmail AI 功能之后,我仍然认为 Monica 的写作助手比 Google 自家的功能更优秀。如果你使用过 Monica,应该会有同样的感受。
Monica 的核心价值在于其浏览器插件场景,能够帮助用户在当前上下文中直接高效地利用 AI,而无需跳转到其他地方,这个产品本身取得了不错的成功。在 Chrome 的 Web Store 上,Monica 已经有约 300 万用户,获得了3万条评分,平均评分高达4.9分,成绩非常亮眼。在商业上,Monica也取得了一定的成功。虽然我们现在的主要精力放在 Manus 上,但 Monica 仍然由一个小团队负责开发和维护,并且即将迎来一次重要的更新。目前,Monica 仍为公司贡献了约1500万美元的年度经常性收入 (ARR)。
尽管如此,作为浏览器插件,Monica 的市场天花板相对较低,原因在于许多普通用户甚至不知道浏览器可以安装插件。虽然我们后来开发了移动端和桌面端版本,但在如今的时代,分发应用的成本和难度非常高,尤其是对创业公司来说,广告推广的费用几乎难以承受。因此,浏览器插件仍然是 Monica 的主要使用场景。我们目前的几百万日活用户大部分都集中在插件端。不过,我们也发现了一个瓶颈:使用浏览器插件的用户群体规模有限,尽管我们已经达到了300万用户,但这个市场的潜力基本上停留在百万用户级别,年化营收也基本上在几千万美元左右,很难进一步扩大。
于是,我们开始思考下一步的发展方向。去年初,我们团队决定,既然我们擅长开发 AI 浏览器插件,而许多用户并不知道如何安装插件,为什么不直接开发一款 AI 浏览器呢?我们希望能一步到位,为用户提供更完整的解决方案。从去年3月到去年10月,我们花了七个月时间开发了一款名为 Rift 的 AI 浏览器。然而,尽管我们投入了大量精力,但最终选择取消了这个项目,因此这款浏览器从未正式发布。今天,我有机会展示这个项目的一些遗留版本,存放在我的电脑中。
Rift 浏览器集成了许多 AI 功能,包括 Monica 的全套功能以及一些独特的特色。例如,每次新建标签页时,用户会进入一个仪表盘(Dashboard),它会根据不同标签页的内容进行自动聚类。即使用户没有良好的标签管理习惯,Rift 也能根据网页内容自动将标签分类并按主题聚合,极大提升了浏览效率。为了保护用户隐私,Rift 的后台运行着一个小型本地部署的大语言模型 (LLM),所有功能都在用户本地完成,既保护隐私,又提升数据处理速度。
此外,Rift 还支持图片和视频的高清处理功能。例如,模糊的图片可以通过 AI 技术变得清晰,视频可以进行字幕翻译,并提取语音内容转化为文字。用户在浏览网页时,如果遇到链接不想立刻点击,Rift 的链接摘要功能(Link Summary)可以快速生成一个小卡片,展示链接背后的内容,而不会干扰用户的主线浏览流程。
Rift 还提供自动化功能,将非结构化网页内容提取为结构化数据。这些功能让用户在浏览时更加高效,同时也展示了 AI 技术在浏览器场景中的广泛应用。
在去年 9 月,我们已经完成了自己的 AI 浏览器项目,但最终没有发布它。作为这款浏览器的创造者,我在使用过程中发现了一些问题。首先,大部分功能其实 Monica 已经可以完成,只有少数功能涉及到控制浏览器时,我们遇到了一个很大的难题。当 AI 开始控制浏览器时,它会和用户争夺电脑的使用权,比如抢鼠标、抢键盘,有时甚至会因为后台切换而发生冲突。这种体验虽然在演示时看起来很酷,但在日常使用中却显得非常不便。
另一个问题是浏览器作为一个有着几十年历史的产品,其用户迁移成本非常高。要说服用户放弃现有的浏览体验转而使用一个新的浏览器,不仅需要展示新功能,还得满足用户对旧功能的需求。在早期用户调研中,我们发现大多数用户关心的不是浏览器的新 AI 功能,而是他们习惯的功能是否可以被替代。例如,用户会问:“我在 Chrome 上习惯用的功能,在哪里?”或者“我用 Safari 的某个功能,能不能在你的浏览器上找到?”对于一个小型创业团队来说,要完全对标功能齐全的 Chrome 和 Safari 是极其困难的。而这些成熟产品的现有价值已经非常高,用户对新浏览器的增量价值需求往往无法抵消迁移成本。
综合考虑到这些问题——AI 与用户争夺电脑使用权的体验问题,以及浏览器切换的高成本,我们最终决定终止这个项目,尽管我们已经投入了公司一半的资源,花费了七个月时间开发它,但我们最终忍痛取消了这个项目。
有趣的是,就在我们决定放弃浏览器项目的那一天,我从武汉飞回北京,刚刚降落时打开手机,看到 Browser Company 的消息。这家公司是 ARC 浏览器的开发者,很多喜欢先进浏览器的朋友可能都听说过这个产品。他们的 CEO Josh Miller 宣布公司将转型去开发一个新的 AI 浏览器,虽然没有明确表示放弃 ARC,但他们的方向已经发生了改变。在他的分享中提到,即使 ARC 是一款非常成功的浏览器,但当他们尝试向非技术极客的用户推广时,发现用户的接受度仍然很低,甚至连他的朋友都不愿意使用。听到这些,我感到非常共鸣。浏览器作为一个成熟的产品,用户的切换成本确实太高了。这一瞬间让我意识到,我们的洞察和他们的经验是如此相似,这也让我们更加坚定了放弃项目的决定。
从编程工具到通用智能体
- 使用 Cursor 编程工具的启发。
- Cursor 的功能及对普通用户的吸引力。
- 转向开发通用 AI 智能体 (AI Agent) 的初衷:通过代码解决日常任务,服务非程序员用户。
张涛:
在取消浏览器项目后,我们团队开始思考下一步的方向。虽然我们是一个小型团队,但在开发浏览器项目的过程中,我们学到了许多关于 Chromium 和相关技术的宝贵经验。我们甚至完全基于 Chromium 的底层架构,用 Swift 构建了一个全新的 Swift UI 浏览器项目,这种技术积累为我们未来的转型提供了支持。
与此同时,我们从去年 7 月份特别火爆的编程工具 Cursor 中获得了重要的启发。Cursor 借助 Claude's S3.5 模型,迅速成为程序员的首选工具。作为公司的创始团队,我们几个人都是程序员,用 Cursor 的体验非常棒。我们公司的代码产出中,当时约 20%-30% 是由 AI 生成的,而现在已达到约 90%。但更有意思的是,我们发现 Cursor 的影响不仅局限于程序员,它还吸引了许多非程序员用户。
例如,我观察到我的妻子,她并不懂编程,但能够用 Cursor 将 MP4 视频文件转换为 MP3。她只需输入自然语言命令:“将目录中的视频文件转换为 MP3”,Cursor 就能生成一段 Shell 脚本并完成任务。同样地,我的同事们也利用 Cursor 进行数据分析,比如通过 Python 脚本处理 Excel 文件并生成结果。我们注意到,这些非程序员用户完全不关心代码窗口里的内容,他们只需点击 Cursor 提供的建议,逐步完成任务。
这让我们意识到,Cursor 所代表的 AI 编程能力不仅能够赋能专业工程师,还释放了一种新的潜力——它可以解决许多日常任务,比如数据分析、文件转换等。这些任务并不需要用户懂得编程,却可以通过 AI 的编程能力来高效完成。写代码的能力正成为解决通用任务的一种强有力的工具。
在使用 Cursor 的过程中,我们获得了一个重要的启发。虽然当时很多人都在尝试开发类似 Cursor 的编程智能体 (Coding Agent),比如后来出现的 Windsurf 和其他厂商的产品,但我们决定不再专注于为程序员开发工具。原因很简单:程序员已经有非常多优秀的工具可供使用,并不缺少我们这一款产品。我们意识到,应该转向为普通用户服务——那些可能一辈子都没写过代码的用户。我们的目标是构建一个通用的 AI 智能体 (AI Agent),通过代码作为中间媒介来解决各种日常任务。这是我们最初的理念。
Manus 的开发与发布
- Manus 的核心设计理念:为 AI 配备云端电脑,独立完成任务。
- Manus 的智能体循环工作机制。
- 产品发布过程中的故事,包括发布会的准备细节、视频拍摄及全球市场的反馈。
- 产品发布后面临的流量激增及基础设施挑战。
张涛:
在使用 Cursor 时,我们还发现了一些问题。Cursor 的工作需要用户不断手动点击“接受下一步“,如果用户不授权下一步,它可能会对电脑造成损害。我们甚至听说有朋友因为不小心点击了“下一步”,结果导致整个项目文件夹被删除,无法恢复。此外,由于 Cursor 是运行在用户的电脑上,用户必须全程监控其操作,决定是否允许它执行下一步任务。如果用户关闭电脑,Cursor 就无法继续运行。这种体验显然存在问题,尤其是对于一个长期陪伴用户、帮助解决问题的 AI 智能体来说,这种设计并不理想。
结合我们在浏览器开发中的经验,我们意识到 AI 不应该和用户争夺电脑的使用权,AI 应该拥有自己的设备,独立运行。因此,Manus 的初衷就是要解决这个问题。我们决定构建一个类似于 Cursor 的系统,但将整个推理过程放在云端运行。在云端,我们为每个任务分配一个虚拟机,让 AI 拥有自己的“电脑”来完成任务。这样,用户只需将任务交给 AI,AI 就可以独立完成工作,无需用户时刻监控或担心设备被占用。
举个例子,我最近使用 Manus 处理一个非常复杂的任务。今年因为忙于 Manus 的发布,我忘记续费阿里云,导致我保存了 20 年的博客数据丢失了。这个博客对我来说意义重大,我希望能找到办法恢复它。我将这个任务交给 Manus,它开始尝试各种方法,从互联网上寻找我的博客的历史备份。它首先搜索历史存档网站,找到一些相关内容后,决定如何爬取这些数据。通过 Manus 的 Web Research 功能,它能够逐步分析每一个步骤,最终成功找回了我的博客内容并重新构建了网站。
这种任务类型凸显了 Manus 的工作方式:它能够独立思考每一个步骤,决定如何完成任务。用户只需提供任务目标,剩下的工作由 AI 来完成。这种设计不仅解决了 AI 与用户争夺设备使用权的问题,还显著提升了任务的自动化和效率。
Manus 的核心设计理念是为 AI 配备一台属于它自己的云端电脑。在这台云端电脑上,AI 可以自主运行每一轮的智能体循环。在每次循环中,AI会决定在云端电脑上执行某个操作,操作完成后会生成一个“观察结果”,然后返回给智能体。智能体根据这个结果决定下一步的行动。这种设计非常简洁:由智能体系统决定下一步动作,然后在云端电脑上执行,再根据结果进行下一步决策。这样的系统架构让 Manus 能够实现令人惊叹的功能,例如它能够通过爬取和整合数据,最终帮助我恢复了丢失的博客网站。这一经历让我感触颇深。
Manus 的最初构想是为 AI 配备一台云端电脑,让它能够独立完成任务,而不是与用户争夺设备的使用权。我们遵循了一个重要的设计原则——“更少的结构,更多的智能 (Less Structure, More Intelligence)”。这意味着我们不预先给 AI 设置固定的工作流或规则,而是让底层模型的智能在每一轮循环中自主决定下一步的行动。这样的设计让 Manus 能够解决非常多的通用问题,而不仅仅局限于传统智能体依赖预置工作流的方式。
从去年 11 月开始,我们花了四个月时间开发 Manus,并在 2025 年 3 月 5 日晚上正式发布。由于我们面向全球用户,并主要瞄准欧美市场,因此选择在欧美地区时差适合的晚上 10 点发布。我相信许多人都看过我们发布会的视频,这个视频甚至引领了一种新的发布会潮流。后来许多友商在发布产品时也开始模仿,比如坐在沙发上,背景摆放一些植物等。

Manus 发布会的视频是我们团队自己拍摄的,过程充满了创业的艰辛和创意。3 月 1 日正式拍摄时,我使用了自己的索尼相机,并向投资人借了一款非常优秀的镜头。我的实习生也参与了拍摄。整个视频的制作费用非常低廉:我花了 9.9 美元购买了背景音乐 (BGM) 的版权,又花了 19.48 美元买了 CapCut 的会员,用来剪辑视频。视频最终成为我个人视频号播放量最高的一段内容,传播非常广。
3 月 5 日晚上,我们在北京的小办公室里正式发布了 Manus。这间办公室非常小,仅有六七个工位,但那天晚上我们非常兴奋。经过四个月的开发,我们每天测试产品时都能看到许多令人惊叹的案例,大家都迫不及待地想要和全世界分享这个有趣的小工具。发布会现场还通过远程屏幕连接了武汉办公室,大家一起庆祝这一重要时刻。
作为一个全球化产品,我们希望欧美市场的用户能够真实体验到 Manus,并提供反馈。但实际情况远远超出我们的预期。比如在 3 月 9 日时,我和 CEO 张涛一起观看了 YouTube 上一些博主制作的关于 Manus 的视频,这些博主我们完全不认识,却非常认真地评测和介绍我们的产品。有些视频甚至长达几十分钟,内容详尽且专业。我们感到十分感动。此外,像 Hugging Face 的创始人 Claire 和知名 AI 影响者 Rowan 都在宣传我们的产品,甚至 Twitter 的创始人 Jack 也转发了关于 Manus 的内容。我没有想到我居然能做出一个产品让 Jack 转发并评价为“优秀”。更令人惊讶的是,Jack 离开 Twitter 后几乎很少发推文,全年发的推文数量基本是个位数,而其中一条竟然是关于 Manus 的。这让我感到非常荣幸,作为一个做了十几年产品的人,这一刻是非常欣慰的。
然而,欣慰很快被现实的巨大挑战所取代。我们原本的预期是发布一个月后能有几万用户使用并提供反馈,然后逐步迭代优化。然而,发布后产品立刻爆火,涌入的流量远超预期。在发布后的短短一周内,用户数量就达到了几百万。由于我们对基础设施的准备不足,系统很快面临崩溃的风险。为了控制系统的稳定性,我们不得不维持邀请码机制,并不断修复问题。比如在 3 月 11 日时,PIG 发推文提到我们修复了一个问题,却导致另一个问题接踵而至。
最令人啼笑皆非的是,我们发布时甚至没有准备好收费系统。我们原本以为只有少量行业内人士会评测产品,没想到会有如此多的用户涌入。这直接导致我们在发布后的十几天里,虽然基础设施问题逐渐得到解决,但产品的运营成本却非常高。由于 Token 的价格昂贵,我们的日均运营成本一度达到 50 万美元。而我们银行账户里的资金只有 800 万美元。如果放开邀请码机制,用户的热情可能会导致我们一天就烧光所有资金,直接破产。
在 Manus 发布初期,由于收费系统尚未上线,我们无法完全开放系统,因为一旦放开,公司的运营就可能面临严重的财务压力。流量涌入的规模和资金消耗是难以想象的。直到 3 月 28 日,我们才终于赶制出了收费系统,并开始逐步开放注册。有了付费用户的支持后,每天的运营成本才逐渐下降。回顾早期的经历,确实有许多地方没有准备充分,比如连收费系统都没有提前做好,这确实是一次非常独特的创业体验。
用户交流与全球推广
- Manus 发布后,全球用户的反馈及使用场景分享(如沙特牙医的案例)。
- 创始人走访全球用户,与用户面对面交流需求。
- Manus 名字的来源及与 MIT 校徽格言的联系。
张涛:
除了发布初期的故事,还有许多有趣的细节,比如在发布后的头两周,我们为了与全球用户的时区对齐,办公室几乎是 24 小时轮班工作。发布后的两周,我开始到各个国家走访用户,因为我们发现 Manus 的用户分布非常广泛。作为一个通用智能体,我们特别想搞清楚用户到底在用它做什么。为了更好地了解用户需求,我决定与他们面对面交流。首先,我去了韩国,恰好赶上 Anthropic 在韩国举办的第一次开发者峰会。让我惊喜的是,虽然 Manus 仅发布了 14 天,但 Anthropic 已经将我们列入了“世界级编程工具 (World Class Coding)”的分类,与 GitLab、GitHub 等神级公司并列。甚至我们的灵感来源 Cursor 也在这个分类中,这让我感到非常意外和荣幸。
随后,我和我们的首席员工 Parker 一起去了硅谷,参加了英伟达的 GTC 大会。为了吸引注意,我们专门制作了一件 T 恤,上面写着:“我们在发布后 14 天就烧了 100 万美元的 Token。如果你想知道为什么,可以过来聊聊。”这件 T 恤非常吸睛,吸引了许多人前来交流。英伟达似乎也对我们的故事很感兴趣,因为我们讲述的是一个高消耗 Token 的产品故事。
在 GTC 大会上,有一个让我非常开心的瞬间。当我走到一家名为 H20 的展台时,这家公司以企业级人工智能解决方案闻名。他们正在宣传自己在盖亚 (Gaia) 基准测试中达到了世界纪录,排名第一。而令人意外的是,我们的 Manus 排在第二位!这让我感到非常震撼。我们仅仅是一个小型创业公司,产品发布才 15 天,没想到在硅谷这样的 AI 创新中心,竟然有人开始将 Manus 与顶尖公司进行比较。我当时非常激动,心想如果每一家顶级公司都愿意把我们拿来作比较,哪怕我们一直排第二,我也会感到非常欣慰。能够在这样的环境中获得认可,对我们来说是一种莫大的鼓励。
后来我去了波士顿,首先,我去了 MIT。之所以一定要去 MIT,是因为我们的产品名字 Manus 就来源于 MIT 的校徽上的格言“Mens et Manus”。这是一句拉丁语,意思是“心与手”,强调知行合一——不仅要思考,还要通过实践去影响世界。过去两年间,大多数大模型厂商专注于构建“智能的大脑”,让模型变得越来越聪明。然而,我们认为如果想要真正对现实世界产生影响,仅仅依靠思考是不够的。否则,就会变成“缸中之脑”,永远停留在脑内的思考和回忆中。我们希望为大模型赋予一双“手”,让它能够操纵工具,完成复杂任务,从而交付实际结果。
之后,我从美国飞往中东地区,先到了迪拜,然后前往沙特阿拉伯。尽管 Manus 仅发布了一个月,但我们已经在世界各地收获了许多支持者。与这些用户交流的过程中,我发现他们的使用场景非常丰富。例如,一位沙特的牙医向我介绍了他的牙科诊所,并分享了他如何通过 Manus 提高经营效率。这让我感到非常震撼,同时也让我更加确信我们最初设计通用智能体的初衷——希望与用户共同构建一个生态,而不仅仅是我们告诉用户 Manus 能做什么。事实上,大部分使用场景都是用户主动告诉我们的,这个过程充满了惊喜和意义。
产品迭代与功能扩展
- Manus 在发布后的九个月内进行多次功能迭代。
- 数据可视化、MailManus功能、全栈网站开发能力等功能创新。
- MAX 1.5 和 MAX 1.6 版本带来的重要升级,例如移动应用开发能力。
张涛:
在 Manus 发布后的九个月里,我们并没有停留在 3 月份的版本,而是进行了许多产品迭代。尤其是过去的六个月,我们推出了许多重要的功能升级。例如,从 7 月份开始,我们加入了数据可视化功能,并增强了制作 PPT 和幻灯片的能力。现在,你看到的这份幻灯片其实就是 Manus 自己生成的。我只需要告诉它根据最近六个月的产品更新制作一页 PPT,它就能自动完成。
8 月份,我们发布了一个非常重要的功能——Wide Research。这项功能使 Manus 能够处理复杂的任务,远超一般 AI 工具的能力。例如,我让它找到 YC 第 21 批创业者的所有电子邮件地址,它会触发 336 个子任务,分别研究这些公司的创始人和联合创始人,最终找出他们的联系方式。这种任务类型对于其他 AI 工具来说几乎无法完成,因为它们通常在单一会话中循环,处理到 10 或 20 个任务时就会崩溃。而 Manus 的 Webhooks 是一个重要的创新,能够解决许多复杂问题。
随后,我们推出了 MailManus 功能。通过这一功能,你可以直接在邮箱中完成任务,而不需要回到 Manus 的界面。例如,当我收到活动邀请邮件时,只需将邮件转发给我的 ManusBot,它就会自动接受任务,用自己的云端电脑完成活动注册和信息填写的所有步骤。这使得任务处理更加便捷和高效。
在 MAX 1.5 版本中,我们进一步扩展了网站开发能力。之前,Manus 只能开发静态网页,而在 1.5 版本后,它可以开发带有完整后端功能的网站,包括数据库和原生 AI 功能。例如,我让它为我创建一个高达模型收藏站,仅通过简单的一句话描述,它就完成了整个网站开发。这个网站不仅可以浏览不同分类的高达模型,还能让用户将模型加入个人收藏库,并查看各系列的收集进度。网站还具备数据库分析功能,用户可以注册并查看自己的数据,管理自己的收藏。MAX 1.5 的发布,使得 Manus 的网站构建能力达到了世界顶级水平。
11 月份,我们推出了 Browser Operator 功能,使得 Manus 不仅可以使用自己的云端浏览器,还能通过插件使用用户的本地浏览器,完成一些只有在用户电脑上才能完成的任务。两周前,我们发布了 MAX 1.6 版本,推出了更强大的功能,尤其是在移动开发领域。现在,Manus 不仅能够进行全栈网页开发,还能开发完整的移动应用程序,包括最终编译成安卓安装包并发布到应用商店的能力。这些应用程序不仅是静态的,还具备完整的后端功能,包括数据库和原生 AI 功能。这些创新极大地扩展了 Manus 的应用边界。
过去的九个月里,我们一直保持着快速的产品迭代节奏,让 Manus 得到了全球用户的喜爱,并在商业上达到了第一个里程碑——年收入达到 1 亿美元 (ARR)。回顾这一年,我感到非常欣慰。在年底这个时刻,我也想借此机会分享我们的心路历程,并展望未来。我希望在 2026 年,Manus 能够变得更加强大,为更多的用户群体服务,解决更多类型的问题。同时,我也期待 2026 年成为 AI 应用的大年,吸引更多创业者加入这个浪潮,共同创造出更多真正具有价值的 AI 应用。这是我最希望看到的未来。
Chào mừng tham gia cộng đồng chính thức TechFlow
Nhóm Telegram:https://t.me/TechFlowDaily
Tài khoản Twitter chính thức:https://x.com/TechFlowPost
Tài khoản Twitter tiếng Anh:https://x.com/BlockFlow_News














