
Manus 联创张涛年终分享:从 Monica 到 Manus,两次转型跑出“全球头部”成绩
Tuyển chọn TechFlowTuyển chọn TechFlow

Manus 联创张涛年终分享:从 Monica 到 Manus,两次转型跑出“全球头部”成绩
Manus 来源于 一句拉丁语,意思是“心与手”,强调知行合一——不仅要思考,还要通过实践去影响世界。
整理 & 编译:深潮TechFlow
嘉宾:张涛,Manus 联创
播客源:潜云思绪|微信视频号
原标题:《分享一下我们是如何从 Monica 经过两次转型,来到 Manus 这个点子,以及发布后的一些经历,作为 2025 年末的一个总结吧》
播出日期:2025年12月24日

如果你没有时间,这是 Gemini 制作的太长不看版总结:

要点总结
本篇播客基于 Manus 联创张涛的分享,深度回顾了公司在 AI 浪潮中从浏览器插件 Monica 进化到通用 AI 智能体(Agent)Manus 的三次关键转型与成长历程,。
- 商业里程碑:Manus 在发布不到一年的时间内,实现了严格口径下的 1 亿美元年度经常性收入(ARR),公司整体年收入运行率达到 1.25 亿美元,并位列 A16Z 全球 AI 应用排行榜前列。
- 产品演进与反思:从解决用户“复制粘贴”痛点的插件 Monica 出发,团队曾投入巨大资源开发 AI 浏览器 Rift,但因用户迁移成本过高及 AI 与用户争夺设备控制权等问题,最终果断选择放弃,转而探索通用智能体方向。
- 技术创新与理念:秉持 “心与手”(Mens et Manus) 的知行合一理念,Manus 核心设计为 AI 配备独立的 云端虚拟电脑,使其能通过代码作为中介自主决策、操纵工具并交付实际结果,而非仅停留在“大脑”层面的思考。
- 全球影响与未来展望:Manus 在多项国际技术基准测试中展现出超越主流模型的性能优势,并在九个月内实现了从数据可视化到 全栈网页及移动应用开发 的功能跃迁。
本篇自白不仅记录了一家中国初创公司在全球 AI 竞争中的崛起,也为 AI 智能体的未来形态——“更少的结构,更多的智能”提供了深刻的实践洞察。
精彩观点摘要
- 在创业过程中,寻找机会点是非常关键的。
- 产品名字 Manus 就来源于“Mens et Manus”,意思是“心与手”,强调知行合一——不仅要思考,还要通过实践去影响世界。
- Manus 已实现严格口径下的 1 亿美元 ARR(年度经常性收入,即如果产品按月或按年订阅收费,ARR就是把这些“固定、可持续的订阅收入”按一年口径统计出来的数。)。
- Cursor 所代表的 AI 编程能力不仅能够赋能专业工程师,还释放了一种新的潜力——它可以解决许多日常任务,比如数据分析、文件转换等。
- 我们意识到应该转向为普通用户服务,我们的目标是构建一个通用的 AI 智能体 (AI Agent),通过代码作为中间媒介来解决各种日常任务。
- AI 不应该和用户争夺电脑的使用权,AI 应该拥有自己的设备,独立运行。
- Manus 的工作方式:它能够独立思考每一个步骤,决定如何完成任务。用户只需提供任务目标,剩下的工作由 AI 来完成。
- Manus 的核心设计理念是为 AI 配备一台属于它自己的云端电脑。在这台云端电脑上,AI可以自主运行每一轮的智能体循环。
- 虽然 Manus 仅发布了 14 天,但 Anthropic 已经将我们列入了“世界级编程工具 (World Class Coding)”的分类,与 GitLab、GitHub 等神级公司并列。
- 如果想要真正对现实世界产生影响,仅仅依靠思考是不够的,否则就会变成“缸中之脑”,永远停留在脑内的思考和回忆中。
- 我们希望为大模型赋予一双“手”,让它能够操纵工具,完成复杂任务,从而交付实际结果。
公司产品与行业认可
- 介绍公司主打产品 Master 和 Monica,以及它们在 A16Z榜单中的表现。
- 提及 Manus 在消费量榜单中的排名及其市场表现。
张涛:
关于 AI 应用的创业方向,这可能为有志于创业的朋友们提供一些参考。我们公司的主打产品之一是 Master,它由一家人工智能公司开发,但实际上,我们不仅有 Master 一款产品。在今年 Andreessen Horowitz(A16Z)评选的 AI 应用 Top 50 榜单中,Master 排名第 31 位。此外,我们的另一款产品 Monica 也成功上榜,使得我们成为少数拥有两款产品进入 Top 50 的公司之一。

除了主榜单外,A16Z 还发布了一个基于用户消费量的榜单,统计北美地区创业公司使用 AI 工具的情况。这个榜单显示,Manus 在消费量排名中位列第 33 位。这从侧面证明了 Manus 在用户覆盖率和营收方面的全球表现,取得了显著的成绩。

技术优势与基准测试
- Manus 在 Scale AI 发布的远程劳动力指数(ROI)中的表现。
- Manus 的多个版本(1.0 和 1.5)在基准测试中超越其他主流模型(Claude 4.5、GPT-5、Gemini 3 Pro 等)。
- 通过 Elo 分数展示产品的技术优势。
张涛:
此外,我们的产品在行业内的多个基准测试(Benchmark)中也表现领先。比如,Scale AI 发布的远程劳动力指数(ROI)评估了先进的 AI 智能体(AI Agent)完成真实世界任务的能力。
换句话说,这些任务的完成可以直接带来经济收益。在这一评测中,我们的产品 Manus 的 1.5 版本以及 1.0 版本均超过了其他领先的模型,比如 Claude 4.5、GPT-5、Gemini 3 Pro 等。如果以 Elo 分数衡量,我们的产品甚至领先了 60 分以上,达到断崖式的优势。
(在 AI 领域,Elo 分数通常被用来比较不同模型在某些任务上的表现。具体来说:
- 每个模型会在某些基准任务中进行“对战”,例如回答问题、生成内容或完成具体任务。
- 根据模型在任务中的表现,比如准确性、效率或用户满意度,系统会调整模型的 Elo 分数。
- 分数越高,表示模型在这些任务上的表现越优越。)
商业成就与发展里程碑
- Manus 实现严格口径下的 1 亿美元年度经常性收入 (ARR),以及公司整体年收入达到 1.25 亿美元。
- 回顾公司成立背景及发展历程,包括 GPT-3 和 ChatGPT 的发布对公司创立的影响。
张涛:
除了这些数据支持,我们在上周正式宣布,Manus 已实现严格口径下的 1 亿美元 ARR(年度经常性收入)。这一指标不包括一次性收入,比如增值包等。如果加上其他产品的收入和增值包,公司整体年度运行率已经达到 1.25 亿美元。对于一家成立仅三年且 Manus 发布不到一年的公司来说,这无疑是一个重要的里程碑。
回顾这段发展历程,可以追溯到 2021 年 3 月 25 日。当时 OpenAI 发布了 GPT-3 模型。虽然如今 GPT 已经家喻户晓,但在 2021 年,除了 AI 领域的专业人士,大众对 GPT 还知之甚少。包括我自己,当时通过一个叫 Copy.ai 的产品才了解到 GPT-3 的强大功能。这个产品可以自动生成文案,而它背后的技术就是 OpenAI 的 GPT 模型。
2022 年 10 月 30 日,OpenAI 基于 GPT-3 推出了 ChatGPT,这款产品一经发布便震惊了全世界,我们的公司也因机缘巧合而诞生。我们的 CEO 张涛在 ChatGPT 发布前的一周,通过一些随机途径接触到了 GPT-3 模型。他觉得这个技术非常神奇,应该基于它开发一些产品。由于张涛之前的创业项目是浏览器插件(微版助手),他的初步想法是结合 GPT-3 的能力开发一个浏览器插件。但就在这个想法刚刚形成时,ChatGPT 发布了。于是,公司开始围绕 ChatGPT 的生态展开探索。
Monica:早期产品探索与创新
- Monica 的开发背景及功能亮点,例如侧边栏交互、上下文内使用 AI 等。
- Monica 的市场表现,包括用户数及收入。
- Monica 的局限性(浏览器插件市场规模有限)及公司对 AI 浏览器 Rift 的探索。
- Rift 浏览器项目开发的过程及最终取消的原因(用户迁移成本高、AI与用户争夺设备使用权)。
张涛:
作为一家小型创业公司,我们无法直接与 OpenAI 竞争。因此,我们选择从 ChatGPT的痛点入手,寻找差异化的切入点,逐步打造出自己的产品。
在创业过程中,寻找机会点是非常关键的。当时我们团队发现了一个痛点:用户在使用 ChatGPT 等 AI 产品时,常常需要在聊天机器人生成内容后手动复制粘贴到工作环境中,比如撰写邮件、编辑文档等。这种操作需要频繁切换浏览器标签页或应用程序,体验非常割裂。AI 的功能在 ChatGPT 中,但用户的工作环境却在其他地方,这种不连贯的使用体验让我们意识到存在一个优化的机会。
于是,我们开发了公司的第一个 AI 产品——Monica。Monica 是一个浏览器插件,它位于浏览器的侧边栏中,用户可以直接在侧边栏中与 AI 进行交互,比如像聊天机器人一样提问。同时,我们整合了多家领先的大模型,比如 Claude 和其他主流模型,使 Monica 成为一个多功能的 AI 工具。
Monica 的优势不仅体现在侧边栏的交互上,还可以与用户正在浏览的网页进行互动。例如,用户可以让 Monica总结网页内容、翻译网页文本等。这种“上下文内使用 AI”(in-context)的设计解决了早期 AI 工具使用过程中的割裂问题。
此外,随着市场上大模型的种类越来越多,用户可能不愿意订阅多个产品。Monica 提供了一种便捷的解决方案:用户只需订阅 Monica,就可以使用多个厂商的模型。这种整合的功能极大地提升了用户体验,也成为 Monica 在中期发展的重要价值点。

Monica 还支持许多其他功能。例如,当用户在观看 YouTube 视频时,插件可以在视频的右侧生成一个内容摘要,提供视频的主要信息和具体时间线。用户可以点击时间线,快速跳转到相关内容。这种功能让用户能够高效地浏览视频内容。
在阅读 PDF 文件时,尤其是学术论文(如《Attention is All You Need》这篇引领当前 AI 浪潮的经典论文),Monica 的 ChatPDF 功能非常实用。用户可以上传 PDF 文件,边阅读边与文章内容进行交互,比如提问、翻译或让 AI 解释特定段落。这对于需要阅读大量论文的 AI 初学者来说非常友好。
另一个我个人特别喜欢的功能是文章简化功能。很多时候,长篇文章难以阅读,而 Monica 的简化功能可以将长段落变成短段落,同时保留文章的结构和章节内容。与传统的文章摘要工具不同,Monica 的简化功能不会压缩文章成几段简短文字,而是尽量保留原文的完整性,包括段落结构和配图。用户在阅读时可以随时查看原文段落,这种设计更贴近人类的阅读习惯,能够帮助用户更快速地消化信息。
当然,以上只是 Monica 功能的一小部分。我们还围绕各种场景进行功能设计,比如看视频、发社交媒体(如 Reddit、LinkedIn、Twitter)、撰写邮件等。早在 Google 为 Gmail 添加 AI 功能之前一年多,Monica 就已经能够帮助用户在 Gmail 中自动生成邮件内容。即使在 Google 推出自己的 Gmail AI 功能之后,我仍然认为 Monica 的写作助手比 Google 自家的功能更优秀。如果你使用过 Monica,应该会有同样的感受。
Monica 的核心价值在于其浏览器插件场景,能够帮助用户在当前上下文中直接高效地利用 AI,而无需跳转到其他地方,这个产品本身取得了不错的成功。在 Chrome 的 Web Store 上,Monica 已经有约 300 万用户,获得了3万条评分,平均评分高达4.9分,成绩非常亮眼。在商业上,Monica也取得了一定的成功。虽然我们现在的主要精力放在 Manus 上,但 Monica 仍然由一个小团队负责开发和维护,并且即将迎来一次重要的更新。目前,Monica 仍为公司贡献了约1500万美元的年度经常性收入 (ARR)。
尽管如此,作为浏览器插件,Monica 的市场天花板相对较低,原因在于许多普通用户甚至不知道浏览器可以安装插件。虽然我们后来开发了移动端和桌面端版本,但在如今的时代,分发应用的成本和难度非常高,尤其是对创业公司来说,广告推广的费用几乎难以承受。因此,浏览器插件仍然是 Monica 的主要使用场景。我们目前的几百万日活用户大部分都集中在插件端。不过,我们也发现了一个瓶颈:使用浏览器插件的用户群体规模有限,尽管我们已经达到了300万用户,但这个市场的潜力基本上停留在百万用户级别,年化营收也基本上在几千万美元左右,很难进一步扩大。
于是,我们开始思考下一步的发展方向。去年初,我们团队决定,既然我们擅长开发 AI 浏览器插件,而许多用户并不知道如何安装插件,为什么不直接开发一款 AI 浏览器呢?我们希望能一步到位,为用户提供更完整的解决方案。从去年3月到去年10月,我们花了七个月时间开发了一款名为 Rift 的 AI 浏览器。然而,尽管我们投入了大量精力,但最终选择取消了这个项目,因此这款浏览器从未正式发布。今天,我有机会展示这个项目的一些遗留版本,存放在我的电脑中。
Rift 浏览器集成了许多 AI 功能,包括 Monica 的全套功能以及一些独特的特色。例如,每次新建标签页时,用户会进入一个仪表盘(Dashboard),它会根据不同标签页的内容进行自动聚类。即使用户没有良好的标签管理习惯,Rift 也能根据网页内容自动将标签分类并按主题聚合,极大提升了浏览效率。为了保护用户隐私,Rift 的后台运行着一个小型本地部署的大语言模型 (LLM),所有功能都在用户本地完成,既保护隐私,又提升数据处理速度。
此外,Rift 还支持图片和视频的高清处理功能。例如,模糊的图片可以通过 AI 技术变得清晰,视频可以进行字幕翻译,并提取语音内容转化为文字。用户在浏览网页时,如果遇到链接不想立刻点击,Rift 的链接摘要功能(Link Summary)可以快速生成一个小卡片,展示链接背后的内容,而不会干扰用户的主线浏览流程。
Rift 还提供自动化功能,将非结构化网页内容提取为结构化数据。这些功能让用户在浏览时更加高效,同时也展示了 AI 技术在浏览器场景中的广泛应用。
在去年 9 月,我们已经完成了自己的 AI 浏览器项目,但最终没有发布它。作为这款浏览器的创造者,我在使用过程中发现了一些问题。首先,大部分功能其实 Monica 已经可以完成,只有少数功能涉及到控制浏览器时,我们遇到了一个很大的难题。当 AI 开始控制浏览器时,它会和用户争夺电脑的使用权,比如抢鼠标、抢键盘,有时甚至会因为后台切换而发生冲突。这种体验虽然在演示时看起来很酷,但在日常使用中却显得非常不便。
另一个问题是浏览器作为一个有着几十年历史的产品,其用户迁移成本非常高。要说服用户放弃现有的浏览体验转而使用一个新的浏览器,不仅需要展示新功能,还得满足用户对旧功能的需求。在早期用户调研中,我们发现大多数用户关心的不是浏览器的新 AI 功能,而是他们习惯的功能是否可以被替代。例如,用户会问:“我在 Chrome 上习惯用的功能,在哪里?”或者“我用 Safari 的某个功能,能不能在你的浏览器上找到?”对于一个小型创业团队来说,要完全对标功能齐全的 Chrome 和 Safari 是极其困难的。而这些成熟产品的现有价值已经非常高,用户对新浏览器的增量价值需求往往无法抵消迁移成本。
综合考虑到这些问题——AI 与用户争夺电脑使用权的体验问题,以及浏览器切换的高成本,我们最终决定终止这个项目,尽管我们已经投入了公司一半的资源,花费了七个月时间开发它,但我们最终忍痛取消了这个项目。
有趣的是,就在我们决定放弃浏览器项目的那一天,我从武汉飞回北京,刚刚降落时打开手机,看到 Browser Company 的消息。这家公司是 ARC 浏览器的开发者,很多喜欢先进浏览器的朋友可能都听说过这个产品。他们的 CEO Josh Miller 宣布公司将转型去开发一个新的 AI 浏览器,虽然没有明确表示放弃 ARC,但他们的方向已经发生了改变。在他的分享中提到,即使 ARC 是一款非常成功的浏览器,但当他们尝试向非技术极客的用户推广时,发现用户的接受度仍然很低,甚至连他的朋友都不愿意使用。听到这些,我感到非常共鸣。浏览器作为一个成熟的产品,用户的切换成本确实太高了。这一瞬间让我意识到,我们的洞察和他们的经验是如此相似,这也让我们更加坚定了放弃项目的决定。
从编程工具到通用智能体
- 使用 Cursor 编程工具的启发。
- Cursor 的功能及对普通用户的吸引力。
- 转向开发通用 AI 智能体 (AI Agent) 的初衷:通过代码解决日常任务,服务非程序员用户。
张涛:
在取消浏览器项目后,我们团队开始思考下一步的方向。虽然我们是一个小型团队,但在开发浏览器项目的过程中,我们学到了许多关于 Chromium 和相关技术的宝贵经验。我们甚至完全基于 Chromium 的底层架构,用 Swift 构建了一个全新的 Swift UI 浏览器项目,这种技术积累为我们未来的转型提供了支持。
与此同时,我们从去年 7 月份特别火爆的编程工具 Cursor 中获得了重要的启发。Cursor 借助 Claude's S3.5 模型,迅速成为程序员的首选工具。作为公司的创始团队,我们几个人都是程序员,用 Cursor 的体验非常棒。我们公司的代码产出中,当时约 20%-30% 是由 AI 生成的,而现在已达到约 90%。但更有意思的是,我们发现 Cursor 的影响不仅局限于程序员,它还吸引了许多非程序员用户。
例如,我观察到我的妻子,她并不懂编程,但能够用 Cursor 将 MP4 视频文件转换为 MP3。她只需输入自然语言命令:“将目录中的视频文件转换为 MP3”,Cursor 就能生成一段 Shell 脚本并完成任务。同样地,我的同事们也利用 Cursor 进行数据分析,比如通过 Python 脚本处理 Excel 文件并生成结果。我们注意到,这些非程序员用户完全不关心代码窗口里的内容,他们只需点击 Cursor 提供的建议,逐步完成任务。
这让我们意识到,Cursor 所代表的 AI 编程能力不仅能够赋能专业工程师,还释放了一种新的潜力——它可以解决许多日常任务,比如数据分析、文件转换等。这些任务并不需要用户懂得编程,却可以通过 AI 的编程能力来高效完成。写代码的能力正成为解决通用任务的一种强有力的工具。
在使用 Cursor 的过程中,我们获得了一个重要的启发。虽然当时很多人都在尝试开发类似 Cursor 的编程智能体 (Coding Agent),比如后来出现的 Windsurf 和其他厂商的产品,但我们决定不再专注于为程序员开发工具。原因很简单:程序员已经有非常多优秀的工具可供使用,并不缺少我们这一款产品。我们意识到,应该转向为普通用户服务——那些可能一辈子都没写过代码的用户。我们的目标是构建一个通用的 AI 智能体 (AI Agent),通过代码作为中间媒介来解决各种日常任务。这是我们最初的理念。
Manus 的开发与发布
- Manus 的核心设计理念:为 AI 配备云端电脑,独立完成任务。
- Manus 的智能体循环工作机制。
- 产品发布过程中的故事,包括发布会的准备细节、视频拍摄及全球市场的反馈。
- 产品发布后面临的流量激增及基础设施挑战。
张涛:
在使用 Cursor 时,我们还发现了一些问题。Cursor 的工作需要用户不断手动点击“接受下一步“,如果用户不授权下一步,它可能会对电脑造成损害。我们甚至听说有朋友因为不小心点击了“下一步”,结果导致整个项目文件夹被删除,无法恢复。此外,由于 Cursor 是运行在用户的电脑上,用户必须全程监控其操作,决定是否允许它执行下一步任务。如果用户关闭电脑,Cursor 就无法继续运行。这种体验显然存在问题,尤其是对于一个长期陪伴用户、帮助解决问题的 AI 智能体来说,这种设计并不理想。
结合我们在浏览器开发中的经验,我们意识到 AI 不应该和用户争夺电脑的使用权,AI 应该拥有自己的设备,独立运行。因此,Manus 的初衷就是要解决这个问题。我们决定构建一个类似于 Cursor 的系统,但将整个推理过程放在云端运行。在云端,我们为每个任务分配一个虚拟机,让 AI 拥有自己的“电脑”来完成任务。这样,用户只需将任务交给 AI,AI 就可以独立完成工作,无需用户时刻监控或担心设备被占用。
举个例子,我最近使用 Manus 处理一个非常复杂的任务。今年因为忙于 Manus 的发布,我忘记续费阿里云,导致我保存了 20 年的博客数据丢失了。这个博客对我来说意义重大,我希望能找到办法恢复它。我将这个任务交给 Manus,它开始尝试各种方法,从互联网上寻找我的博客的历史备份。它首先搜索历史存档网站,找到一些相关内容后,决定如何爬取这些数据。通过 Manus 的 Web Research 功能,它能够逐步分析每一个步骤,最终成功找回了我的博客内容并重新构建了网站。
这种任务类型凸显了 Manus 的工作方式:它能够独立思考每一个步骤,决定如何完成任务。用户只需提供任务目标,剩下的工作由 AI 来完成。这种设计不仅解决了 AI 与用户争夺设备使用权的问题,还显著提升了任务的自动化和效率。
Manus 的核心设计理念是为 AI 配备一台属于它自己的云端电脑。在这台云端电脑上,AI 可以自主运行每一轮的智能体循环。在每次循环中,AI会决定在云端电脑上执行某个操作,操作完成后会生成一个“观察结果”,然后返回给智能体。智能体根据这个结果决定下一步的行动。这种设计非常简洁:由智能体系统决定下一步动作,然后在云端电脑上执行,再根据结果进行下一步决策。这样的系统架构让 Manus 能够实现令人惊叹的功能,例如它能够通过爬取和整合数据,最终帮助我恢复了丢失的博客网站。这一经历让我感触颇深。
Manus 的最初构想是为 AI 配备一台云端电脑,让它能够独立完成任务,而不是与用户争夺设备的使用权。我们遵循了一个重要的设计原则——“更少的结构,更多的智能 (Less Structure, More Intelligence)”。这意味着我们不预先给 AI 设置固定的工作流或规则,而是让底层模型的智能在每一轮循环中自主决定下一步的行动。这样的设计让 Manus 能够解决非常多的通用问题,而不仅仅局限于传统智能体依赖预置工作流的方式。
从去年 11 月开始,我们花了四个月时间开发 Manus,并在 2025 年 3 月 5 日晚上正式发布。由于我们面向全球用户,并主要瞄准欧美市场,因此选择在欧美地区时差适合的晚上 10 点发布。我相信许多人都看过我们发布会的视频,这个视频甚至引领了一种新的发布会潮流。后来许多友商在发布产品时也开始模仿,比如坐在沙发上,背景摆放一些植物等。

Manus 发布会的视频是我们团队自己拍摄的,过程充满了创业的艰辛和创意。3 月 1 日正式拍摄时,我使用了自己的索尼相机,并向投资人借了一款非常优秀的镜头。我的实习生也参与了拍摄。整个视频的制作费用非常低廉:我花了 9.9 美元购买了背景音乐 (BGM) 的版权,又花了 19.48 美元买了 CapCut 的会员,用来剪辑视频。视频最终成为我个人视频号播放量最高的一段内容,传播非常广。
3 月 5 日晚上,我们在北京的小办公室里正式发布了 Manus。这间办公室非常小,仅有六七个工位,但那天晚上我们非常兴奋。经过四个月的开发,我们每天测试产品时都能看到许多令人惊叹的案例,大家都迫不及待地想要和全世界分享这个有趣的小工具。发布会现场还通过远程屏幕连接了武汉办公室,大家一起庆祝这一重要时刻。
作为一个全球化产品,我们希望欧美市场的用户能够真实体验到 Manus,并提供反馈。但实际情况远远超出我们的预期。比如在 3 月 9 日时,我和 CEO 张涛一起观看了 YouTube 上一些博主制作的关于 Manus 的视频,这些博主我们完全不认识,却非常认真地评测和介绍我们的产品。有些视频甚至长达几十分钟,内容详尽且专业。我们感到十分感动。此外,像 Hugging Face 的创始人 Claire 和知名 AI 影响者 Rowan 都在宣传我们的产品,甚至 Twitter 的创始人 Jack 也转发了关于 Manus 的内容。我没有想到我居然能做出一个产品让 Jack 转发并评价为“优秀”。更令人惊讶的是,Jack 离开 Twitter 后几乎很少发推文,全年发的推文数量基本是个位数,而其中一条竟然是关于 Manus 的。这让我感到非常荣幸,作为一个做了十几年产品的人,这一刻是非常欣慰的。
然而,欣慰很快被现实的巨大挑战所取代。我们原本的预期是发布一个月后能有几万用户使用并提供反馈,然后逐步迭代优化。然而,发布后产品立刻爆火,涌入的流量远超预期。在发布后的短短一周内,用户数量就达到了几百万。由于我们对基础设施的准备不足,系统很快面临崩溃的风险。为了控制系统的稳定性,我们不得不维持邀请码机制,并不断修复问题。比如在 3 月 11 日时,PIG 发推文提到我们修复了一个问题,却导致另一个问题接踵而至。
最令人啼笑皆非的是,我们发布时甚至没有准备好收费系统。我们原本以为只有少量行业内人士会评测产品,没想到会有如此多的用户涌入。这直接导致我们在发布后的十几天里,虽然基础设施问题逐渐得到解决,但产品的运营成本却非常高。由于 Token 的价格昂贵,我们的日均运营成本一度达到 50 万美元。而我们银行账户里的资金只有 800 万美元。如果放开邀请码机制,用户的热情可能会导致我们一天就烧光所有资金,直接破产。
在 Manus 发布初期,由于收费系统尚未上线,我们无法完全开放系统,因为一旦放开,公司的运营就可能面临严重的财务压力。流量涌入的规模和资金消耗是难以想象的。直到 3 月 28 日,我们才终于赶制出了收费系统,并开始逐步开放注册。有了付费用户的支持后,每天的运营成本才逐渐下降。回顾早期的经历,确实有许多地方没有准备充分,比如连收费系统都没有提前做好,这确实是一次非常独特的创业体验。
用户交流与全球推广
- Manus 发布后,全球用户的反馈及使用场景分享(如沙特牙医的案例)。
- 创始人走访全球用户,与用户面对面交流需求。
- Manus 名字的来源及与 MIT 校徽格言的联系。
张涛:
除了发布初期的故事,还有许多有趣的细节,比如在发布后的头两周,我们为了与全球用户的时区对齐,办公室几乎是 24 小时轮班工作。发布后的两周,我开始到各个国家走访用户,因为我们发现 Manus 的用户分布非常广泛。作为一个通用智能体,我们特别想搞清楚用户到底在用它做什么。为了更好地了解用户需求,我决定与他们面对面交流。首先,我去了韩国,恰好赶上 Anthropic 在韩国举办的第一次开发者峰会。让我惊喜的是,虽然 Manus 仅发布了 14 天,但 Anthropic 已经将我们列入了“世界级编程工具 (World Class Coding)”的分类,与 GitLab、GitHub 等神级公司并列。甚至我们的灵感来源 Cursor 也在这个分类中,这让我感到非常意外和荣幸。
随后,我和我们的首席员工 Parker 一起去了硅谷,参加了英伟达的 GTC 大会。为了吸引注意,我们专门制作了一件 T 恤,上面写着:“我们在发布后 14 天就烧了 100 万美元的 Token。如果你想知道为什么,可以过来聊聊。”这件 T 恤非常吸睛,吸引了许多人前来交流。英伟达似乎也对我们的故事很感兴趣,因为我们讲述的是一个高消耗 Token 的产品故事。
在 GTC 大会上,有一个让我非常开心的瞬间。当我走到一家名为 H20 的展台时,这家公司以企业级人工智能解决方案闻名。他们正在宣传自己在盖亚 (Gaia) 基准测试中达到了世界纪录,排名第一。而令人意外的是,我们的 Manus 排在第二位!这让我感到非常震撼。我们仅仅是一个小型创业公司,产品发布才 15 天,没想到在硅谷这样的 AI 创新中心,竟然有人开始将 Manus 与顶尖公司进行比较。我当时非常激动,心想如果每一家顶级公司都愿意把我们拿来作比较,哪怕我们一直排第二,我也会感到非常欣慰。能够在这样的环境中获得认可,对我们来说是一种莫大的鼓励。
后来我去了波士顿,首先,我去了 MIT。之所以一定要去 MIT,是因为我们的产品名字 Manus 就来源于 MIT 的校徽上的格言“Mens et Manus”。这是一句拉丁语,意思是“心与手”,强调知行合一——不仅要思考,还要通过实践去影响世界。过去两年间,大多数大模型厂商专注于构建“智能的大脑”,让模型变得越来越聪明。然而,我们认为如果想要真正对现实世界产生影响,仅仅依靠思考是不够的。否则,就会变成“缸中之脑”,永远停留在脑内的思考和回忆中。我们希望为大模型赋予一双“手”,让它能够操纵工具,完成复杂任务,从而交付实际结果。
之后,我从美国飞往中东地区,先到了迪拜,然后前往沙特阿拉伯。尽管 Manus 仅发布了一个月,但我们已经在世界各地收获了许多支持者。与这些用户交流的过程中,我发现他们的使用场景非常丰富。例如,一位沙特的牙医向我介绍了他的牙科诊所,并分享了他如何通过 Manus 提高经营效率。这让我感到非常震撼,同时也让我更加确信我们最初设计通用智能体的初衷——希望与用户共同构建一个生态,而不仅仅是我们告诉用户 Manus 能做什么。事实上,大部分使用场景都是用户主动告诉我们的,这个过程充满了惊喜和意义。
产品迭代与功能扩展
- Manus 在发布后的九个月内进行多次功能迭代。
- 数据可视化、MailManus功能、全栈网站开发能力等功能创新。
- MAX 1.5 和 MAX 1.6 版本带来的重要升级,例如移动应用开发能力。
张涛:
在 Manus 发布后的九个月里,我们并没有停留在 3 月份的版本,而是进行了许多产品迭代。尤其是过去的六个月,我们推出了许多重要的功能升级。例如,从 7 月份开始,我们加入了数据可视化功能,并增强了制作 PPT 和幻灯片的能力。现在,你看到的这份幻灯片其实就是 Manus 自己生成的。我只需要告诉它根据最近六个月的产品更新制作一页 PPT,它就能自动完成。
8 月份,我们发布了一个非常重要的功能——Wide Research。这项功能使 Manus 能够处理复杂的任务,远超一般 AI 工具的能力。例如,我让它找到 YC 第 21 批创业者的所有电子邮件地址,它会触发 336 个子任务,分别研究这些公司的创始人和联合创始人,最终找出他们的联系方式。这种任务类型对于其他 AI 工具来说几乎无法完成,因为它们通常在单一会话中循环,处理到 10 或 20 个任务时就会崩溃。而 Manus 的 Webhooks 是一个重要的创新,能够解决许多复杂问题。
随后,我们推出了 MailManus 功能。通过这一功能,你可以直接在邮箱中完成任务,而不需要回到 Manus 的界面。例如,当我收到活动邀请邮件时,只需将邮件转发给我的 ManusBot,它就会自动接受任务,用自己的云端电脑完成活动注册和信息填写的所有步骤。这使得任务处理更加便捷和高效。
在 MAX 1.5 版本中,我们进一步扩展了网站开发能力。之前,Manus 只能开发静态网页,而在 1.5 版本后,它可以开发带有完整后端功能的网站,包括数据库和原生 AI 功能。例如,我让它为我创建一个高达模型收藏站,仅通过简单的一句话描述,它就完成了整个网站开发。这个网站不仅可以浏览不同分类的高达模型,还能让用户将模型加入个人收藏库,并查看各系列的收集进度。网站还具备数据库分析功能,用户可以注册并查看自己的数据,管理自己的收藏。MAX 1.5 的发布,使得 Manus 的网站构建能力达到了世界顶级水平。
11 月份,我们推出了 Browser Operator 功能,使得 Manus 不仅可以使用自己的云端浏览器,还能通过插件使用用户的本地浏览器,完成一些只有在用户电脑上才能完成的任务。两周前,我们发布了 MAX 1.6 版本,推出了更强大的功能,尤其是在移动开发领域。现在,Manus 不仅能够进行全栈网页开发,还能开发完整的移动应用程序,包括最终编译成安卓安装包并发布到应用商店的能力。这些应用程序不仅是静态的,还具备完整的后端功能,包括数据库和原生 AI 功能。这些创新极大地扩展了 Manus 的应用边界。
过去的九个月里,我们一直保持着快速的产品迭代节奏,让 Manus 得到了全球用户的喜爱,并在商业上达到了第一个里程碑——年收入达到 1 亿美元 (ARR)。回顾这一年,我感到非常欣慰。在年底这个时刻,我也想借此机会分享我们的心路历程,并展望未来。我希望在 2026 年,Manus 能够变得更加强大,为更多的用户群体服务,解决更多类型的问题。同时,我也期待 2026 年成为 AI 应用的大年,吸引更多创业者加入这个浪潮,共同创造出更多真正具有价值的 AI 应用。这是我最希望看到的未来。
Chào mừng tham gia cộng đồng chính thức TechFlow
Nhóm Telegram:https://t.me/TechFlowDaily
Tài khoản Twitter chính thức:https://x.com/TechFlowPost
Tài khoản Twitter tiếng Anh:https://x.com/BlockFlow_News














