科技媒体 TechCrunch报道:上周,一个名为Manus的“代理式”AI平台以预览形式发布,引发了巨大的关注和炒作。Hugging Face的产品负责人称Manus为“我尝试过的最令人印象深刻的AI工具”,AI政策研究员迪恩·鲍尔(Dean Ball)则将其描述为“使用AI的最复杂的计算机”。Manus的官方Discord服务器在短短几天内就吸引了超过138,000名成员,其邀请码甚至在中国的二手交易平台闲鱼上被以数千美元的价格转售。
然而,这种炒作是否合理,目前还很难说。

平台的“底子”:并非从零开始
根据社交媒体上的消息,Manus并非完全从零开始开发。该平台结合了现有的和微调后的AI模型,包括Anthropic的Claude和阿里巴巴的Qwen,用于执行撰写研究报告、分析财务文件等任务。不过,在其网站上,Manus背后的中国公司“蝴蝶效应”声称该平台能够实现许多令人惊叹的功能,比如购买房地产、开发游戏等。

在一段于X平台上疯传的视频中,Manus的研究主管季逸超(Peak Ji)暗示该平台优于OpenAI的深度研究(deep research)和Operator等代理式工具。他声称,Manus在一个名为GAIA的流行通用AI助手基准测试中表现优于深度研究,该测试主要考察AI通过浏览网页、使用软件等方式完成工作的能力。季一超在视频中表示:“Manus不仅仅是一个聊天机器人或工作流程,它是一个完全自主的代理,弥合了概念和执行之间的差距……我们将其视为人机协作的下一个范式。”
用户反馈:并非万能的“灵药”
然而,一些早期用户对Manus的评价并不像其宣传的那样完美。AI初创公司Pleias的联合创始人亚历山大·多利亚(Alexander Doria)在X平台上的一篇文章中提到,他在测试Manus时遇到了错误消息和无限循环。其他用户也指出,Manus在事实性问题上犯错,不能始终如一地引用其工作,而且经常遗漏容易在网上找到的信息。
个人体验:并不如预期
作者本人也对Manus进行了一些测试,结果并不理想。作者要求该平台从配送范围内评价最高的快餐店订购一份炸鸡三明治,大约十分钟后,Manus崩溃了。第二次尝试时,它找到了符合我标准的菜单项,但无法完成订购过程,甚至无法提供结账链接。

随后,作者要求Manus预订从纽约到日本的航班,并给出了明确的指示,比如“寻找商务舱航班,优先考虑价格和灵活的日期”,但Manus最好的回应只是提供了一些航空公司网站和Kayak等机票搜索引擎的票价链接,其中一些链接已经失效。

作者接着要求Manus在步行距离内的餐厅预订一张单人桌,几分钟后,它又失败了。最后,作者要求该平台构建一款受《火影忍者》启发的格斗游戏,半小时后,Manus出现错误,作者只能选择放弃。
官方回应:仍在改进中
Manus的一位发言人通过私信向TechCrunch发送了声明:“作为一个小团队,我们的重点是不断改进Manus,并开发真正帮助用户解决问题的AI代理……当前封闭测试的主要目标是压力测试系统的各个部分并找出问题。我们非常感谢大家分享的宝贵见解。”
炒作背后:原因与真相
那么,Manus为何会爆红呢?有几个因素促成了这一点。首先,邀请码的稀缺性造成了排他性,引发了人们的强烈兴趣。其次,中国媒体迅速将Manus吹捧为AI的突破性进展,自媒体甚至称其为“国货之光”。此外,社交媒体上的AI影响者也传播了关于Manus能力的虚假信息。一段广为流传的视频显示,一个表面上是Manus的桌面程序在多个智能手机应用程序上执行操作,但季一超证实,该视频实际上并不是Manus的演示。

还有一些X平台上的有影响力的AI账号试图将Manus与中国AI公司DeepSeek进行比较,但这些比较并不一定基于事实。与DeepSeek不同,“蝴蝶效应”并没有开发任何内部模型。虽然DeepSeek公开了许多其技术,但Manus目前还没有。
技术创新还是炒作?
公平地说,Manus目前仍处于非常早期的访问阶段,“蝴蝶效应”公司也声称他们正在努力扩展计算能力并修复报告的问题。但从目前的平台状态来看,Manus更像是一个炒作超越技术创新的例子,而非真正的“DeepSeek时刻”。