扫描二维码
手机浏览

大招被ban,腾讯Marvis这群“电子牛马”还能帮我干哪些活儿 | AI评测

AI新榜
新榜独家
AIGC


作者|懒人

编辑|张洁


第一次打开Marvis的时候,我先盯着它的界面看了半天。


不是有多爱研究UI,主要是它太像我在上班了。


6个Agent坐在一间办公室里,有人坐在电脑前认真干活,有人在“带薪拉屎”,还安排了健身房和咖啡角。这不就是“牛马”的日常吗?



我当时心里只有一个想法:


好家伙,AI都有工位了。


这可能也是Marvis最容易被记住的地方。什么“操作系统级AI助手”、“多Agent协作”,听起来都很大。真正戳中打工人的,反而是它把Agent画成了一群电子牛马。


Marvis是腾讯应用宝团队在5月20日正式开放下载的,定位是一个“操作系统级AI助手”。里面预置了6个Agent,Marvis负责统筹任务,Computer Agent负责操作电脑,File Agent负责处理文件,Browser Agent负责浏览器任务,App Agent负责应用,Search Agent负责网页搜索。


刚上线,迅速引起了关注。因为它有一个其他Agent不具备的大招——总结微信群聊。


不是那种选中很多条聊天记录转发给它,它来总结。你直接对Marvis说,“帮我总结‘群聊名称’最近的消息”,它就可以自动读取并总结给你。



截图来自公众号“AI产品分析”


对于加了很多群、没时间爬楼但又不想错过消息的牛马来说,这功能简直是救星。


当然,想必腾讯推出Marvis也不是为了让它总结一下群聊这么简单。这里提到“大招”,是因为AI总结群聊这个需求呼声一直很高,但市面上几乎没有Agent能真正做到。


尤其是这个功能发生在微信。微信作为国民级应用,一举一动都备受关注。AI会与微信生态内的原子化组件碰撞产生什么样的化学反应,也是很多从业者关心的话题。


此前5月13日,腾讯曾官宣打通元宝和微信,让元宝可以一键总结微信群聊,但实际操作上,用户仍然需要先进入群聊,勾选要总结的消息,再整体转发给元宝。


所以,如果Marvis能在这个基础上更进一步,让用户只需要直接说“帮我总结某个群最近的消息”,它就能自动完成读取和整理,这确实会让人期待。


只不过,这个能力很快不可体验。“AI新榜”测评时发现,Marvis已经无法实现读取微信群聊消息的功能了。



那么,抛开这个能力,Marvis的6个电子牛马还能帮我干哪些活呢?考虑到Marvis毕竟立志于成为一个更全面的助手,我还是进行了更进一步的测评。


我测的第二个任务,是一个很日常的问题:电脑摸起来好热啊,怎么办?


如果问普通AI,它大概率会给你一套排查建议:打开活动监视器,看看CPU占用,检查后台进程,清理散热口,必要时重启。


Marvis的处理方式不一样。


它会先查看系统状态、能耗情况和内存占用,分析可能导致发热的原因,然后再拍了拍Computer Agent,让它去完成优化。



这个case不复杂,但很直观体现了Marvis在操作本地电脑上的能力。


聊天AI更像“告诉你怎么做”的顾问;Marvis则是接进电脑本身,读到系统状态、文件、网页和应用,再把这些东西串成一个任务。这意味着,电脑发热、系统设置、文件管理等本地场景里,它确实比纯聊天AI更接近“能干活”。


其实微信群总结失败之后,我本来对Marvis处理微信相关的任务没抱太高期待。


不过测试下来发现,聊天记录这种数据不好碰,但Marvis还能做一些其他事。


比如,微信公众号的文章整理。


我给它发了一篇公众号的文章链接,让它帮我把文中的案例和提示词整理成一个表格。



很多AI产品没法正常解析微信链接,但Marvis的结果还不错。它打开链接,并准确理解文章内容,提取了案例概览、操作步骤、关键提示词和注意事项。



这个场景还挺实用。很多干货文章看完,当下觉得“学到了”,过几天就忘了。现在用Marvis顺手把里面的案例、方法、提示词拆出来,变成之后能参考的素材。


不仅如此,Marvis还能实现微信公众号的排版。


我不是让它调一篇稿子的格式,而是让它做一个本地排版工具:左边放纯文字,右边按照指定格式生成排版结果,并支持直接复制到公众号编辑框里。



这个需求很典型。对内容团队来说,公众号排版不难但非常繁琐。标题、正文、缩进、段距、图片位置,每一项都有固定要求,每天重复做。


Marvis没有一次成功。第一版工具在预览里看起来是对的,但粘贴到公众号后台后,格式丢了;后来继续加带图粘贴、调图片位置,又遇到复制后空行丢失的问题。


大概四五轮对话之后,最终,Marvis给出了一个能在本地端口打开的排版工具。把纯文字放进去,右侧会生成符合要求的排版结果,复制到微信公众号编辑框后,样式和空行都能保留下来。



当我告诉它我想把这个工具分享给同事,Marvis继续生成了HTML文件,并补了一份README,说明工具怎么使用。



这一套流程跑下来,我最大的感受是,Marvis未必一次就给出最终答案,但在目标明确、问题可以被拆开的任务里,它能持续迭代,没有出现“修好这个、弄坏那个”的明显失控。


在信息整理上,Marvis也能跑通更完整的链路。


我让它搜索过去一周AI融资新闻,把超过1亿人民币的轮次整理成表格,并保存到桌面文件ai-funding.md里。


这个任务看起来只是“搜资料+做表格”,但实际拆开看,里面包含联网搜索、时间范围判断、金额筛选、结构化整理和本地文件写入几个步骤。


Marvis最后确实完成了文件写入,但不算很完美。



第一版结果里,它混入了一些不在“过去一周”范围内的融资新闻。也就是说,它能把搜索、筛选、整理、写文件这条流程跑完,但在时间范围这种硬条件上,并没有逐条核对。


这类问题在AI信息整理里很常见。模型会优先抓取相关性强、信息完整的内容,但“相关”不等于“符合条件”。尤其是融资、榜单、财报、公司动态这类内容,时间、金额、来源都属于硬信息,不能只看AI整理得漂不漂亮。


我们还测了自动化任务。


比如,让Marvis每天早上9点搜索AI行业的新品发布、公司动态和行业新闻,把链接、摘要标题和简介整理好,再通过飞书推送。


值得注意的是,我在派发这个任务时,并没有指令清晰地说帮我做什么。我只是把日常的工作文字像流水账一样发给它,Marvis根据这些信息提炼出固定任务,并设置成自动执行。



这个能力有一定想象空间。它不只是执行一句明确指令,而是能从一段相对自然的描述里,识别出哪些事情需要周期性完成,再转成自动任务。


但它的限制也很现实,自动任务依赖本地客户端运行。


如果电脑关机、休眠,或者Marvis客户端退出,任务就无法继续执行。对话过程中如果中途关闭客户端,正在执行的任务也会被终止。


这意味着,Marvis更像一个住在本地电脑里的执行助手,而不是一个永远在线的云端秘书。它适合处理那些本来就发生在电脑上的任务,比如整理文件、操作网页、调用应用;但如果用户期待的是到点自动运行、稳定推送、不受设备状态影响的后台服务,目前还不能完全交给它。


除了系统操作和自动任务,Marvis也做了自己的技能广场,汇聚了Clawhub、Claude、GitHub等多个来源的Skill。


我也从库里挑选了一些Skill安装,来看下整体的使用难度和好用程度。



比如,排名最高的frontend-design Skill,点击该Skill,在弹出的页面点击“添加”,就可以去对话框里使用这个Skill了。整个安装过程很快速,而且简单。



我们让Marvis做一个AI工具发现页面。


安装之前,Marvis也能生成页面,但整体更接近一个基础模板。安装之后,同样的任务,结果更完整。页面增加了快捷键、分类数量、深色/浅色模式切换、鼠标悬停效果等细节,整体的字体、色彩、间距和交互也更接近一个正式产品页面。



安装前vs安装后


不过Marvis更有意思的一点是,它没有把Skill广场做成一个纯工具列表,加入了类似内容社区的推荐形态。可以从具体场景出发,看别人如何使用Skill。



从这几轮任务来看,Marvis最值得讨论的地方,不是某个单点功能有多惊艳,而是它确实把AI从聊天框往真实电脑环境里推了一步。


它能读取系统状态,能调用不同Agent处理文件、网页和应用,也能把重复任务设置成自动执行。相比只给建议的聊天机器人,Marvis更像把AI接到了电脑里,让它真的去看、去干活。


但这并不意味着它已经可以被完全托管。它会受限于软件生态、本地环境和任务复杂度,也会在事实判断上出错。


不过,它的能力也还在扩展。比如手机远程连接电脑,目前只有安卓端可以用,iOS还尚未上线。按照目前公开介绍和用户反馈,它可以让用户在手机端查看并接管电脑任务,比如人在外面临时找文件、查看电脑端任务进度,甚至远程操作锁屏后的电脑。



这个场景也值得继续观察。因为那时候Marvis的价值可能就不只是“电脑里的AI助手”,而更像一个能随时接管你电脑的随身入口。


回到最开始的问题:这群Agent,真的能当电子牛马吗?


答案可能没那么绝对。


Marvis不是万能牛马,还不能完全放养。但它确实开始有点像打工人的第二双手了。


           

 欢迎分享、点赞、推荐 
 一起研究AI 

分享文章链接