智谱AutoGLM沉思开源替代Manus方案上线
3月31日,智谱AI在中关村论坛上正式发布了重磅新品——“AutoGLM沉思”。这款产品听起来颇有哲学意味,但其本质是一款“边思考边执行”的实用型AI Agent。先给出核心判断:这是一款深度研究类智能体,不仅能够模拟人类复杂的推理过程,还能通过浏览器插件跨平台操作,突破小红书、知乎、B站等原本信息
3月31日,智谱AI在中关村论坛上正式发布了重磅新品——“AutoGLM沉思”。这款产品听起来颇有哲学意味,但其本质是一款“边思考边执行”的实用型AI Agent。先给出核心判断:这是一款深度研究类智能体,不仅能够模拟人类复杂的推理过程,还能通过浏览器插件跨平台操作,突破小红书、知乎、B站等原本信息封闭的生态壁垒。
核心能力主要体现为三个维度:
- 深度思考:面对复杂任务时,自动拆解并规划研究路径。例如,若想生成一份AI编程工具报告,它会自动分解需求,分步骤前往Cursor、Windsurf等官方网站抓取信息。
- 感知世界:既能获取公开数据,也能挖掘半封闭内容。比如规划一次西南旅游行程时,它会综合B站上的视频评测和小红书攻略,为你定制方案。
- 工具使用:借助浏览器插件执行操作,如登录网站、提交表单等。遇到权限问题时,它会主动调整策略或提醒你协助。
AutoGLM沉思在Manus、OpenManus、TARS之后发布,但其独特之处体现在以下方面:
- 免费开放:Deep Research功能完全免费且无使用次数限制。相比之下,OpenAI的Deep Research每月收费200美元且有次数限制;国产竞品Manus的月费方案也达到39至199美元。
- 开源生态:智谱计划于2025年4月14日开源核心技术链,包括GLM-Z1-Air推理模型、GLM-4-Air0414基座模型以及AutoGLM框架。
- 用户体验:实际使用体验流畅,执行时有界面特效,多任务状态下有提醒,最终结果支持复制为Markdown格式。许多AI产品虽然用Markdown渲染结果,却不支持直接复制成Markdown,需要手动调整,而AutoGLM沉思在这方面做得相当到位。
发布会也对技术层面进行了说明:
- GLM-4-Air-0414基座模型:拥有320亿参数,专为智能体任务优化,支持快速工具调用和联网搜索。
- GLM-Z1-Air推理模型:推理速度比行业标杆DeepSeek-R1快8倍,成本降至其1/30。
- GLM-Z1-Rumination沉思模型:通过强化学习实现自我反思与长程推理,支持动态工具调用和实时验证。
- AutoGLM执行引擎:具备自动化操作能力,可模拟人类浏览网页、填写表单等动作。
使用方法也很简单:
- 打开官网 https://autoglm-research.zhipuai.cn/ 。官网展示了用例和推广视频,感兴趣的可以查看。
- 点击导航栏右侧“立即体验”,下载“智谱清言桌面客户端”。
- 默认安装即可。
- 安装完成后打开客户端,选择“AutoGLM沉思”。

- 顶部会有提示,需要安装Chrome插件,点击后按指引安装即可。
- 返回AutoGLM沉思,在输入框内录入你要执行的任务。

接下来用一个官网案例完整走一遍流程。
提示词
安排一个2个月的西南自助游,路过重庆、贵州、云南和广西,家庭3人行,给出大概的预算方案和小吃清单。
执行过程
先是整体分析,然后规划后续任务。

如果目标网站已经登录,AutoGLM沉思会直接进行搜索。操作浏览器时,浏览器内容会被蓝色边缘包裹,提醒你正在自动执行。左下角会显示任务的执行状态。

如果需要访问的网站需要登录,AutoGLM沉思会在左下角给出提示,并停留在当前界面等待。

所有任务执行完成后,左下角也会更新状态。可以看到Chrome中的标签页均是由AutoGLM沉思打开的。

输出
最终输出结果内容较长,截取一段作为示意。

整个案例体验下来,整体感觉不错,耗时不算太长,操作也比较丝滑。由于直接从各类不同网站获取数据,内容的丰富性确实值得肯定。每条内容后面还附带了参考链接,方便查看详情或核对信息。当然,由于仍处于Preview阶段,泛化性还不够理想,比如在掘金社区搜索时偶有问题。
尽管目前还较为初级,但开源、免费且用户体验良好的AutoGLM沉思,整体框架已经搭建完成。期待后续功能越来越丰富。
你是一名 AI 行业编辑,请围绕下面这条热点输出一份资讯解读:
热点:智谱AutoGLM沉思开源替代Manus方案上线要求:
1. 先用一句话解释这条热点在讲什么
2. 再总结它为什么重要
3. 说明会影响哪些 AI 产品或内容方向
4. 最后给出 3 个适合资讯站使用的标题
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
相关热点OmniParser是微软AI驱动的SaaS工具,基于YOLOv8和BLIP-2,将UI截图与漫画页面解析为结构化数据,支持UI元素检测、漫画面板分析、对话框及人脸识别,适用于自动化测试、漫画翻译等场景。
通义灵码是贯穿开发全流程的智能编码助手,具备代码智能生成、研发智能问答、多编程语言及编辑器支持、代码安全隐私保障四大核心能力,适用于学生、新手及企业开发者等多类人群,提升编码效率。
基于人工智能的自动化道路巡逻和资产数据收集方案,通过车载相机自动采集路面及周边资产数据,识别裂缝、坑槽等病害并建立数字化台账,同时自动删除隐私图像,实现从被动响应向主动预防的转变,降低巡检成本。
阿里旗下通义智文是一款智能阅读工具,支持网页、论文、图书和自由阅读四种场景,帮助用户快速提取核心观点,节省阅读时间,适合学生、研究人员及职场人士高效处理大量文本。
- 日榜
- 周榜
- 月榜
热点快看
