面包屑图标 当前位置: 首页
AI资讯
热点详情

OpenManus源码小读项目结构与核心代码全流程解析

AI热点日报
AI热点日报时间:2026-07-04
热点解读

快速掌握OpenManus框架的核心要点,其实并没有想象中那么复杂。这个轻量级Agent框架,在短短几个小时内就被复刻出来,实在让人惊叹。与其在众多概念里绕来绕去,不如直接动手撸一遍源码的调试流程,看看Memory、Tool Agent这些组件到底是如何协同工作的。下面就从环境搭建开始,一步步拆解。

快速掌握OpenManus框架的核心要点,其实并没有想象中那么复杂。这个轻量级Agent框架,在短短几个小时内就被复刻出来,实在让人惊叹。与其在众多概念里绕来绕去,不如直接动手撸一遍源码的调试流程,看看Memory、Tool Agent这些组件到底是如何协同工作的。下面就从环境搭建开始,一步步拆解。

背景

OpenManus是一个迷你的Agent框架,由几位优秀开发者据说在三小时内复刻Manus而成。项目地址:https://github.com/mannaandpoem/OpenManus。在Agent概念炒得热火朝天的时候,读完smloagents那套之后,再看OpenManus这种小巧的实现,格外清爽。这里只啃主线代码的调试过程,支线部分先放一边(每个人都有自己的关注点,不必纠结所有细节)。刚好在B站上也刷到一位东北up主详细讲解了大约一小时,发现逻辑并不复杂,于是尝试自己走一遍这个Agent框架,作为工作之余的调剂。费曼学习法,干中学。

安装环境

  1. 按照README里的步骤操作就行,在VSCode或PyCharm里都能配,建议新建一个venv虚拟环境。
  2. 给DeepSeek充了10块钱的会员,拿到API key填进去就完了。

调试

提问时尽量让大模型调用一个Python Tool Agent,靠本地代码执行就能完成的任务(也试过Web Search相关的prompt,但浏览器打开时总报些乱七八糟的错误,懒得折腾了,反正不影响主线流程)。

断点

问一个问题:斐波那契数列的第5位是多少

Memory是什么

Memory这个组件在其他框架里也有,有些实现得非常复杂。这里只看OpenManus的实现,直观感受一下Memory到底是什么东西。

其实就是一个类似工厂方法的封装。里面Tool和其他的user、system、assistant角色不太一样——Tool有不定长度的入参,而其他角色的入参只有一个字符串。Memory层定义了一个结构,后面用来保存多步执行的结果,本质上就是一个list,没什么特别的。

循环执行

每一步到底执行了什么

这里抽象出了一些概念:先思考,再行动。那么思考了什么?返回值又意味着什么?

Think是什么

Think这一步其实就是把输入全都怼进Memory里,然后调用LLM。提示词里给了几个可用的工具,比较特殊的是Terminate——它告诉LLM,在认为可以结束的时候,可以调用这个Tool。

接着进入关键一步:调用LLM的返回。这里把assistant_msg也写入了message上下文。

Act是什么

这一步是根据之前LLM的提示调用具体的Tool。以PythonExecute为例,会开一个线程,在线程里执行LLM提示的code。这里有些巧思,比如安全性——执行环境只包含了builtins这些函数。执行结果会被塞回到result中。

这时候再回头看Memory和results到底是什么,会发现还有一点小心思:当Agent卡住时怎么办?

如何停止

结果出来后,流程怎么停下来?OpenManus依然依赖大模型来判断。这一次,LLM给出的prompt结果如果是terminate,就会跳转到Terminate这个Tool的执行。当工具是Terminate时,state的状态变为FINISHED,整个循环也就跳出来了。

到这里,整个简单流程就看完了。不过Agent是个挺深的学问:退出时居然没打印结果,懒得修了。

这次调试中用到的类,UML图大致如下(图略)。

结尾

这小巧框架的核心流程大概就这些。实际花费时间不到两小时,包括折腾环境。真正复杂的Agent框架需要面对很多实际问题:

  1. Memory太长怎么办?是不是要放到其他存储里?如何与LLM交流?如何找出最重要的上下文?用向量数据库还是RAG?
  2. Prompt的实现同样麻烦,现在只有五六个Tool,可以塞在提示词里,但Tool一多该怎么办?要不要先分类,再让LLM帮助查找细类下的Tool?
  3. 安全性如何保障?
  4. MCP这种刚冒出来的概念是做什么用的?
热点追踪提示词
你是一名 AI 行业编辑,请围绕下面这条热点输出一份资讯解读:
热点:OpenManus源码小读项目结构与核心代码全流程解析要求:
1. 先用一句话解释这条热点在讲什么
2. 再总结它为什么重要
3. 说明会影响哪些 AI 产品或内容方向
4. 最后给出 3 个适合资讯站使用的标题
来源:https://www.53ai.com/news/OpenSourceLLM/2025032593061.html
ai 人工智能

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关热点
AI热点2026-07-04 19:00
Daetama数据科学完整准备工作系统指南与精选学习资源汇总

Daetama是面向数据科学面试和SQL能力提升的练习平台,已收录超100个覆盖基础到进阶的SQL题目,求职板块与课程模块在开发中,团队保持每周更新节奏,提供系统性刷题与模拟面试场景。

AI热点2026-07-04 19:00
AI驱动配音平台 Speakmulti

SpeakMulti是一款AI驱动的配音平台,可将YouTube视频翻译成多种语言,保留原始说话者的音色和语调,降低本地化成本。用户提交视频并选择目标语言后,AI自动完成配音,并由专家团队审核,确保准确自然。

AI热点2026-07-04 18:59
Umi-OCR图片转文字识别软件

需求人群 如果你经常需要从图片中提取文字——例如整理截图内容、翻译图片里的外语文本、识别带有水印的图片信息——那么 Umi-OCR 无疑是一款相当实用的工具。它完全在本地运行,无需联网,对隐私保护极为友好。 产品特色 这款工具的核心亮点都集中在实用性上。截屏识别操作非常顺手,按下快捷键即可框选区域,

AI热点2026-07-04 18:59
用AI生成你最爱的画家或艺术运动风格绘画

艺术创作与人工智能的融合,正在开启一个全新的创作时代。moonlightai 正是这样一款AI绘画工具,能够帮助用户通过人工智能快速生成不同风格的绘画作品——无论你想复刻文艺复兴时期的古典优雅,还是为画作注入梵高般炽热的笔触,甚至从艾沃佐夫斯基的海浪星空中汲取灵感,它都能轻松实现。 需求人群 简单来

延伸阅读