首页
AI
AI Agent如何提升软件研发效能?五大优势解析

AI Agent如何提升软件研发效能?五大优势解析

热心网友
转载
2025-10-22
来源:https://36kr.com/p/3518466372672385

2025年正成为Agentic AI应用发展的关键元年,AI4SE(人工智能赋能软件工程)在提升行业效率方面已形成普遍共识,但在企业实际落地过程中依然面临诸多挑战。那么,在AI Agent的实践部署中,哪些是真正的"陷阱",哪些又是有效的"实践路径"?AI技术究竟如何重塑"需求-开发-运维"全流程?

近日,InfoQ《极客有约》与AICon直播栏目联合邀请趣丸科技运维总监刘亚丹担任主持人,与中兴通讯资深需求教练和AI教练王玉霞、蚂蚁集团高级前端技术专家郭华翔、趣丸科技基础架构组负责人黄金一起,在QCon全球软件开发大会2025上海站即将召开之际,抢先洞见AI4SE的下一步发展动向。

部分精彩观点如下:

前端知识库具备三大特征:结构复杂、对多模态支持要求高,以及需要重新组织以适配AI的理解方式。自学习需要让Agent在人机协同中持续学习。人在修正Agent决策的过程中,模型从成功经验中学习到非书面化知识,这些经验需要通过微调或再训练方式反馈给模型。

在落地过程中,效率和质量的提升确实是最易打动人心的。但在衡量这些指标时,我们也要重视"人"的因素,人的成长与幸福感提升同样是AI应用的重要价值所在。

如果因为技术变化快而犹豫不前,就可能会错失良机。正确的做法是先上手使用,再在实践中不断优化,让AI真正服务于自身研发需求。

无论未来如何变化,人的创造力与价值追求始终是最核心的部分。

以下内容基于直播速记整理,经InfoQ删减。

刘亚丹:当前的AI Agent在研发体系中,究竟是一个"聪明的助手",还是一个可以自主决策的"同事"?它的能力边界在哪里?传统研发链路(需求-设计-开发-运维)正在如何被AI Agent改造?

郭华翔:以前端领域为例,今年我们在思考产品定位时,提出的概念是"AI协同研发工具链",希望在全链路研发上实现工具的智能化升级。之所以强调"协同研发"而非"智能研发",是因为目前AI的能力在简单研发任务中表现良好,但在复杂研发场景中,它更多起到的是辅助决策的作用,因此"协同"这个词更为准确。从技术实现上看,Agent本质上是一个循环(Loop),而现在常提到的"Human in the Loop"正说明人在循环中的介入仍然非常重要。

我们在界定AI的能力边界时认为:凡是工作中重复的、机械的、让人不愿意做的事情,都可以交给AI来完成。例如日常的单元测试用例生成、埋点、D to C的UI还原等。这些工作重复且成本不高,却是AI擅长的领域。相应地,人类可以将更多精力投入到项目设计、复杂问题处理等更具创造性和决策性的环节。

至于前端领域对AI接受度较高的问题,我的真实感受是,业界在AI兴起后对前端的"唱衰"反应反而最为强烈。每当新模型推出时,大家都会调侃"前端要被取代了"。这种现象的原因在于,AI在前端代码生成方面的效果确实比较好。一方面,前端开源代码资源丰富,模型在训练时因此具备一定倾向性;另一方面,前端代码的交付成果直观可见——生成一个HTML页面或功能页面,立刻就可以展示。这种"可视化的成果"让人更有感知,从而产生"前端受冲击更大"的印象。但我认为,这并非前端对AI接受度更高,而是AI在前端领域的应用更具可见性,给人一种影响更直接的感觉。从实际情况看,要实现真正的AI协同研发,前端领域仍面临许多挑战。

刘亚丹:黄金老师,您运维的Agent都能自学习了,那它现在能替On-Call工程师做决策了吗?

黄金:运维本身就是系统稳定性的保障,如果引入过多不可控因素,会让人难以接受。目前,大模型在运维领域的主要作用是辅助人类——让一个人完成十个人的工作,或显著提升效率。但人仍然是系统中不可替代的核心,当前大多数AI应用仍以"增强人"的能力为目标。

AI目前最擅长的,是一些事务性或流程性的工作,例如单据申请、知识查询、执行标准化操作流程等。但在"客户满意度"或"授权审批"等关键环节,我们仍需要人工参与。因为运维的许多工作依赖流程与多人协作来保证系统稳定,即便AI执行正确,也需要人工复核,以防疏漏或误操作导致故障。此外,运维还涉及跨部门协作,例如与产品或测试团队的配合,这些目前AI远不能替代。即便未来可能实现,至少现阶段仍需人工主导。再者,运维中存在许多非标准化、需经验判断的场景。让AI"猜"是不可接受的,这类问题必须由人决策。

我们可以将Agent的操作分为"读"和"写"两类——"读"一般问题不大,即便AI查询出错也不会影响系统稳定;但"写"涉及变更操作时就必须极度谨慎。由于大模型基于概率生成,存在"幻觉"和错误风险,若盲目放权,会导致严重后果。因此,AI应作为辅助工具,由人来发起、审批或监督流程。

郭华翔:这让我想到一个玩笑:有一天你在运维时突然发现AI把你的应用下线了。这其实正是当前在运维领域使用AI时必须格外谨慎的原因。

刘亚丹:玉霞老师,您做需求Agent也一定会涉及到对需求的理解和决策,您如何看待Agent自主性的问题?在需求这个看似更"人性化"的领域,边界又在哪里?

王玉霞:我们在需求管理中提出了"需求Agent"的概念,最初是以"需求Copilot"的辅助模式开始的。如果需求分析不清晰、价值理解不到位或洞察不充分,后续的工作往往都是徒劳的。因此,我们希望通过更精准的需求分析,识别出用户真正的痛点与价值。据此进行分析并输出结论后,再由人判断其是否正确,再决定是否进入下一步流程。过去为了赶进度,需求阶段的许多细节往往被忽略,如今可以借助AI把这些环节做得更精细。现在,我们的需求人员可以将更多精力集中在价值判断、用户场景挖掘等更高层面的工作上。

刘亚丹:在AI Agent落地过程中,最让你们"头疼"的挑战是什么?是技术瓶颈、数据质量、团队接受度,还是流程改造?玉霞老师,您从0到1构建知识工程,第一步是不是先得"说服"大家?您是怎么做到的?

王玉霞:我们研发团队最初对Agent的概念接受度并不高,他们会质疑:Agent是否真正理解我们的业务?它生成的内容质量是否可靠?

然而,刚开始推动时,团队普遍存在抵触情绪,因为过去沉淀的知识大多结构化程度低、格式不统一,提炼难度大。对此,我们的教练团队首先承担了知识库建设的基础工作,从必要性入手,完成了前期的要素梳理与框架搭建。完成初步构建后,我们选择了一个痛点集中、交付压力大的团队作为试点,他们既有强烈需求,也愿意配合我们进行最小化验证。我们为他们构建了知识库并进行实践验证,效果差异显著。

刘亚丹:前端智能研发需要什么样的知识库?是组件库文档、最佳实践,还是用户的交互数据?

郭华翔:前端与后端等其他领域不同,其技术栈灵活多样。知识大致分为几层:底层是HTML、CSS、JavaScript等基础语言;其上是React、Vue、小程序等框架;再往上,是团队基于最佳实践和经验沉淀的私有框架或组件库。基础模型通常能掌握前两层通用知识,但对于团队自建框架、封装组件或领域经验,模型往往无法理解,需要额外训练或工程化手段来补足。

为此,我们主要采取三方面措施。第一,利用知识图谱将分散的知识体系化串联。第二,重构知识库,使其从"面向人类可读"转为"面向AI可理解",通过结构化拆分、问答对构建等方式,让Agent能更好地理解。例如,采用Query ID、规则集或上下文召回机制,使模型能有效检索和应用知识。第三,在RAG检索中,不同的文本切分方式会影响召回效果,因此需要针对不同类型内容制定最优的切分策略。

此外,前端知识还涉及UI这一特殊维度。组件库或界面描述不仅包含文本,还需多模态理解。Agent需要能够基于文本或图像查询准确召回组件。这类方案要求模型具备对UI的语义识别和匹配能力。

前端知识库具有三大特点:结构复杂、对多模态支持需求高,以及必须重新组织以适配AI的理解方式。

刘亚丹:运维Agent的自学习进化,需要"喂"给它什么样的数据?这些数据的获取和清洗难度大吗?对准确性要求极高的情况下,Agent在"自学"过程中如果出了错,如何回溯和归因?如何建立对它的信任?

黄金:通用大模型无法访问企业内部数据,就像毕业生进入公司,需要先阅读内部文档、代码、规章制度,才能真正理解组织运作。同理,Agent的自学习过程就是让其理解企业内部实体、术语、技术架构等高频率知识。内部知识往往结构清晰、更新频繁,易于清洗和解释,但仍有图片等内容难以处理。

更重要的是,真正的专业能力并非仅来自阅读文档的显性知识。不同运维人员之间的差异主要在于对工具的使用经验与问题排查能力,而这些经验很难完全文档化,甚至有人不愿意记录。因此,自学习需要让Agent从人机协同中持续学习。人在修正Agent决策的过程中,模型从成功经验中学习到非书面化知识,这些经验需要通过微调或再训练方式反馈给模型。

不过,在这个过程中仍存在知识错误的问题。仅靠大模型并不能完全避免错误或过期内容。因此,需要建立知识反馈机制:只有被使用或被指出错误的知识,才值得更新。通过消费反馈流程,我们能识别被使用的知识,再次修订单并结构化保证输入模型的数据可靠性与时效性。

文档类知识可借RAG技术处理,但技术架构图或图片等隐性知识依然难以处理。运维场景对准确性要求高,因此必须能追踪错误来源。相比传统AI运维模型,大模型的优势在于可保存推理过程与决策依据,通过追踪与反思机制改进模型。例如,借助用户的反馈结合追踪,可以重新微调,从而持续优化模型表现。

建立对Agent的信任是个渐进过程,需要在关键环节保持人工介入并理解Agent的思考逻辑。随着协同机制的优化和提升,信任也将逐步建立。

透明化的决策过程是推动Agent真正融入工作的关键。

免责声明

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章

Anthropic与谷歌启动云合作谈判,百亿美元计算大单在即

据海外媒体披露,AI领域新锐企业Anthropic正与科技巨头谷歌就一项规模达数百亿美元的云算力合作进行早期磋商。尽管双方尚未达成最终协议,但此次谈判已引发业界对AI基础设施竞争格局的高度关注。作为

2025-10-22.

阿里“C计划”加速AI布局:全新对话形态对标豆包

近日,有关阿里旗下夸克团队正在酝酿一项重大AI业务创新的消息引发行业关注。据可靠信源透露,该项目代号为 "C计划 ",由夸克核心研发团队牵头推进,同时吸引了通义实验室多位资深技术专家参与其中。多方消息显

2025-10-22.

商汤与中国电信合推阿曼智慧城市与数字化转型

中国电信(阿联酋)与商汤科技旗下沙特子公司SenseTime MEA正式签署战略合作协议,双方将联合推动人工智能视觉技术在阿曼智慧城市建设中的深度应用。此次合作整合了SenseTime MEA在中东

2025-10-22.

阿里夸克C计划布局AI,对话式应用对决字节跳动

港股市场近日因一则科技领域的动态引发关注,阿里巴巴集团(9988 HK)股价出现显著波动。当日盘中,其股价一度攀升4 2%,尽管午后涨幅有所回落,但最终仍以1 98%的涨幅收盘,报收于165 1港元

2025-10-22.

行者泰山机器人学舞揭秘:从模仿到开窍的技术进阶

近日,山东优宝特智能机器人有限公司自主研发的“济南籍”人形机器人“行者泰山”凭借一段华尔兹舞蹈视频引发行业关注。视频中,这款机器人以流畅的肢体动作完成旋转、迈步等复杂舞步,关节联动自然如真人,标志着

2025-10-22.

热门教程

更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程

最新下载

更多
雷神战纪
雷神战纪 角色扮演 2025-10-22更新
查看
我叫MT2
我叫MT2 角色扮演 2025-10-22更新
查看
恐怖老师正
恐怖老师正 休闲益智 2025-10-22更新
查看
元气战纪手游
元气战纪手游 棋牌策略 2025-10-22更新
查看
星骸骑士
星骸骑士 棋牌策略 2025-10-22更新
查看
戏法门
戏法门 动作冒险 2025-10-22更新
查看
拆迁破坏模拟器
拆迁破坏模拟器 模拟经营 2025-10-22更新
查看
一骑当千2游戏
一骑当千2游戏 角色扮演 2025-10-22更新
查看
萌宠传奇消游戏
萌宠传奇消游戏 休闲益智 2025-10-22更新
查看
权倾三国正
权倾三国正 棋牌策略 2025-10-22更新
查看