AI工程核心命题:智能体易造但可靠难求
AI工程师不同于机器学习工程师,核心职责是在应用层构建可靠智能体,而非训练模型。工作围绕“构建-评估-改进”循环展开,依赖上下文工程、工具设计、评估与生产部署四项技能。评估指标的选择是关键,选错指标会使循环失效。
AI 工程师:一个全新的角色,不是机器学习工程师的“换皮”
你是否也曾困惑:AI 工程师和机器学习工程师到底有什么区别?为什么自己搭建的智能体在演示时惊艳全场,一放到真实用户面前就问题百出?真正的 AI 工程,核心不是搭建智能体,而是永不停歇的“构建-评估-改进”循环。本文将从核心概念、必备技能、工作闭环到常见误区,为你全面解析这个新兴的角色。
一、AI 工程师 vs 机器学习工程师:一个在应用层,一个在模型层
很多从传统开发或机器学习方向转型的工程师,都会问这个问题。简单来说:
- 机器学习工程师:扎根在模型层——训练模型、采集和管理数据集、优化模型性能。他们研究科学原理、设计模型架构、搭建训练流程,与研究工程师一起撰写论文,为领域奠定基石。
- AI 工程师:活跃在应用层——拿过这些模型和研究成果,将它们变成真正服务于用户的产品。你可能需要啃数学论文,实现新颖且高性能的智能体架构,但你的产出是一个能跑的产品,而不是一个训练好的模型。
小提示:如果你喜欢把研究成果落地成产品,并且享受解决实际用户问题,AI 工程可能更适合你;如果你更喜欢钻研模型内部原理和训练过程,机器学习工程方向更对口。
二、AI 工程师的四项核心技能与日常具体工作
根据 LinkedIn 上 AI 工程师的招聘要求,有四项技能反复出现:RAG(检索增强生成)、评估体系(Evals)、智能体(Agents)、生产部署。其中前三项可以作为系统课程学习,生产部署则与团队和环境高度相关。
在这些标题技能之下,是日复一日的具体工作,这才是这门学科的内核:
- 上下文工程:在正确的时机,把正确的 token 送给模型。Token 就是货币,与能耗成本直接挂钩。我们正在走向以“每瓦 token 数”作为度量单位的未来。
- 工具设计:赋予智能体恰当的能力,确保它们能做该做的事,又不会做不该做的事。
- 评估:度量智能体的表现,判断它们是真正在进步,还是我们只是自我感觉良好。
- 生产可靠性:包含自愈能力、用户体验、用户如何感知系统故障、错误处理和延迟应对。这些东西决定了系统在接触现实后能否存活。
常见问题:我搭建的智能体,一到真实用户面前就崩了,为什么?
答案:因为演示走的是理想路径,而真实用户会输入各种意想不到的提示词(比如往提示词里塞三只蚂蚁)。AI 本质上是一个预测器,不是真正的智能。你需要通过评估-改进循环,逐步提高系统的可靠性和鲁棒性。具体做法是:先收集真实用户失败的案例,分析失败原因,然后设计针对性的评估指标,再通过提示工程、工具设计或架构调整来修复。
三、构建 → 评估 → 改进:永远循环,没有“上线收工”
搭建一个智能体很简单(用现有的 SDK 五行代码就能搞定)。真正重要的是之后的一切:评估它哪里不行,搞清楚为什么不行,针对那个具体的失败点施以正确的技术手段去修复,然后再评估一轮。
这个过程永远不会停。这份工作永远不会有“做完了”的那一天。这就是一个非确定性系统想要做到可靠所必须配备的角色。没有“上线收工”这回事,有的只是这个循环:
构建 → 评估 → 改进 → 评估 → 改进 → ……
四、为什么 AI 工程会演变成一整支团队?
看看 OpenAI 的招聘启事就知道了:他们不是在笼统地招 AI 工程师,而是为系统中某一个具体切面招人。一个团队负责工具选择,一个团队负责人机协同,一个团队负责安全,还有一个团队专门想办法在不损失准确率的前提下压缩 token 用量。
ChatGPT 在很多方面依然表现不佳,而这已经是有整支团队专注于各个子系统的结果了。当你的产品本身就是一个智能体时,所需投入的精力就是这个量级。这不是全栈工程师顺手兼顾一下的事,这是一门独立的学科。
常见问题:AI 工程师需要会训练模型吗?
答案:通常不需要。AI 工程师的工作是基于已有的模型(如 GPT、Claude 等)构建应用。你不需要自己训练模型,但需要深入理解模型的优缺点,知道如何通过上下文工程、工具设计、评估循环来提升模型在具体场景下的表现。当然,如果你能理解一些模型原理,对设计更好的提示和架构会更有帮助。
五、最难的不是代码,而是选对度量指标
这份工作最难的部分,在于搞清楚该用哪些数据来做评估、该对标哪些指标来打分。什么样的指标最合适,能给出最有效的信号?我们该怎么打分?随着系统越来越可靠,我们又该如何迭代这套评分体系?
这里面有大量的科学、艺术,以及一些说不清道不明的东西。但它是一切的根基。选错了指标,你的循环就是在原地空转;选对了指标,整个系统就能形成复利效应。
这就是为什么这个角色自成一体。软件工程师优化的是确定性的代码路径,机器学习工程师优化的是模型,而 AI 工程师优化的是架构在非确定性系统之上的反馈循环——而最大的杠杆,来自于选择衡量什么。
结语:一个实践领域,而非一个流行词
AI 工程不是营销包装出来的新概念,而是当你不再只是做演示、真正开始交付产品时,工作本来的面貌。它处于与机器学习不同的层次,需要与传统应用开发不同的思维方式,遵循不同的循环,关注不同的指标,并且正日益成长为一条独立的职业路径。
如果你是一名开发者,正在犹豫要不要投身这个方向,记住这句话:智能体是简单的部分,循环才是真正的工作。
关于本文
译者:@飘飘
作者:@Scott Moss
原文:https://frontendmasters.com/blog/ai-engineer-is-a-new-role/
你是一名 AI 行业编辑,请围绕下面这条热点输出一份资讯解读:
热点:AI工程核心命题:智能体易造但可靠难求要求:
1. 先用一句话解释这条热点在讲什么
2. 再总结它为什么重要
3. 说明会影响哪些 AI 产品或内容方向
4. 最后给出 3 个适合资讯站使用的标题
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
相关热点Atos与NVIDIA联合创立的“卓越人工智能实验室”(EXAIL),其核心目标在于利用高性能计算与AI技术,攻克从气候变化、医疗健康到量子计算、边缘计算及网络安全等领域的重大科学挑战。 该实验室的首批研究项目将重点聚焦五大前沿领域:气候研究、医疗与基因组学、量子计算、边缘AI 计算机视觉以及网络安
DeepSeek昨夜悄然发布新版V3,新旧版本对比实测显示代码能力大幅提升,海外用户纷纷热议。 3月24日晚间,DeepSeek在开源社区低调放出了升级后的DeepSeek-V3模型,版本号为DeepSeek-V3-0324。模型参数从上一代V3的6710亿提升至6850亿——尽管增长幅度不算惊人,
在医疗AI领域,实时处理多模态数据一直是核心挑战。NVIDIA推出的Clara Holoscan平台,正是为了应对这一需求而生。开发者可以基于它构建应用,用来处理多模态传感器数据、运行基于物理性质的模型、加速AI推理,甚至实时渲染高质量图形——这些能力直接服务于机器人辅助手术、介入放射学和放射治疗规
近日,安谋科技执行董事长兼CEO吴雄昂荣膺全球电子成就奖“年度杰出贡献人物奖”。这一殊荣意义重大,旨在表彰他在推动中国半导体产业发展方面所做出的突出贡献。自2018年执掌安谋科技以来,吴雄昂带领公司成功实施“双轮驱动”战略转型,推出新业务品牌“核芯动力”,并主导发布了全球首款开源神经网络处理器指令集
- 日榜
- 周榜
- 月榜
热点快看
