面包屑图标 当前位置: 首页
AI资讯
热点详情

Decagon华裔创始人:AI Agent关键在于使用场景而非技术

AI热点日报
AI热点日报时间:2026-06-29
热点解读

探索AI智能体的构建秘诀:场景洞察比技术本身更重要 2024年被业界视作AI应用之年,很多人相信,今年将是属于Agent的一年。今天,OpenAI发布了其首款AI智能体Operator,这款能在浏览器上执行简单在线任务的网络应用,进一步印证了这一趋势。在这种情况下,如何才能打造出一个真正实用且强大的

探索AI智能体的构建秘诀:场景洞察比技术本身更重要

2024年被业界视作AI应用之年,很多人相信,今年将是属于Agent的一年。今天,OpenAI发布了其首款AI智能体Operator,这款能在浏览器上执行简单在线任务的网络应用,进一步印证了这一趋势。在这种情况下,如何才能打造出一个真正实用且强大的智能体,自然成了所有人关心的话题。

近期,著名风险投资机构“硅谷初创风向标”A16Z邀请了智能体初创公司Decagon的首席执行官杰西·桑,以及A16Z的合伙人金伯利·谭,就上述问题展开了一场深度对话。Decagon的名字并不陌生——这可能是过去一年AI Agent领域最成功的公司之一,主要为大型企业构建用于客户支持和客户体验的AI Agent。成立仅6个月,Decagon就实现了七位数的年度收入(ARR)。去年10月,Decagon完成了一轮6500万美元融资,估值暴涨4倍,达到了6.5亿美元。其创始人的分享,无疑极具参考价值。

本文将围绕以下核心观点展开:大模型让智能体成为可能;构建智能体的关键不在技术,而在实际场景类型;智能体时代如何设置防护措施是一门学问;使用智能体时如何设置API;构建智能体时用户界面的重要性;智能体与SaaS软件构建逻辑的一致性;多模态发展将推进智能体更进一步;智能体定价模式的考量与取舍;产品好3倍才能打败SaaS巨头;智能体时代人类最大的职责是“监工”。

一、大模型,让智能体成为可能

回想一下以前的自动化工具,依赖的是决策树这类东西。你可以进行一些简单的自然语言处理,以确定在决策树中该走哪条路径。但如果问题无法通过决策树完全解决,最终可能会被引导到一条与所问问题有点相关、但实际上并不完全匹配的路径上。早期的聊天机器人就是这样的典型,体验很不理想。

而现在,我们有了大语言模型。它的神奇之处在于非常灵活,能够适应很多不同情况,并且本身就具备一定的基础智能。所以,当把它应用于客户支持或客户咨询场景时,就能做到更加个性化的解答。这种个性化能力的提升,全面优化了各项指标——能解决更多问题,客户满意度也更高。

接下来的逻辑链条也很清晰:既然拥有了这种智能,就应该能做更多人类能做的事情。人类可以实时提取数据、采取行动、进行多步骤推理。比如,客户提出一个相当复杂的问题,其中包含了两个子问题。大语言模型足够智能,能够识别出这里有两个问题,并按步骤一步步解决。但在大语言模型出现之前,这基本上是不可能的。智能体,本质上就是一个由多个大语言模型协同工作的系统。这就是为什么我们现在看到,由于大语言模型的出现,技术所能实现的一切有了一个质的飞跃。

二、构建智能体的关键不在技术,而在实际场景

一个人工智能智能体能否真正有效运作,技术栈并非关键因素。在如今的技术环境下,大多数从业者所使用的技术都大致相同。真正决定智能体能否发挥作用的核心要素,其实是它所应用的实际场景类型。不同的场景,对智能体的功能、性能以及运行逻辑,都有着截然不同的要求。

对于智能体公司来说,有两个维度的判断标准,决定着你的产品能否从演示阶段走向现实落地。

第一点,你所解决的用例、所应用的场景,能为客户带来多少投资回报率(ROI),这必须是非常可量化的。这一点极其重要,因为如果不是这样,就很难说服人们真正使用你的产品并为之付费。拿Decagon自己来说,可量化的指标分为两个标准:一是解决了百分之多少的客户支持咨询;二是客户满意度。因为投资回报率很容易量化,所以人们实际上会采用他们的产品。

第二点,应用场景必须是渐进式的。如果期盼智能体能一次性100%解决问题,那是不可能的。大语言模型具有不确定性,必须有某种备用方案。幸运的是,客户服务有一个很好的特性:总是可以将问题扔给人工客服。即使智能体只能解决一半的问题,对人们来说也已经是极有价值的了。如果一开始就要求它完美无缺,就没有人会真正愿意尝试或使用它。

智能体的个性化能力来源于两个方面。一方面,来自于对用户的适配——你需要了解用户本身的背景信息。另一方面,则需要了解客户的业务逻辑背景。如果将这两者结合起来,就能提供相当不错的体验。听起来容易,但实际上要获取所需的所有背景信息是相当困难的。所以Decagon主要构建的是合适的原语,以便当有人部署产品时,他们能够很容易地决定业务逻辑。比如,首先需要执行这四个步骤,如果第三步失败,就必须转到第五步。你需要能够很容易地教会人工智能,同时提供给它用户的账户详细信息。如果需要获取更多信息,可以调用这些API。这是位于模型之上的一层——可以称之为编排层——在这里,智能体才能真正发挥作用。

三、智能体时代,如何设置防护措施是一门学问

随着时间的推移,大量实施工作让人们越来越清楚,哪些类型的防护措施是必须关注的。最简单的是必须设置一些智能体要始终遵循的规则。比如,如果你与一家金融服务公司合作,就不能提供财务建议,因为这是受监管的。所以必须对智能体进行调整,确保它永远不会这样做。通常的做法是设置一个监督模型或某种系统,在结果输出之前运行这些检查。

另一种防护措施是应对恶意行为——如果有人发现这是一个生成式系统,想要捣乱,也需要能够检查这种情况。在部署这些智能体的几个月到一年的时间里,实践中已经积累了大量这类案例。对于每一种情况,可以进行分类处理。随着构建的防护措施越来越多,系统就会变得越来越稳固。

几年后,智能体将无处不在。真正重要的是为人们提供工具,赋予下一代工作岗位——比如智能体监督员——权力,为他们提供构建智能体的工具,同时让他们能够添加自己的防护措施。每个客户最了解自己的防护措施和业务逻辑。Decagon的工作,实际上是最擅长为他们构建工具和基础设施,以便他们能够构建自己的智能体。这就是为什么一直在强调:“你的智能体不应该是一个黑匣子。你应该能够控制如何构建这些防护栏、构建规则以及构建你想要的逻辑。”

在未来几年,这将是评估工具时的首要标准之一。无论评估的是哪种类型的智能体,都希望随着时间的推移,有能力让它变得越来越好。在讨论AI政策时,一个重要的方面是应用层,将责任放在大语言模型的用户和运行应用程序的人身上,而不是将模型本身视为危险的东西。通过模拟攻击,找出具体的用例、攻击方式和漏洞,然后针对性地进行防范,而不是仅仅依赖OpenAI或其他公司设置的措施。

未来可能会出现新的认证标准。就像大家都知道不同行业有SOC 2和HIPAA等标准一样,大多数时候,当销售普通的SaaS产品时,人们会要求进行渗透测试。对于AI智能体,可能也会出现类似的情况——有人会给它起个新名字,这将是一种针对智能体稳健性的测试。

四、使用智能体,如何设置API是关键

如今,人工智能领域的很多事物都相当新颖。一旦和现有的旧系统产生关联,就如同其他涉及新旧交替的情况一样,会出现各种混乱和东拼西凑的现象。但如果有人打算从零开始搭建人工智能相关系统,其实有不少最佳实践方法能让事情变得更简单。

就拿构建知识库来说,很大程度上依赖于把知识库构建成高度模块化的小块,而不是写成一篇包含海量答案的大文章。这是人们在设置API时能采用的一种实用手段——让API对智能体更友好,比如通过特定方式设置权限和输出格式,这样智能体就能更轻松地摄取信息,随后也不用经过大量计算就能快速找到答案。

类似这样的做法有很多,但不是说为了使用智能体就非得做这些不可。显然,更完善的文档总归是有益的。在信息组织方面,如果要让用户能够按照最契合自身客户需求或特定应用场景的方式去引导智能体行动,那么在用户界面和用户体验层面,还有大量的实验等待开展,也有许多全新的领域有待探索。毕竟,这和传统软件有很大差别。

五、构建智能体,用户界面至关重要

当我们有一个智能体,首先要做的是了解它是如何做决策的。然后,就可以利用这些信息来决定对它进行哪些更新,以及应该给人工智能提供什么样的反馈。这就是用户界面发挥作用的地方。

随着时间的推移,它将越来越基于自然语言,这就是智能体的思维方式——这基本上就是大语言模型的训练内容。从极限情况来讲,如果你有一个完全超级智能的智能体,它基本上就像人类一样:你可以给它展示东西、向它解释事情、给它反馈,它会在脑海中进行更新。就好比团队中有一个非常自信的人,他来了之后,你教他一些东西,他开始工作,然后你给他反馈,还能给他展示新文档或新图表之类的东西。

所以,从极限情况看,它会朝着更具对话性、更基于自然语言的方向发展。人们不再只是采用构建庞大复杂决策树这种权宜之计——这种决策树虽然能大致体现需求,但很容易出问题。过去只能这么做,因为没有大语言模型。但现在随着智能体不断完善,用户体验和用户界面会更具对话性。

六、智能体与SaaS软件构建逻辑的一致性

智能体的软件栈有不同的层次。最底层是大语言模型,从应用层的角度看,它处于基础位置。中间可能有一些工具,帮助管理大语言模型、进行评估等。而Decagon主要构建的是最上层的部分,这其实和普通的SaaS软件没太大区别。所以,大部分工作与普通软件并无太大不同。只是由于大语言模型变化太快,多了一个研究环节。

要研究不同的大语言模型能用它们做什么,它们擅长什么,针对特定任务应该使用哪个模型。这是一个重要问题——OpenAI不断推出新成果,Anthropic也有新进展,Gemini也在不断改进。所以必须有自己的评估体系,确定每个模型的优势,以便在合适的场景使用合适的模型。有时可能需要进行微调,这就涉及到何时进行微调、何时值得进行微调的问题。

这些可能是与大语言模型相关的一系列研究问题。但至少到目前为止,感觉变化还没有那么快,因为目前对中间层的依赖程度不是特别高。即使有变化,大多也是升级。比如3.5 Turbo几个月前有一次更新,就会考虑是否应该直接替换使用新的版本。然后运行一系列评估,如果没问题,就可以切换。当GPT-4.0发布时,情况类似,要考虑用它来做什么。在Decagon的案例中,对于大多数面向客户的用例,它有点慢,所以可以在一些后端任务中使用它。

归根结底,就是要建立良好的系统,对模型进行研究。只要有新模型发布,就需要评估。必须确保即使新模型更智能,也不会破坏基于现有案例构建的某些功能。这种情况可能会发生——模型整体更智能,但在某些边缘情况下,可能在你的某个工作流程中,它不擅长在A和B之间做出选择。这就是评估的作用。总体而言,最关注的一种智能类型是指令跟随能力,希望模型在指令跟随方面越来越出色。如果是这样,绝对是有益的。最近很多研究集中在推理类型的智能上,比如在编码、数学方面表现得更好,这对我们也有帮助,但不像指令跟随能力那么重要。

七、多模态的发展,将推进智能体更进一步

拥有所有模态并扩大市场是有意义的。基本上对每种模态都有相应的智能体。限制因素有两个:一是客户是否准备好采用新模态。从文本开始很有意义,因为人们更积极地采用文本交互,风险更低,也更容易监控和理解。另一个重要的模态显然是语音。在市场上,人们对语音的接受度仍有提升空间,现在已经有早期采用者开始使用语音智能体,这很令人兴奋。

从技术角度来说,大多数人应该都会认同语音交互的门槛更高。如果和某人通电话,对延迟要求非常高——必须非常自然地回应,所以延迟要低,必须在计算方式上更加巧妙。如果在聊天时,回复需要5到8秒,可能几乎注意不到。但如果在电话中回复需要5到8秒,就会感觉很奇怪。所以语音方面存在更多技术挑战。随着这些技术挑战的解决,以及市场对采用语音交互的兴趣增加,将开启一种新的模态。

八、智能体定价模式的考量与取舍

从历史上看,很多SaaS软件是按席位销售的,因为销售的是工作流软件,为的是提高单个员工的生产力。但AI智能体与单个员工的生产力并无关联。对于大多数AI智能体来说,它们提供的价值并非与人数成比例,而是与工作量产出相关。这与之前说的逻辑一致——如果投资回报率很容易衡量,就能清楚看到工作量产出水平。

按席位定价肯定不合理,可能会根据工作量产出定价。智能体的定价模式应该是:完成的工作量越多,收费越高。有两种明显的方式:一种是按对话付费,另一种是按AI实际解决的对话付费。

有趣的是,大多数人选择了按对话付费模式。按实际解决的对话付费的主要优点是,你为AI实际完成的工作付费。但接下来会出现一个问题:什么是“解决”?没人想深入探讨这个问题,因为可能会出现这样的情况——智能体几句话就把客户打发走了,并未落到实处。这很奇怪,而且会给AI供应商带来奇怪的激励,因为他们会想“我们按解决的对话付费,那为什么不尽量解决更多问题呢?”即使在很多情况下,最好的做法可能是将问题升级,但供应商可能会选择直接打发客户,而客户并不喜欢这样。所以按对话付费模式更简单、更可预测。

智能体的收费方式,很可能主要和劳动力成本有关系。智能体最让人激动的地方就在于,以前在服务方面花的钱可能是花在软件上的钱的10到100倍。现在,这些钱有很大一部分会转到软件这边来。自然而然地,就会把劳动力成本当作重要参考,来决定智能体怎么收费。对客户来说,账很好算——要是用了智能体解决方案,能省下好几百万的劳动力成本,那客户肯定觉得用这个方案很划算。不过,智能体的价格可能不会太高也不会太低,会在一个中等水平,因为市场上会出现各种各样的智能体,有些可能没那么好,但它们也会定个价格。这就跟平常说的SaaS那种竞争情况差不多——大家都在竞争,价格就不会太离谱,就会处在一个中间的范围。

九、产品好3倍,才能打败SaaS巨头

鉴于智能体公司的产品可能并非为原生AI架构设计,且定价方式基于席位,因此不太适应以结果为导向的定价模式。这对行业巨头来说有点棘手——如果它们尝试推出智能体,就需要分析其基于席位的模式。如果不再需要那么多席位,新推出的产品又蚕食了当前的收入,那就会很麻烦。这是行业巨头面临的一个问题。

但也很难说,因为它们拥有分销渠道的优势,产品可能不需要那么好。人们不想费力去采用新的供应商,只要当前产品能达到80%的效果就行。所以,第一,如果像Decagon这样的公司想要成功,产品必须比行业巨头的产品好3倍。这就是经典的行业巨头与初创公司竞争的局面。

行业巨头自然风险承受能力较低——它们有大量客户,如果快速扩张但出现问题,损失巨大。而初创公司总是能更快地迭代,迭代过程会带来更好的产品。这就是一个正向循环。Decagon一直以产品的交付速度、质量以及团队在交付产品时的全力以赴而自豪,这也是赢得当前业务的方式。

十、智能体时代,人类最大的职责是“监工”

未来,人们在工作场所花费在构建和管理智能体上的时间——比如类似人工智能监督员这类角色的时间——会大幅增加。即便职位名称并非正式的人工智能监督员,但过去所做的很多工作,都将用于管理智能体,因为智能体赋予了极大的影响力。

在多个部署案例中都能看到这一点:团队中的领导者会花大量时间监控人工智能,检查是否有需要改进的地方,做出调整并监控其运行情况。比如“整体数据看起来如何?是否有特定领域需要我们关注?知识库中是否存在能让人工智能表现更好的差距?人工智能能否帮我填补这个差距?”等等。

与智能体协作会带来很多工作,人们花在这上面的工作时间会直线上升。这就是Decagon的核心观点——整个产品都围绕着为人们提供工具,让他们能够观察、解释、控制人工智能智能体。在未来一年,这将成为一件大事。

在很多工作中,对错误的容忍度极低。在这种情况下,任何人工智能最终可能更多地扮演辅助角色,而不是完全替代人类。比如在医疗或安全等更敏感的行业,几乎要求做到完美。在这些行业中,智能体的自主性会较低,但这并不意味着它们没有用处,只是风格会有所不同。而在Decagon所处的领域,主要是部署智能体让它们自主完成整个工作流程。

热点追踪提示词
你是一名 AI 行业编辑,请围绕下面这条热点输出一份资讯解读:
热点:Decagon华裔创始人:AI Agent关键在于使用场景而非技术要求:
1. 先用一句话解释这条热点在讲什么
2. 再总结它为什么重要
3. 说明会影响哪些 AI 产品或内容方向
4. 最后给出 3 个适合资讯站使用的标题
来源:https://www.53ai.com/news/zhinengyingjian/2025012484169.html
ai 人工智能

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关热点
AI热点2026-07-02 14:27
Huddlenow Insights 谷歌Meet商业企业视频会议服务全方位深度解析

GoogleMeet是面向商业与企业的视频会议服务,支持屏幕共享、实时字幕及与GoogleWorkspace集成,适用于项目讨论、网络研讨和线上教学等多种会议场景,具备扎实的安全与隐私保护。

AI热点2026-07-02 14:27
一款实用的YouTube视频高亮标注Chrome浏览器扩展插件

Lanter是Chrome扩展,利用AI将YouTube视频语音转为带时间戳的文字笔记,支持一键抓取高光、自动标点排版、书签管理、全局搜索及每日邮件汇总,方便高效回顾视频关键内容。

AI热点2026-07-02 14:27
WhisperNotes智能音频笔记应用

一款AI驱动的Chrome扩展音频笔记应用,支持录音自动转文字、标签分类与全文搜索,将语音转化为可检索的数字资产,显著提升信息定位与管理效率。

AI热点2026-07-02 14:27
Sharpen AI:Chrome扩展秒转Google Meet为笔记邮件任务

专为GoogleMeet设计的AIChrome扩展,实时转录会议内容,自动生成摘要并提取行动项与决策,无缝同步至Google文档、任务及Gmail,省去手动整理时间,显著提升协作效率。

延伸阅读