基于大语言模型的智能客服选车助手
针对用户表达多样、交互僵化等问题,基于大语言模型构建多智能体选车助手,包含NLG和NLUAgent。通过检索增强生成技术将货物信息识别准确率提升至90%,实现流程引导与拟人化回复,提供更自然、可控的对话体验。
智能客服行业近年来发展迅猛,但许多用户仍遭遇“答非所问”的体验困境。例如,用户提问“有优惠券吗?”,系统却自顾自地推荐车型,令人困扰。本文将探讨货拉拉如何借助大模型技术,将选车助手这一看似简单的场景打造成高效、智能的典范。
背景介绍
首先简要回顾基础知识。客服咨询场景主要分为两类:一类是FAQ(常见问题解答),用户提问、系统直接回复;另一类是任务型对话,需要逐步引导用户完成操作,例如取消订单或开具发票。AI客服的本质是利用人工智能技术实现上述功能,核心目标在于提升效率与服务质量,同时降低运营成本。选车助手正是AI客服中一个典型的子场景,专注于帮助用户挑选合适的车型。
选车助手概况
为了更准确地为您推荐合适的车型,请您配合回答几个问题即可~ 请问您的货物重量是多少呢?您可以选择以下接近的选项,或直接输入“0.5吨”“1吨”等数值。
(此处包含货物重量选项列表)
只剩2个问题喽~请您根据货物长度选择以下选项,或者手动输入如“4米”。如果货物数量较多,只需提供最长件的长度(例如床的长度为2米)。温馨提示:这里指的是物品平放于车厢内从头到尾的长度,不能倒放的物品(如冰箱)切勿将其高度计为长度哦~
(此处包含货物长度选项列表)
最后一个问题啦,不要走开!请选择以下要运输的物品类型。如果列表不含所需选项,可以输入“水果”“装修建材”等关键词。
(此处包含物品类型选项列表)
(以下是用户与助手的真实对话案例,展示了助手无法理解用户问题的不良体验)
从上述案例中可以看出,系统暴露了以下几个典型问题:
1. 仅能识别预设的几种类别,货物信息获取不完整,导致车型推荐不准确。
2. 完全依赖点选,交互方式僵硬,无法处理“一个桌子、一台七十寸电视”这类复杂表达。
3. 回复内容冗长啰嗦,缺乏人性化沟通。
4. 一旦用户偏离主流程提问(如同优惠券),机器人即陷入“宕机”状态,体验极差。
技术背景
目前市面上主流的商业解决方案普遍偏重“保守”路线——强调可控性,牺牲灵活性。客服人员需要先绘制出复杂的流程图、编写大量死板规则,系统则严格按此执行。结果用户稍有偏离,体验便急剧下降,只能转接人工客服,反而增加了运营成本。
然而,过去一年间,大模型技术发生了翻天覆地的变化,基于其构建的智能体展现出巨大潜力。巧合的是,货拉拉内部也自主研发了货运大模型,这为彻底重构选车助手提供了坚实的技术底气。
系统框架
整套选车助手服务系统的架构从上至下分为四层:
- 交互层:支持Web、App、小程序等多种入口,用户可从任意渠道接入。
- 应用层:包含IM后台与WebSocket网关,负责消息通道的建立与维护。
- 逻辑层:即DM对话机器人系统,负责会话管理与流程控制。
- 算法层:作为核心大脑,采用Multi-Agent框架,并结合内部机器学习平台(海豚平台)进行模型管理。
图1 客服选车助手系统框架图
算法方案
通过分析线上数据发现,用户行为完全不可控。他们并不会严格按预设流程操作,时常在对话中突然提问“有优惠券吗?”(FAQ类问题)或“今天天气咋样?”(闲聊类问题)。如何在推进主流程的同时,又不生硬地引导用户回归正题,成为一大难点。此外,货物种类繁多,用户描述方式也千差万别,准确理解其意图极具挑战。
我们选择结合大模型来突破困境,主要基于其三大核心能力:强大的理解能力(能够准确定位各种表达方式)、智能的生成能力(使回复更自然、体验更佳)、以及跨语言能力(支持多语种对话)。
LLM-based多智能体系统
为确保大模型Agent在执行任务的同时保持可控性,我们采取了务实的路线:利用SOP(标准作业程序)分解任务,实现对Agent的细粒度控制,从而更容易落地实施。
图2 LLM-based多智能体系统图
单一智能体难以胜任复杂任务,因此拆分为两个:NLG Agent负责回答用户问题、调用工具、引导对话流程;NLU Agent则专门从对话中提取货物信息。
NLG Agent
当收到用户提问后,该Agent首先判断问题类型,随后决定处理方式。示例如图3所示。它还会与Memory、Tools以及NLU Agent进行协同交互。
图3 NLG Agent示例
Memory
图4 Memory模块图
Memory中存储了三类先验知识:
- 通用知识库:当用户提及“电动车”时,系统自动补全其尺寸和重量,无需再追问细节。
- FAQs:用户询问“客服电话”时,直接输出正确回复。
- 长短记忆:对话历史记录,使Agent记住上一轮内容,实现更好的上下文配合。
Tools
图5 Tools模块图
Tools负责与外部系统对接,包含以下组件:
- 车型推荐接口:根据NLU Agent收集的信息,精准推荐合适车型。
- 敏感词过滤接口:作为安全红线,必不可少。
- 业务SOP:用于指导对话节奏,避免在闲聊上浪费时间。
- 流程引导:综合所有信息,决定下一步是回复FAQ问题还是继续询问货物信息。
NLU Agent
这是整个系统最关键的环节。选车助手的核心任务是根据货物信息推荐车型,但用户的表述极为丰富多样——
- “我要拉一个箱子,长1米”(仅提供部分信息)
- “我要拉20个1m*1m*1m的箱子”(多个同规格物品)
- “我要拉1.8m的床和冰箱”(多个不同物品)
- “长1.8m,重量不清楚”(信息模糊)
如何从这些表述中精准提取信息,既是难点也是重点。传统NER方法需要大量标注样本和训练周期,且在处理实体嵌套时容易出错。
我们尝试了自研的货运大模型,初始基线在内部测试集上准确率仅为50%。经过一轮prompt调优后,最高也只达到60%。分析bad case发现,模型对“不清楚多重”“外机700×400×500”这类表述难以处理。为此,我们引入了RAG(检索增强生成)技术。
图6 RAG基本流程图
在召回阶段采用多路召回策略:
- 向量召回:寻找语义相似的问法,例如“1.5长 70cm高 74宽”,系统可依据常识补全为“长1.5米,宽74厘米,高70厘米”。
- 货物名称召回:根据“电视”“冰箱”等具体名称,匹配同类货物的典型信息,如“60寸液晶电视”。
通过多路召回RAG,准确率直接提升至80%。
此外,在第n轮对话时,将前一轮(n-1轮)收集到的信息作为上下文输入,对效果提升明显。再配合一些硬编码规则处理固定句式,最终内部测试集上的货物信息识别准确率稳定在了90%。
表1 迭代效果对比展示
效果展示
示例1
(以下是新系统的真实对话案例)
用户询问优惠券,助手不仅完整回答,还能顺势将话题拉回主流程(“请问桌子的长度、重量?”)。当用户指出重量信息有误时,助手能准确理解上下文,立即更新推荐车型(从小面换为中面)。
效果分析:
- 流程引导:回答问题后主动回归主线。
- 拟人化回复:语言简洁、更接近真人沟通。
- 上下文理解:用户更正信息后,推荐实时更新。
示例2
(另一个真实对话案例)
用户表示“一个桌子,一个七十寸的电视机”,助手直接询问桌子信息,而对七十寸电视的尺寸和重量了然于胸(具备常识)。用户称“重量不清楚”,模型也能自动推理出桌子的大致重量,无需额外追问。
效果分析:
- 多物品信息理解:能处理“一个桌子,一个电视”这类复杂输入。
- 具备常识:七十寸电视无需再问重量,桌子重量不确定时也能自动推断。
总结展望
这是大模型在货拉拉业务中的一次务实落地。面对具体业务场景的实际挑战,我们没有盲目追逐花哨技术,而是结合自研货运大模型,采用多智能体架构,稳扎稳打地打造出兼具“人情味”与“懂业务”的AI客服选车助手。未来,我们将持续优化迭代,并将这些能力推广至更多客服场景,进一步提升用户服务体验。
你是一名 AI 行业编辑,请围绕下面这条热点输出一份资讯解读:
热点:基于大语言模型的智能客服选车助手要求:
1. 先用一句话解释这条热点在讲什么
2. 再总结它为什么重要
3. 说明会影响哪些 AI 产品或内容方向
4. 最后给出 3 个适合资讯站使用的标题
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
相关热点企业AI选型易陷入十大误区:盲目追求通用方案、关注技术指标而非实际价值、忽视数据质量、照搬成功案例、贪图低成本忽视长期代价、忽略团队能力、低估变革难度、过度依赖供应商、忽视隐私合规、缺乏明确ROI标准。选型应聚焦业务需求、数据基础与行业特性。
使用可灵AI生成视频时多手问题源于模型缺乏人体解剖约束。通过启用肢体数量专项负向词组合、强化上肢解剖附着点正向锚定、导入双视角参考图锁定骨骼绑定、分段生成并硬锚定关键帧肩部区域,可从词、图、帧三维度提供不可违背的解剖约束,有效扼制多手问题。
想让Canva的AI在生成电商商品图前主动追问细节,而不是直接输出一张图片?这里有一个实用技巧:关键在于激活它的“对话式提示词引导模式”。要实现这一点,你需要在输入提示词时有意识地留下结构化的空白,并确保首句包含明确的提问意图动词。下面我们来详细拆解操作步骤。 用提问句式开头,强制AI进入追问流程
基于亚马逊云AWS经验,某AI助手的回复精准复刻其市场策略,涵盖底层逻辑、话术节奏和关键切入点。通过追问可进行竞争对手、产品及技术分析,辅助摸清整个销售战场,有效提升策略制定效率。
- 日榜
- 周榜
- 月榜
热点快看
