百万上下文仍未取代RAG的核心地位
每次基础模型能力升级,总有人断言:RAG(检索增强生成)技术即将被淘汰。 然而事实是,截至目前,这类预测从未成真。 以今年2月为例,首批百万上下文长度模型亮相时,就有声音称KV缓存将取代RAG。 随后大模型Agent热度持续上升,又有人讨论十年内以嵌入为核心的RAG将走到尽头。 十年跨度过长,当下确
每次基础模型能力升级,总有人断言:RAG(检索增强生成)技术即将被淘汰。
然而事实是,截至目前,这类预测从未成真。
以今年2月为例,首批百万上下文长度模型亮相时,就有声音称KV缓存将取代RAG。

随后大模型Agent热度持续上升,又有人讨论十年内以嵌入为核心的RAG将走到尽头。

十年跨度过长,当下确实难以定论。
不过,关于RAG在未来产业中的定位,业内已有许多积极布局:
产业层面,英伟达等巨头亲自下场,挖掘RAG的真正价值。
学术前沿,Agent与RAG的融合,正成为越来越多研究者关注的热点。
为什么会出现这一趋势?
当大模型从实验室走向工厂车间、企业办公楼、教育课堂、金融后台、数据中心机房时,它真正需要的远不止语言理解与生成能力——它必须能“读懂”企业海量且持续更新的数据资产。
训练本身昂贵且缓慢,大模型难以频繁更新,但企业的知识和数据却日新月异。
RAG恰好扮演了连接企业数据与大模型的数据枢纽角色。而将数据接入AI,正是大模型时代最核心的命题——
它让大模型能实时获取最新、最贴合业务场景的知识,使AI真正成为能干实事、有头脑的行业助手。
换个角度看,RAG正在为各行各业的大模型落地铺平道路。
接下来,我们看看教育、制造、金融三个行业的实践者,他们如何将RAG落地。
教育业,需要灵活敏捷的知识迭代
先说教育行业。这一领域最大的特点是知识更新迭代需求极为迫切。
常见场景是:教研资料、题库、学科内容频繁变动,仅靠训练底层模型根本跟不上教学信息更新的节奏。而且学生提问范围广、表述不标准,传统关键词检索方案完全行不通。
此时,RAG成为低成本、高灵活性、缓解大模型幻觉问题的最佳选择。
因此,行业通用做法是利用RAG开发框架打造智能助手,将海量课程、试题资源的数据价值充分发挥,快速准确回答学生提问,提升在线教学效果,同时降低人力成本。
有一家教企最初尝试了开源RAG方案,但效果不佳,搭建过程也相当烦琐。
后来在腾讯云团队协助下,该教企基于腾讯云向量数据库优化了RAG方案,最终在复杂、多样、动态的知识库中实现了高效检索。
过程中一个处理“QA对”数据的难题让工程师印象深刻:
起初语义分析效果不好,经常将多个QA对拆解开,导致问A问题却得到B答案。
后来与腾讯云团队共同讨论出解决方案:通过定制化逻辑修正文本拆分偏差,最终获得精准检索结果。
这使得教企无需频繁更新大模型本身,就能让大模型实时获取最新教研资料,向用户提供可信、更新及时的答案。
看到大量客户有RAG应用开发需求,腾讯云向量数据库还推出了AI套件功能:一站式文档检索解决方案,用户可直接上传原始文档,几分钟内快速构建专属知识库,极大提升了知识接入效率。
合作中,客户对腾讯云技术支持的快速响应和产品迭代能力评价极高,体现了其技术实力与灵活性。
过去可能需要几十分钟甚至更长的查询时间,如今只需秒级响应。
在教育场景里,RAG与向量数据库的结合,不仅提升了检索效率,更让企业积累的教育资源释放了价值,为学生和老师带来了更高质量的智能化学习体验。
制造业,需要标准化实现流程提效与人才培养
相比教育行业,制造业要复杂得多。
这里有数量庞大的技术标准、设计资料、工程图纸,以及各种文档格式和数据来源——电子档、扫描件、表格、图片、CAD文档……
这些文档往往分散在各个系统、部门和节点,查找、核对和更新的成本都很高。工程师培养周期长达3-5年,技术标准又不断迭代,一旦生产出现问题,要快速定位解决方案,简直就是“大海捞针”。
RAG能帮助大模型整合行业知识,但首先要解决电器行业文档多、内容复杂、图文表混排的问题。光有向量数据库和开发接口还不够,还需要整合端到端的产品和服务。
腾讯云大模型知识引擎,是一个基于大语言模型的知识应用开发平台,提供知识问答、知识总结等应用模板和原子能力,帮助企业低门槛构建企业级知识服务。它能让大模型回答常规问题,但若要服务垂直专业领域,单纯靠它来保证知识深度和时效性可能不够。
腾讯云大模型知识引擎帮助万榕信息打造了一个系统,让工程师能从原始文档中快速获取标准和最佳实践。过去要花半天翻阅标准合同、设计资料,现在几分钟就能定位信息;碰到南网高海拔产品设计标准、断路器事故处理这类棘手问题,AI助手会根据RAG动态检索企业内部知识库,归纳处理意见,并生成报告初稿。
以前这个流程高度依赖资深工程师的个人经验,如今RAG让知识可以系统化传承、动态更新和快速分享。这不仅将新人工程师的上手周期从1.5年缩短到6-8个月,还直接提升了整体工作效率——在人员不变的情况下,目标是提高40%。
RAG在制造业带来的,是效率、成本和人才培育模式的全方位变革。
金融业,要提效、要敏捷,但更重要的是安全!
金融科技是一个极其看重合规、安全和隐私的行业。
招商证券作为金融行业龙头企业,正在全面拥抱AI,自上而下推进数字化转型。他们将“AI编程助手”作为AI技术应用的重要切入点,主要原因是:
技术成熟度:AI编程这一场景足够成熟,能解决研发人员日常开发中的效率问题。
明确的业务价值:AI工具的引入能快速带来效率提升,收益明显且可量化。
在这种背景下,简单的RAG方案远远不够,需要大模型、产品、基础设施等全面整合,提供私有化部署方案。
腾讯云AI代码助手提供了产品基础能力和开放式架构,为招商证券打造了智能化的金融科技研发工具。
腾讯云基于内部经验开发AI代码助手,通过插件形式解决开发痛点,为企业和团队提供效率提升的解决方案,同时注重灵活部署和行业需求适配。
依托腾讯云的技术方案,招商证券实现了工具集成、数据安全和隐私保护,解决了金融业在AI应用落地中“好用不好管”的难题,让AI代码助手切实提升了研发效率,满足了日益增长的业务和监管要求。
双方的合作甚至深入到产品之外:在推广AI代码助手的过程中,招商证券和腾讯云都面临了技术变革和习惯转型的挑战。
参考腾讯云内部推广AI代码助手的经验,招商证券的推广分两个阶段:第一阶段通过主动推广取得初步成效;第二阶段打造体系化的推广运营机制,让开发者自发接受并使用AI工具。
目前,招商证券已有超过一千名开发人员使用AI代码助手,日活跃人数达到300,代码采纳率接近20%。
招商证券希望AI代码助手能扩展到更多垂直领域,比如量化交易、模型定价、分析师等业务人员,覆盖更广泛的代码应用场景。
为什么是腾讯云?
其实,上述三个案例均来自AICon全球人工智能大会《Techo Day-RAG应用与实践》专场。各行业技术大咖在现场交流分享了探索RAG解决大模型幻觉的创新策略和实战经验。
我们注意到,这些行业成功案例背后,都有同一个身影——腾讯云。
比如前面那家教企,业务初期尝试开源方案未成功,转而与腾讯云团队合作解决了语义分析中问题拆分错误等难题。
但为什么是腾讯云?
为了回答这个问题,我们也请到了腾讯云数据库副总经理罗云分享他的看法:
一是长期技术积累和内部验证。
腾讯云向量数据库在腾讯内部已广泛使用,包括腾讯视频的版权与合规检索这类严苛场景,早已成熟运转。
从2019年开始持续研发,为满足深度神经网络和向量检索融合的业务需求,腾讯云不断打磨向量数据库,并在实践中推动了存储与计算分离架构的落地。
这些技术和经验,让腾讯云在面对多样化、复杂化的客户需求时,能够快速响应、持续改进。
二是丰富的服务生态与快速迭代能力。
那家教企在实现车辆安全相关QA问题时,需要定制化处理拆分逻辑——腾讯云团队快速介入、灵活解决。
万榕信息需要处理从标准文档到扫描件的多模态数据,腾讯云知识引擎也能给出针对性方案。
对于招商证券这种高度合规与高定制的场景,腾讯云则提供了从基础数据库、到私有化部署与产品级能力的一整套方案。
总结而言,稳定性和灵活性并存的RAG能力,在大模型加速落地的关键阶段,尤为可贵。
未来,随着产业对AI要求的不断升级,RAG本身也会持续演进。技术创新将进一步提高检索效率、提升多模态数据处理能力、降低用户使用门槛;更多场景将在RAG的赋能下实现智能化转型。
因此,现在断言RAG过时,还为时过早。RAG不仅不会消亡,反而会随着大模型技术的深度落地,变得越来越重要。
在下一阶段的AI竞争中,谁能把大模型“用起来”、让数据“用得其所”、让业务“跑得更快”,谁就能在产业智能的浪潮中占得先机。
你是一名 AI 行业编辑,请围绕下面这条热点输出一份资讯解读:
热点:百万上下文仍未取代RAG的核心地位要求:
1. 先用一句话解释这条热点在讲什么
2. 再总结它为什么重要
3. 说明会影响哪些 AI 产品或内容方向
4. 最后给出 3 个适合资讯站使用的标题
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
相关热点提示词结构可能诱导模型犯错,需设计3秒内引发共鸣的钩子。通过真实痛点反推、嫁接高频搜索词、暴露隐藏成本或反常识断言制造张力,并在句末给出零成本验证动作,如复制特定指令测试效果。
从输入约束、结构隔离到输出校验三步系统性拦截FigmaAI幻觉:用结构化Prompt锁死核心意图,通过NodeWalker清理干扰图层,生成后立即启动CheckDesign反向校验,并辅以Slots插槽控制内容增删及Alpha通道剥离背景装饰,可有效避免设计稿跑偏。
启用端到端加密、按部门隔离AI知识库权限、关闭AI记忆与再训练、锁定共享文件夹操作权限,这四项硬性设置能够确保夸克AI在处理敏感数据时,在数据输入、处理、存储全流程中不泄露、不丢失、不被模型学习,严格保障数据安全。
Mac版WorkBuddy卸载后重装失败,多因残留文件未彻底清除。正确彻底卸载需:先强制退出程序,再删除主程序,接着手动清理ApplicationSupport、Preferences、Caches三个路径下的残留,然后移除LaunchAgent后台服务启动项,并验证是否存在隐藏残留文件,最后使用AppCleaner进行扫描清理作为兜底措施。
- 日榜
- 周榜
- 月榜
热点快看
