面包屑图标 当前位置: 首页
AI资讯
热点详情

Dify知识库增强检索案例分享与实战应用详解

AI热点日报
AI热点日报时间:2026-07-02
热点解读

RAG通过知识库检索、增强上下文与生成技术,解决大模型幻觉和知识陈旧问题。在Dify中配置向量模型和重排模型后,可创建知识库并在AIAgent或工作流中实现增强检索,提升回答准确性与时效性。

RAG(检索增强生成)这个概念,说白了,就是给大语言模型配了个“外设知识库”。它通过动态调用外部数据,让模型回答更准、更新、更靠谱,有效解决了大模型满嘴跑火车(即“幻觉”)和知识陈旧的问题。下面我们先拆解一下它的核心。

技术原理与流程

RAG的工作流程很清晰,拆开来看就是三步走:

  1. 检索(Retrieval):根据用户的问题,从一个事先建好的知识库(比如用向量数据库)里,把相关的文档片段捞出来。这就像汽车客服系统里存了车型参数手册,你的问题来了,它就去手册里找最匹配的章节。
  2. 增强(Augmentation):把检索到的信息作为上下文,和原始问题打包,一起喂给生成模型。这一步相当于给模型的“记忆”做了个外部扩展,让它能基于最新、最专有的数据来思考。比如在医疗诊断中,RAG可以实时拉取最新的医学论文,帮助生成诊断建议。
  3. 生成(Generation):大语言模型结合上下文和问题,生成最终的回答。因为有检索到的事实信息兜底,模型输出不仅准确率大增,胡编乱造的概率也大幅降低。企业客服就是靠这个,一边引用内部文档生成合规回答,一边还能防止敏感数据外泄。

核心优势

那么,这套“外设”到底好在哪?几个核心优势很明显:

  • 知识时效性:大模型训练数据有截止日期,但RAG可以动态调用外部知识库,实时抓取新闻、政策更新等,确保信息不过时。
  • 领域适应性:通过定制一个专属知识库,比如法律条文库或医疗指南库,就能让通用的“万金油”模型,快速变成某个垂直领域的专家。
  • 减少幻觉:回答是基于检索到的事实生成的,这从根本上降低了模型胡言乱语的风险,可信度自然就上去了。
  • 成本效益:想扩展模型的知识范围?不用重新训练它,代价高昂的算力和时间成本都能省下来。

应用场景

道理讲完了,看看RAG在实际中都能干些什么:

  • 智能客服:对接企业知识库,精准回答产品故障、政策咨询等问题。
  • 医疗诊断:整合医学文献和患者数据,辅助医生做决策。
  • 金融分析:调用实时市场数据生成投资报告,保证信息时效性。
  • 教育问答:基于教材和学术资源,生成知识点解析。

之前一直没详细讲Dify的知识库检索,说实话,Dify在这块以前做得一般,跟同类的RAG方案比相对弱一些。考虑到这块知识确实有缺口,今天就来补上,重点看看在Dify的AI Agent和工作流里,怎么用好知识库。

先看AI Agent里的知识库检索。

通过知识库检索到视频地址,我们打开验证,发现地址是对的。

接下来看看Dify知识库工作流。

这个工作流检索的是《清华大学第一弹:DeepSeek从入门到精通.pdf》这份文档。

通过这两个案例,我们可以看到如何用Dify实现知识库增强检索。下面,我们逐一拆解。

2. 模型配置

关于模型配置,之前发现有些小伙伴对大语言模型、向量模型和重排模型的关系还有点懵。这里我们就重点演示一下后两者的配置。

什么是向量模型

向量模型是一种数学模型,它的核心是把文本、图片等数据“翻译”成一个高维空间里的向量,方便计算机去做分析和计算。在RAG的语境下,它的任务就是把知识库里的文档转成向量。

简单来说,我们需要先对知识库文本做向量化,这样后续才能做相似度检索。相似度越高,检索出来的内容就越精准。比如我们输入“Deepseek能够做什么?”,我们希望模型是基于知识库里的内容来回答,而不是胡诌。所以,我们得先把这句话也转成向量,再到向量化的知识库里做相似度匹配。匹配上最相关的上下文后,再发给大模型总结并返回给用户。这样一来,我们收到的信息就跟知识库里的内容高度相关了。

在Dify的模型厂商设置里,我们需要添加支持 TEXT EMBEDDING 的模型。以“标准OpenAI-API-compatible”为例来演示。

添加这一步完成后,Dify就有了向量模型。目前硅基流动、阿里、智谱、火山引擎、gitee ai都支持,国外的OpenAI、OpenRouter也有。只要模型中带有TEXT EMBEDDING字样,就表示支持向量化。

什么是Rerank 模型

Rerank模型,也叫重排模型。它的作用是“二次优化”。为什么要用它?因为向量模型检索总有不那么准的时候,特别是当文档内容高度相似时,排在第一位的很可能不是我们最想要的答案。

这时候,就需要Rerank模型出场了。它会对第一次检索出来的相似结果进行重新评分和排序,让最相关的内容优先展示,从而提升查询的准确性。当然,这俩模型组合起来也解决不了所有知识库的准确性问题,这里就先不展开了。

同样,我们以“标准OpenAI-API-compatible”为例,选择Rerank类型。

上面提到的那些模型厂商也都提供Rerank模型。具体怎么找呢?以硅基流动的模型市场为例。

进入硅基流动,选择“嵌入和重排”。

这里会显示出嵌入模型(也就是向量模型)和重排模型,大部分是免费的。大家可以根据自己的需求选择。免费模型一般会有限速,追求稳定的话,可以选收费的Pro模型。这两个模型对Token的消耗非常低,10块钱能用很久。

以上两个模型在Dify里设置好后,最好在“系统模型”里优先选定,方便后续使用。

模型配置完成后,我们就可以开始创建知识库了。

3. 知识库创建

点击Dify最上方的“知识库”,然后“创建知识库”。

进入创建页面后,选择数据源。目前支持三种方式:1. 导入已有文本、2. 同步自Notion内容、3. 同步自Web站点。因为我们导入的是私有化知识,所以选“导入已有文本”。支持的格式很丰富,包括TXT、Markdown、PDF、Excel、Word等。

选择文件后,点击下一步。

接下来会出现“文本分段与清洗”的设置界面。这里可以配置:

  • 分段设置:可以选择自动分段和清洗,也可以自定义。
  • 索引方式:有高质量、经济型、以及采用Q&A分段模式。
  • Embedding 模型:选择之前系统设定好的向量模型。
  • Rerank 模型:可以开启或关闭。
  • 检索设置:包括向量检索、全文检索、混合检索。Dify新增的“父子检索”其实就是混合检索,效果会更好。如果不熟悉,点默认设置就行。

设置完成后,点击“保存并处理”。

当画面出现“嵌入完成”,就表示文档向量化成功了,知识库已经就绪。

4. AI Agent 知识库

回到工作室,点击“创建空白页面”,选择“Agent”,给它起个名字。

进入AI Agent的配置页面。

这里我们需要用到知识库,所以在“上下文”里添加我们刚建好的知识库。

添加完成后,就可以针对这个知识库进行对话了。

5. 知识库工作流

工作流搭建

回到工作室,点击“创建空白页面”,选择“Chatflow”,给它起个名字。

进入工作流编辑界面,我们可以在大语言模型节点中间添加一个“知识检索”节点。

打开知识检索节点,点击“知识库”添加我们刚建好的知识库。

添加完成后,下一个节点我们对接大语言模型(LLM)。

在LLM节点的“上下文”中,选择“知识检索”的 `result` 输出。

在“系统提示词”里,输入类似这样的提示词:

请根据文本内容{{#context#}}回答

其他设置可以保持默认,最后连接一个“直接回复”节点。

这样,一个简单的知识库工作流就搭建完成了。这个工作流相对简单,主要是为了演示知识库的原理和知识检索工作流组件的用法。其他组件的用法,可以参考之前的文章,这里就不展开了。

工作流测试

通过以上两种方式,我们完成了知识库在Dify中的两种主要用法:AI Agent和工作流。

热点追踪提示词
你是一名 AI 行业编辑,请围绕下面这条热点输出一份资讯解读:
热点:Dify知识库增强检索案例分享与实战应用详解要求:
1. 先用一句话解释这条热点在讲什么
2. 再总结它为什么重要
3. 说明会影响哪些 AI 产品或内容方向
4. 最后给出 3 个适合资讯站使用的标题
来源:https://www.53ai.com/news/RAG/2025030497628.html
ai 人工智能

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关热点
AI热点2026-07-04 09:10
小米MiMo-V2系列模型2026年6月30日下线,Pro版已自动切换至V2.5

小米MiMo开放平台宣布,MiMo-V2系列的四款模型将于2026年6月30日正式下线,平台已推动开发者向V2 5系列迁移。具体涉及mimo-v2-pro、mimo-v2-omni、mimo-v2-flash和mimo-v2-tts模型。平台设置了系统替换时间作为缓冲:pro和omni模型于2026

AI热点2026-07-04 09:10
款长安猎手K50重庆车展上市14.19万起

2026重庆车展上,2026款长安猎手K50正式上市,共推出10款车型,售价14 19万至17 89万元。新车主要针对续航、电池和动力进行升级,搭载2 0T增程系统与双电机,纯电续航超180公里,快充仅需16分钟。全系标配30kW外放电功能,储备电量达239kWh,并新增山地与涉水模式,提升通过性。

AI热点2026-07-04 09:10
上期所与普陀区签战略协议深化金融区域联动

上海期货交易所与上海市普陀区人民政府于6月12日签署战略合作协议,旨在建立长期共赢的合作机制,共同服务上海国际金融中心与国际贸易中心的联动发展。双方高层领导均出席签约仪式,彰显了对此次合作的高度重视。协议聚焦于发挥期货市场专业资源与区域发展综合优势,深化务实合作,探索金融创新与实体经济深度融合,以期

AI热点2026-07-04 09:09
世纪华通平价大宗交易成交757万股 金额1.09亿元

6月12日,世纪华通发生一笔大宗交易,以每股14 37元的价格成交757 24万股,成交总额为1 09亿元。值得注意的是,该成交价与当日市场收盘价持平,属于平价交易。此次交易额占该股当日总成交额的1 51%。市场分析认为,平价成交反映了买卖双方对当前股价水平的共识,交易行为相对平稳,未对市场预期造成

延伸阅读