天学会AI应用开发第十篇:文本嵌入模型替换国产模型
在前两篇文章演示RAG功能时,我们使用的文本嵌入模型一直是国外的 all-MiniLM-L6-v2。这款模型在英文任务上表现出色,但面对中文场景——虽然能用,细节处理却总是差强人意。例如,专业词汇的边界判断不够精准,同义表达的匹配精度也不够稳定,偶尔会带来一些“似是而非”的错误。今天,我们来聊聊如何替换为国产离线文本嵌入模型,看看在实际应用中,国产模型究竟能带来多大的提升。

一、all-MiniLM-L6-v2 的局限性
先别急着否定 all-MiniLM-L6-v2,它确实有不少亮点:体积仅几十MB,便于本地离线下载;运行速度极快,无需显卡,CPU即可胜任;通用性强,英文场景表现优秀,中文日常RAG也能应付;兼容主流向量库——FAISS、Chroma、Milvus都能无缝接入。但它的短板同样明显:对中文语义的理解能力一般,有时检索结果与正确答案之间仿佛隔着一层薄纱。
举个例子,在之前的《15天学会AI应用开发(八)使用向量数据库实现RAG功能》一文中,我们运行过一段测试代码。当时输入的问题是“RAG是什么”,输出结果如下:
=== 本地智能 RAG 系统:问什么答什么 ===
请输入问题(q退出):RAG是什么
问题:RAG是什么
答案:RAG让大模型能引用外部知识,避免胡说八道。
--------------------------------------------------
而原始知识库的内容是:
"什么是AI:人工智能(AI)是一门使机器模拟人类智能的技术。",
"什么是RAG:RAG代表检索增强生成,通过检索外部知识提升大模型回答准确性。",
"本地RAG消耗Token吗:本地RAG不调用云端API,不消耗Token,完全免费。",
"FAISS是什么:FAISS是Facebook开源的向量检索库,用于本地高效检索。",
"RAG的作用:RAG让大模型能引用外部知识,避免胡说八道。"
发现问题了吗?“RAG是什么”的正确答案应该是第二条知识(RAG代表检索增强生成……),但 all-MiniLM-L6-v2 却把最后一条知识(RAG让大模型能引用外部知识……)当成了答案。虽然两条都与RAG相关,但语义精度存在明显偏差。对于专业中文场景下的RAG应用,替换为国产模型是一个更可靠的选择——例如 BGE-small、BGE-base、Qwen-Embedding 等。
二、下载中文嵌入模型 BGE-small
我们先以 BGE-small 为例。它的模型页面位于 ModelScope,模型文件大小约192.25MB。下载前需要先安装 modelscope 库:
pip install modelscope
接着,通过 cd 命令进入 Python 工程目录,执行下载命令:
modelscope download --model BAAI/bge-small-zh-v1.5 --local_dir bge-small-zh-v1.5
这里的 --model 参数指定模型名称,--local_dir 指定本地保存目录。下载完成后,工程目录下会出现 bge-small-zh-v1.5 文件夹,里面包含完整的模型文件。
三、结合 BGE-small 与 FAISS 实现 RAG
接下来,演示如何利用 BGE-small 和 FAISS 搭建 RAG 检索系统。开始编码前,先安装两个依赖:
pip install faiss-cpu sentence-transformers
然后编写代码。与之前教程的代码相比,只有一行改动——将模型路径从 all-MiniLM-L6-v2 改为 bge-small-zh-v1.5:
from sentence_transformers import SentenceTransformer
import faiss
import numpy as np
# ===================== 你的知识库(完全不变) =====================
knowledge = [
"什么是AI:人工智能(AI)是一门使机器模拟人类智能的技术。",
"什么是RAG:RAG代表检索增强生成,通过检索外部知识提升大模型回答准确性。",
"本地RAG消耗Token吗:本地RAG不调用云端API,不消耗Token,完全免费。",
"FAISS是什么:FAISS是Facebook开源的向量检索库,用于本地高效检索。",
"RAG的作用:RAG让大模型能引用外部知识,避免胡说八道。"
]
# ===================== 加载你本地已有的模型(不变) =====================
embed_model = SentenceTransformer("./bge-small-zh-v1.5", device="cpu")
# 生成向量(把知识库向量化)
vectors = embed_model.encode(knowledge)
# 构建 FAISS 索引
index = faiss.IndexFlatL2(vectors.shape[1])
index.add(np.array(vectors).astype("float32"))
# ===================== RAG 检索(逻辑不变) =====================
def rag(question):
print("\n 问题:" + question)
# 把问题向量化
q_vec = embed_model.encode([question])
# 从 FAISS 检索对应的知识
D, I = index.search(np.array(q_vec).astype("float32"), 1)
best = knowledge[I[0][0]]
answer = best.split(":")[-1]
print(" 答案:" + answer)
print("-" * 50)
# ===================== 运行 =====================
if __name__ == "__main__":
print("=== 本地智能 RAG 系统:问什么答什么 ===")
while True:
q = input("\n请输入问题(q退出):")
if q.lower() == "q":
break
rag(q)
运行一下看看效果。先问“RAG是什么?”,再问“RAG有哪些作用?”,输出如下:
=== 本地智能 RAG 系统:问什么答什么 ===
请输入问题(q退出):RAG是什么?
问题:RAG是什么?
答案:RAG代表检索增强生成,通过检索外部知识提升大模型回答准确性。
--------------------------------------------------
请输入问题(q退出):RAG有哪些作用?
问题:RAG有哪些作用?
答案:RAG让大模型能引用外部知识,避免胡说八道。
--------------------------------------------------
结果非常清晰:问“RAG是什么”时,BGE-small 准确返回了第二条知识;问“RAG有哪些作用”时,也正确匹配了最后一条知识。对比之前 all-MiniLM-L6-v2 的翻车表现,国产模型在中文语义理解上的优势立竿见影。
本系列的AI应用开发文章目录为《15天学会AI应用开发全目录(零基础小白,零Token消耗)》。
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
内网RPA离线部署从依赖打包到7×24无人值守踩坑与避坑方案
这三年,内网RPA项目接了不下二十个。每次开局都像闯关——断网、缺依赖、多机同步、定时执行、批量分发、源码保护、AI离线化,八个坑一个比一个深。今天把这些实战经验整理出来,希望能帮正在内网搞自动化的兄弟们少踩点雷。 一、内网无网络环境怎么部署RPA流程:先搞清楚什么叫“真离线” 很多工具宣传“支持本
水利工程师用WorkBuddy写洪水报告效率提升3倍
WorkBuddy开发者分享季 水利工程师AI提效实战:用WorkBuddy撰写洪水影响评价报告,效率提升3倍 WorkBuddy 效率 人工智能 开发工具 一、我是谁,为什么需要AI 先介绍一下自己——我是一名水利工程师,在湖南长沙的一家小型水利设计公司任职。当前行业环境不太
日志服务数据加工规则洞察仪表盘使用指南
数据加工诊断仪表盘 想实时掌握日志服务加工功能的运行状态?直接从加工列表页点击那个“规则洞察”按钮,仪表盘就会立刻呈现出来。入口就在那儿,不绕弯子。 跳转后,你可以按作业名称、实例ID或源LogStore来筛选任务状态。比如下边这张图,展示的是当前实例ID(90c9d47714dbb807d47c1
基于RFID的固定资产管理系统技术架构与工程实践
固定资产管理难题是众多企事业单位的普遍困扰,资产数量动辄数千件,且广泛分布于不同部门、楼层乃至园区。传统人工盘点方式在工程维度上始终面临三大关键瓶颈:采集效率低下、数据闭环中断、状态同步滞后。使用条码枪逐一扫描标签,识别距离通常不超过30厘米,操作人员需逐个寻找并扫描,盘点效率完全受限于人力。面对5
WorkBuddy实战用AI搭建A股智能盯盘助手省心高效
炒股的朋友们想必都深有体会——每天重复盯盘、查行情、分析板块轮动,这一整套流程下来耗费大量精力。手动翻查数据不仅身心俱疲,还很容易错过关键买卖节点。今天我们就来聊聊如何打造一款趁手的盯盘工具,借助AI替你分担这些重复性工作。 背景:盯盘的核心痛点 股民都有同感——每天不只要查询单只股票的实时行情,还
- 日榜
- 周榜
- 月榜
1
2
3
4
5
6
7
8
9
10
1
2
3
4
5
6
7
8
9
10
1
2
3
4
5
6
7
8
9
10
相关攻略
2026-07-02 12:28
2026-07-02 12:27
2026-07-02 12:27
2026-07-02 12:27
2026-07-02 12:27
2026-07-02 12:27
2026-07-02 12:26
2026-07-02 12:26
热门教程
- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程
热门话题

