Ollama与RAGflow打造私有知识库实战教程
想要在本地运行大语言模型,又不想折腾复杂的配置?Ollama 正是为此而生的便捷工具。下面我们将一步步介绍它的安装方法、常见用法,以及如何配合 RAGFlow 搭建一个带知识库的智能问答系统。 1 Ollama 简介 Ollama 是一个能够在本地设备上运行大语言模型的工具平台,让你完全摆脱对云服
想要在本地运行大语言模型,又不想折腾复杂的配置?Ollama 正是为此而生的便捷工具。下面我们将一步步介绍它的安装方法、常见用法,以及如何配合 RAGFlow 搭建一个带知识库的智能问答系统。
1. Ollama 简介
Ollama 是一个能够在本地设备上运行大语言模型的工具平台,让你完全摆脱对云服务的依赖。它支持多种主流开源模型,并提供简洁直观的命令行接口,对开发者与企业用户都非常友好——无需担心云服务成本、数据隐私安全,直接在个人电脑上就能流畅体验各类大模型。
安装 Ollama
首先前往 Ollama 官方站点下载对应操作系统的安装包,按照安装向导一步步操作即可完成部署。
启动 Ollama
在 Windows 系统中,只需在搜索框中输入“ollama”,找到应用程序后点击启动即可。
Ollama 命令介绍
Ollama 提供的命令虽然不多,但却涵盖了日常使用所需的核心功能,下表列出了所有可用的命令选项:
Usage: ollama [flags] ollama [command] A vailable Commands: serve 启动 Ollama 服务 create 从 Modelfile 创建一个模型 show 查看模型详细信息 run 运行一个模型 stop 停止正在运行的模型 pull 从注册表拉取一个模型 push 将一个模型推送到注册表 list 列出所有可用的模型 ps 列出当前正在运行的模型 cp 复制一个模型 rm 删除一个模型 help 获取关于任何命令的帮助信息 Flags: -h, --help help for ollama -v, --version Show version information
拉取模型并运行
以 deepseek 模型为例,使用 ollama pull deepseek-r1:14b 命令即可将模型下载到本地。
1. 选择模型
2. 搜索你需要的模型:例如 deepseek、qwen 等
3. 选定具体模型
1. 选择模型大小
2. 复制下载指令,替换为下面的命令,并在终端中执行
ollama pull deepseek-r1:14b
运行模型并进入交互对话,加上 --verbose 参数可以查看 token 消耗等信息:
ollama run deepseek-r1:14b --verbose
终端会显示资源占用情况;如需退出对话,输入:
/bye
运行 Ollama 远程服务
ENV OLLAMA_HOST=0.0.0.0:11434 ollama serve
2. RAGFlow 简介
RAGFlow 是一款基于深度文档理解构建的开源 RAG 引擎。它的核心价值在于:能够将企业内部各种复杂格式的文档接入系统,再结合大语言模型,提供有据可查的精准问答能力。适用于智能客服、文档生成、数据分析等场景——简单来说,就是让大模型能够理解你提供的资料,并基于这些内容回答问题,而不是凭空编造。
RAGFlow 的安装和部署
前置条件
- CPU ≥ 4 cores (x86);
- RAM ≥ 16 GB;
- Disk ≥ 50 GB;
- Docker ≥ 24.0.0 & Docker Compose ≥ v2.26.1。
如果你尚未在本地安装 Docker(Windows、Mac 或 Linux),请参考官方文档 Install Docker Engine 自行完成安装。
启动服务器
确保
vm.max_map_count不小于 262144:如需查看当前
vm.max_map_count的值:$ sysctl vm.max_map_count
如果该值小于 262144,可执行以下命令进行重置:
# 这里我们设为 262144: $ sudo sysctl -w vm.max_map_count=262144
注意:该更改会在系统重启后失效。若需永久生效,还需在 /etc/sysctl.conf 文件中添加或更新以下配置:
vm.max_map_count=262144
克隆仓库:
$ git clone https://github.com/infiniflow/ragflow.git
进入 docker 目录,利用预编译好的 Docker 镜像启动服务器:
在运行
docker compose启动服务之前,请先修改 docker/.env 文件中的RAGFLOW_IMAGE变量。例如,设置RAGFLOW_IMAGE=infiniflow/ragflow:v0.16.0可以下载 RAGFlow 镜像的v0.16.0完整发行版。镜像体积较大,请确保磁盘有足够空间。另外,下载 Docker 镜像需要自行配置科学上网方式,否则可能无法成功拉取部分镜像。
$ cd ragflow $ docker compose -f docker/docker-compose-CN.yml up -d
启动成功后,可通过以下命令确认服务器状态:
$ docker logs -f ragflow-server
出现以下界面提示说明服务器正常运行:
____ ___ ______ ______ __ / __ / | / ____// ____// /____ _ __ / /_/ // /| | / / __ / /_ / // __ | | /| / / / _, _// ___ |/ /_/ // __/ / // /_/ /| |/ |/ / /_/ |_|/_/ |_|____//_/ /_/ ____/ |__/|__/ * Running on all addresses (0.0.0.0) * Running on http://127.0.0.1:9380 * Running on http://x.x.x.x:9380 INFO:werkzeug:Press CTRL+C to quit如果跳过系统确认步骤直接登录 RAGFlow,浏览器可能提示
network anormal或网络异常,这通常是因为 RAGFlow 尚未完全启动就绪。在浏览器中输入你服务器的 IP 地址并登录 RAGFlow。
以上述示例为例,只需访问 http://IP_OF_YOUR_MACHINE 即可:若未修改配置,默认 HTTP 服务端口为 80,无需额外输入端口号。
注册登录
在初始界面完成注册后登录,即可进入如下主页面。
配置 Ollama 连接大模型
首先配置模型:点击右上角头像,选择“模型提供商”。
在 RagFlow 中配置 Ollama 连接。注意:由于 RagFlow 运行在 Docker 容器内,请求本地部署的 Ollama 时需使用地址
host.docker.internal:11434;如果 Docker 部署在其他局域网服务器上,则直接填写对应局域网 IP 地址,如http://局域网ip:11434。
1. 选择模型提供商
2. 选择 ollama
通过以下命令获取 Ollama 模型列表:
ollama list
最终填写信息如下:
创建知识库
接下来即可创建自己的知识库。
1. 选择知识库
2. 创建知识库
输入知识库名称
配置知识库属性
1 选择文档语言
2 如果下载的是全量 RAGFlow 镜像,会自带嵌入模型,可按图中所示进行选择;此外,也可以添加自定义的嵌入模型,添加方式同之前的模型提供商设置。
其他选项根据自身需求自行调整,操作非常直观。
添加私有文档
1. 选择数据集
2. 点击新建文件
3. 上传本地文档
查看文档解析状态,出现如下提示即说明文档解析完成。
开启聊天
现在到了展示成果的时刻,你可以基于创建的知识库与模型进行自然语言交互。
1. 选择聊天
2. 创建聊天助理
3. 填写助理名称:例如 张三
4. 选择刚才创建的知识库
配置聊天模型:请注意,在聊天配置中务必将 token 上限设置得大一些,否则回复内容会非常简短!建议直接拉到最大值。然后新建一个对话。
数据验证:上面上传的文档是 PDD 的财务报表,截图显示聊天内容成功召回了文档中的相关数据。
Agent 功能:RAGFlow 同样支持 Agent 功能,后续可进一步探索。
你是一名 AI 行业编辑,请围绕下面这条热点输出一份资讯解读:
热点:Ollama与RAGflow打造私有知识库实战教程要求:
1. 先用一句话解释这条热点在讲什么
2. 再总结它为什么重要
3. 说明会影响哪些 AI 产品或内容方向
4. 最后给出 3 个适合资讯站使用的标题
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
相关热点在 Degiro 上进行投资的用户,常常会遇到一个共同的痛点:平台自带的数据展示较为基础,若想获取更深入的投资组合分析、风险指标,甚至对未来走势做出预测,通常只能借助 Excel 手动处理。不过,现在有一款 Chrome 扩展程序可以完美解决这一难题——Mercury,专为 Degiro 用户量身打
在投资决策过程中,客观数据往往比主观直觉更值得信赖。名为Lorna的智能平台,运用独特的现金流分析体系,帮助投资者穿透虚饰的财务报表,直达企业真实的财务健康状况。 什么是Lorna?——数据驱动的现金流分析投资工具 简而言之,Lorna是一个以数据为核心驱动力的投资分析工具。其核心利器是独创的“现金
Front Street自动追踪你的每一笔消费,整合各类忠诚度计划,并提供财务洞察与省钱妙招——说白了,就是帮你把钱&包管得明明白白。 什么是Front Street? 简单讲,Front Street就是你的购物管家。它自动记录你在每个品牌、每家店的所有购买行为,然后把零散的忠诚度计划全部整合到一
在创投圈深耕多年,你会发现一个普遍难题:融资过程中,投资者关系维护、尽职调查、潜在投资人挖掘……这些环节往往耗费巨大精力,却又直接决定成败。如果能有一款工具将这些琐事自动化,让团队聚焦于真正重要的沟通与战略决策,那该多理想?Finta 正是为此而生。 什么是Finta? Finta 本质上是一款 A
- 日榜
- 周榜
- 月榜
热点快看
