面包屑图标 当前位置: 首页
AI资讯
热点详情

内网服务器离线安装与部署DeepSeek完整步骤指南

AI热点日报
AI热点日报时间:2026-07-04
热点解读

搞内网服务器离线部署DeepSeek这事儿,说白了就是跟Ollama打交道——先把Ollama装好、配好,再把模型文件塞进去。整个过程其实不复杂,但每一步都得踩对节奏。下面把完整流程拆开梳理一遍,从下载装包,到配置自启动,再到离线导入模型,全都串起来。 安装 Ollama Ollama 的官网地址是

搞内网服务器离线部署DeepSeek这事儿,说白了就是跟Ollama打交道——先把Ollama装好、配好,再把模型文件塞进去。整个过程其实不复杂,但每一步都得踩对节奏。下面把完整流程拆开梳理一遍,从下载装包,到配置自启动,再到离线导入模型,全都串起来。

内网服务器离线安装部署 DeepSeek

安装 Ollama

Ollama 的官网地址是 https://ollama.com/,但离线环境下用不着它,咱们直接拿二进制文件搞定。

1. 安装

如果服务器有网,一行命令就能搞定:

curl -fsSL https://ollama.com/install.sh | sh

但既然要离线部署,更靠谱的办法是用二进制包。先下载压缩包,然后解压到系统目录:

curl -L https://ollama.com/download/ollama-linux-amd64.tgz -o ollama-linux-amd64.tgz
sudo tar -C /usr -xzf ollama-linux-amd64.tgz

需要提前下载好 ollama-linux-amd64.tgz 并传到内网服务器,或者直接从 GitHub 的 releases 页面搞下来。

2. 服务配置

2.1 启动服务

安装完成后,先手动启动一下看看能不能跑起来:

ollama serve

然后新开一个终端窗口,验证运行状态:

ollama -v

能正常输出版本号,说明服务没问题。

2.2 设置开机自启动服务

手动启动每次重启就没了,所以得注册一个 systemd 服务。创建一个服务文件 /etc/systemd/system/ollama.service,写入下面的配置:

[Unit]
Description=Ollama Service
After=network-online.target

[Service]
ExecStart=/usr/bin/ollama serve
User=ollama
Group=ollama
Restart=always
RestartSec=3
Environment="PATH=$PATH"

[Install]
WantedBy=default.target

这里有几个关键点需要说一下:

  • After=network-online.target 保证系统网络完全就绪之后再启动服务,防止依赖网络的功能跑不起来。
  • User=ollamaGroup=ollama 让服务以普通用户身份运行,避免直接使用 root 权限——前提是系统里已经创建了这个用户和组。
  • Restart=always 让服务崩溃后自动重启,RestartSec=3 则是重启前等3秒,防止频繁重启把系统搞垮。
  • Environment="PATH=$PATH" 显式传递系统环境变量,确保服务能找到可执行命令路径。

2.3 启动服务并设置开机自启动

让 systemd 重载配置,启用并启动服务:

sudo systemctl daemon-reload
sudo systemctl enable ollama
sudo systemctl start ollama
sudo systemctl status ollama

最后一条命令会输出运行状态,绿色 active (running) 就说明一切正常。

2.4 自定义安装,配置环境变量

有时候需要自定义路径或网络配置,可以用 systemctl edit ollama 打开一个覆盖配置文件,或者手动创建 /etc/systemd/system/ollama.service.d/override.conf,在里面添加环境变量:

[Service]
Environment="OLLAMA_HOST=0.0.0.0"
Environment="OLLAMA_MODELS=/home/xxxx/.ollama/models"
Environment="OLLAMA_KEEP_ALIVE=-1"

这里常用的环境变量整理了一下:

环境变量说明
OLLAMA_DEBUG显示额外的调试信息(例如 OLLAMA_DEBUG=1
OLLAMA_HOST指定 Ollama 服务器的 IP 地址(默认 127.0.0.1:11434
OLLAMA_KEEP_ALIVE模型在内存中保持加载状态的持续时间(默认 "5m"
OLLAMA_MAX_LOADED_MODELS每个 GPU 最大允许加载的模型数量
OLLAMA_MAX_QUEUE最大队列请求数
OLLAMA_MODELS模型存储目录的路径
OLLAMA_NUM_PARALLEL最大并行请求数
OLLAMA_NOPRUNE启动时不清理模型缓存
OLLAMA_ORIGINS允许的跨域来源列表(逗号分隔)
OLLAMA_SCHED_SPREAD始终在所有 GPU 上调度模型
OLLAMA_FLASH_ATTENTION启用 Flash Attention 加速
OLLAMA_KV_CACHE_TYPEK/V 缓存的量化类型(默认 f16
OLLAMA_LLM_LIBRARY手动指定 LLM 库以绕过自动检测
OLLAMA_GPU_OVERHEAD为每个 GPU 预留的显存空间(单位:字节)
OLLAMA_LOAD_TIMEOUT模型加载超时时间(默认 "5m"

2.5 ollama 命令

日常用到的命令不多,但了解一下总没坏处:

ollama serve   # 启动 ollama  
ollama create  # 从模型文件创建模型  
ollama show    # 显示模型信息  
ollama run     # 运行模型  
ollama pull    # 拉取模型  
ollama push    # 推送模型  
ollama list    # 列出模型  
ollama cp      # 复制模型  
ollama rm      # 删除模型  
ollama help    # 获取帮助信息

2.6 查看日志

如果服务运行不正常,最直接的排查办法就是翻日志:

journalctl -e -u ollama

2.7 卸载

真到了要清理干净的时候,按顺序执行:

sudo systemctl stop ollama
sudo systemctl disable ollama
sudo rm /etc/systemd/system/ollama.service

然后删除二进制文件(路径可能是 /usr/local/bin/usr/bin/bin):

sudo rm $(which ollama)

最后清理模型和用户数据:

sudo rm -r /usr/share/ollama
sudo userdel ollama
sudo groupdel ollama

安装 DeepSeek-R1

1. 在线安装

有网的情况下,最省事的办法是直接:

ollama run deepseek-r1

它会自动下载并运行模型。

2. 离线安装

离线环境就没那么方便了,得先在一台有网的电脑上把模型弄下来。执行:

ollama run deepseek-r1:1.5b

下载完成后,模型文件存在本地。如果下载速度慢,可以中止后重试,它会自动断点续传。这一步主要是为了在本地拿到模型的原始文件,并找出下载链接。

不同系统的默认存放路径:

WindowsC:\Users\%username%\.ollama\models
MacOS~/.ollama/models
Linux/usr/share/ollama/.ollama/models/home/%username%/.ollama/models

如果实在找不到具体位置,可以搜索拉取时产生的哈希字符。

2.1 保存 gguf 文件和 Modelfile

在模型目录里,按文件大小排序,最大的那个文件就是 .gguf 格式的模型文件。复制出来,重命名成 deepseek-r1-1.5b-local.gguf

接着执行:

ollama show deepseek-r1:1.5b --modelfile > Modelfile

这样就拿到了模型对应的 Modelfile。现在两个关键文件已经到手:

  • deepseek-r1-1.5b-local.gguf
  • Modelfile

2.2 内网部署模型

把这两个文件传到已安装 Ollama 服务的内网服务器上。然后编辑 Modelfile,把第5行的 FROM 路径改成模型的实际存放路径,比如:

FROM ./deepseek-r1-1.5b-local.gguf

最后执行导入命令:

ollama create deepseek-r1-1.5b-local -f Modelfile

导入成功后,用 ollama list 就能看到新模型了。后续使用跟在线环境一模一样,没有任何区别。

热点追踪提示词
你是一名 AI 行业编辑,请围绕下面这条热点输出一份资讯解读:
热点:内网服务器离线安装与部署DeepSeek完整步骤指南要求:
1. 先用一句话解释这条热点在讲什么
2. 再总结它为什么重要
3. 说明会影响哪些 AI 产品或内容方向
4. 最后给出 3 个适合资讯站使用的标题
来源:https://www.53ai.com/news/finetuning/2025031652684.html
ai 人工智能

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关热点
AI热点2026-07-04 19:00
Daetama数据科学完整准备工作系统指南与精选学习资源汇总

Daetama是面向数据科学面试和SQL能力提升的练习平台,已收录超100个覆盖基础到进阶的SQL题目,求职板块与课程模块在开发中,团队保持每周更新节奏,提供系统性刷题与模拟面试场景。

AI热点2026-07-04 19:00
AI驱动配音平台 Speakmulti

SpeakMulti是一款AI驱动的配音平台,可将YouTube视频翻译成多种语言,保留原始说话者的音色和语调,降低本地化成本。用户提交视频并选择目标语言后,AI自动完成配音,并由专家团队审核,确保准确自然。

AI热点2026-07-04 18:59
Umi-OCR图片转文字识别软件

需求人群 如果你经常需要从图片中提取文字——例如整理截图内容、翻译图片里的外语文本、识别带有水印的图片信息——那么 Umi-OCR 无疑是一款相当实用的工具。它完全在本地运行,无需联网,对隐私保护极为友好。 产品特色 这款工具的核心亮点都集中在实用性上。截屏识别操作非常顺手,按下快捷键即可框选区域,

AI热点2026-07-04 18:59
用AI生成你最爱的画家或艺术运动风格绘画

艺术创作与人工智能的融合,正在开启一个全新的创作时代。moonlightai 正是这样一款AI绘画工具,能够帮助用户通过人工智能快速生成不同风格的绘画作品——无论你想复刻文艺复兴时期的古典优雅,还是为画作注入梵高般炽热的笔触,甚至从艾沃佐夫斯基的海浪星空中汲取灵感,它都能轻松实现。 需求人群 简单来

延伸阅读