数码系统

相机 win10

测评 win11

手机智车

华为 Tesla

小米理想

苹果蔚来

游戏软件

LOL 抖音

原神微信

当前位置：首页

AI资讯

热点详情

四张2080Ti 22G本地部署DeepSeek 671B满血版

AI热点日报时间：2026-07-04

热点解读

用四张2080Ti及E5旧硬件组成88GB显存，在Ubuntu上通过Ollama运行404GB的DeepSeek-R1671B量化版模型，实测约2 18tokens s，成本1 5万元，并借助Dify和cpolar实现远程访问。

不少用户在使用 DeepSeek 官网或 App 时，常会看到“服务器繁忙”的提示。这也促使越来越多的人开始探索本地部署方案——不过，想要运行满血版 671B 模型，高昂的硬件成本让许多人望而却步。我尝试采用一套更具性价比的配置来迎接这一挑战，最终成功在个人 PC 上部署了 DeepSeek R1 671B 的满血量化版 Q4 模型，总成本控制在 1.5 万元左右，实测生成速度约 2.18 tokens/s，基本满足日常使用。下面将详细介绍具体的配置清单与调优过程。

挑战4张2080Ti22G跑本地部署的DeepSeek 671b满血版大模型

前言

关于不同版本 DeepSeek 的参数量与本地部署要求，可参考下方图表（此处保留原文图片）。为帮助读者更直观理解满血版与蒸馏版的性能差异，我决定以更低成本进行一次部署挑战。

（原文图片描述位置保留）

（原文第二张图片描述位置保留）

1. 硬件配置

服务器：技嘉 X99
CPU：单路 E5-2673v4
显卡：2080Ti 22G * 4
内存：512G
机箱：工作站全塔机箱
电源：1200W

这套配置的设计思路是利用高性价比的老硬件堆叠显存容量——四块 22G 显存的 2080Ti，总显存达到 88G，再搭配 512G 系统内存作为缓冲，可较为从容地加载体积达 404GB 的量化模型。

（原文此处有一张硬件展示图片）

2. 软件配置

操作系统：Ubuntu 22.04.5
本地大模型运行工具：Ollama

curl -fsSL https://ollama.com/install.sh | sh

本次部署选用的是 DeepSeek R1 671B 满血量化版，模型文件大小约为 404GB：

ollama run deepseek-r1:671b

3. 调优配置

若按默认方式安装并运行 Ollama，加载此大模型时很可能出现内存溢出错误。因此需调整若干关键参数，防止因显存不足导致系统崩溃，同时允许操作系统内存作为显存的有效补充。另外，由于同时启用四张显卡，还需在初始化时加入 10 秒延迟，确保所有显卡在 Ollama 加载前完成初始化。

ExecStartPre=sleep 10

Environment="OLLAMA_HOST=0.0.0.0"

Environment="GGML_CUDA_ENABLE_UNIFIED_MEMORY=1"

（原文此处有一张配置截图）

4. 实际运行效果

通过 SSH 登录服务器后，首先查看 Ollama 环境下的已下载模型列表：

ollama list

可以看到 deepseek-r1:671b 满血全量模型已准备就绪，文件大小为 404GB。

运行模型：

ollama run deepseek-r1:671b

进入交互界面后，设置输出明细信息：

/set verbose

模型加载可能需要稍等片刻，加载完成后直接提问，即可查看实际的运行速率。

（原文此处有两张运行截图）

5. 安装 dify 服务

若希望在网页端与 DeepSeek 大模型进行交互，可通过 Docker 部署 Dify 服务来实现。首先安装 Docker：

sudo curl -fsSL https://gitee.com/tech-shrimp/docker_installer/releases/download/latest/linux.sh | bash -s docker --mirror Aliyun

接着克隆 Dify 源代码：

git clone https://github.com/langgenius/dify.git

进行环境配置：

cd dify/docker
cp .env.example .env

启动容器：

sudo docker compose up -d

Dify 接入 Ollama：

（原文此处有两张配置截图）

返回主界面，创建空白应用，选择 deepseek-r1:671b 模型，在文本框中编辑文字即可开始对话。

（原文此处有一张对话界面截图）

6. 安装内网穿透远程访问

若希望其他设备能在不同网络环境下远程访问本地部署的 DeepSeek R1 671B，可利用 cpolar 实现内网穿透。

sudo curl https://get.cpolar.sh | sh

安装完成后检查 cpolar 服务状态：

sudo systemctl status cpolar

（原文此处有一张状态截图）

cpolar 安装并启动服务后，在浏览器中输入 Ubuntu 主机 IP 加 9200 端口（http://localhost:9200），登录 cpolar 管理界面：

点击左侧仪表盘的“隧道管理”→“创建隧道”：

隧道名称：可自定义（例如 dify）
协议：http
本地地址：80
域名类型：随机域名
地区：选择 China Top

点击创建。

（原文此处有一张创建隧道截图）

创建成功后，在左侧“在线隧道列表”中会生成两个公网地址。在其他电脑上使用任意一个网址即可通过浏览器访问。

（原文此处有一张在线隧道列表截图）

需要说明的是，cpolar 生成的随机公网地址适合临时使用，24 小时内会发生变化。对于需要长期稳定远程访问的场景，建议配置固定的二级子域名，不仅带宽更高，地址也更容易记忆。

配置固定 Dify 公网地址

注意：配置固定子域名需使用 cpolar 基础套餐或以上版本（不同套餐对应不同带宽）。登录 cpolar 官网，点击左侧“预留”→“保留二级子域名”，地区选择“China VIP”，设置子域名名称并填写备注信息，点击保留。

（原文此处有一张官网配置截图）

返回 cpolar Web UI 管理界面，点击左侧仪表盘的“隧道管理”→“隧道列表”，找到 dify 隧道并点击编辑。

修改隧道信息：

域名类型：选择“二级子域名”
Sub Domain：填写已成功保留的二级子域名
地区：China VIP

点击更新。

（原文此处有一张编辑隧道截图）

更新完成后，在线隧道列表中原有的随机地址即变为固定的二级子域名地址。

（原文此处有一张更新后的隧道列表截图）

使用固定的公网地址访问 Dify 界面，可以看到访问成功。如此一来，团队协作时可将该地址分享给同事，无需每个人都重新部署，大大提升了工作效率。

（原文此处有一张访问成功的截图）

总结

本次挑战利用多款上市多年但依然具有出色性价比的旧硬件，成功实现了在个人 PC 上部署 DeepSeek 满血版大模型的目标。同时，配合 cpolar 内网穿透工具，可将本地服务发布至公网，方便朋友或同事远程访问，既避免了重复部署的麻烦，也有效绕开了 DeepSeek 官方服务的拥堵问题。

目前我们正在测试新的部署方案，旨在进一步提升每秒 tokens 生成速率，同时继续降低硬件投入成本。如果在本地配置过程中遇到任何问题，欢迎随时交流。

热点追踪提示词

你是一名 AI 行业编辑，请围绕下面这条热点输出一份资讯解读：
热点：四张2080Ti 22G本地部署DeepSeek 671B满血版要求：
1. 先用一句话解释这条热点在讲什么
2. 再总结它为什么重要
3. 说明会影响哪些 AI 产品或内容方向
4. 最后给出 3 个适合资讯站使用的标题

来源：https://www.53ai.com/news/finetuning/2025032040678.html

ai 人工智能

上一篇：地平线芯片加持TCL X12打造智能人机交互

下一篇：Maxim推出高效小型化AI系统供电电源芯片组

游乐网为非赢利性网站，所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系youleyoucom@outlook.com。

延伸阅读

iPhone 17系列液态硅胶壳曝光：8色可选+挂绳孔设计 iOS 26整合ChatGPT-5：AI全面赋能苹果智能生态真我828真粉节揭晓：10000mAh超大电池手机即将亮相？苹果折叠iPhone曝光：搭载自研C2基带芯片与Touch ID指纹识别对话元戎启行周光：VLA模型核心成本在AI芯片，辅助驾驶方案交付近10万套刘志强：京东方坚持开放合作，拒绝低质低价竞争 Redmi K90系列全系标配5000万长焦与3D超声波指纹，配置再升级 vivo X300系列曝光：天玑9500+2亿像素主摄，长焦微距实力升级

日榜
周榜
月榜

01 / 08-26iPhone 17系列液态硅胶壳曝光：8色可选+挂绳孔设计 02 / 08-26iOS 26整合ChatGPT-5：AI全面赋能苹果智能生态 03 / 08-26真我828真粉节揭晓：10000mAh超大电池手机即将亮相？ 04 / 08-26苹果折叠iPhone曝光：搭载自研C2基带芯片与Touch ID指纹识别 05 / 08-27对话元戎启行周光：VLA模型核心成本在AI芯片，辅助驾驶方案交付近10万套

01 / 本周Daetama数据科学完整准备工作系统指南与精选学习资源汇总 02 / 本周AI驱动配音平台 Speakmulti 03 / 本周Umi-OCR图片转文字识别软件 04 / 本周用AI生成你最爱的画家或艺术运动风格绘画 05 / 本周创一AI短视频脚本工具，专为创作者与编导设计

01 / 本月Daetama数据科学完整准备工作系统指南与精选学习资源汇总 02 / 本月AI驱动配音平台 Speakmulti 03 / 本月Umi-OCR图片转文字识别软件 04 / 本月用AI生成你最爱的画家或艺术运动风格绘画 05 / 本月创一AI短视频脚本工具，专为创作者与编导设计

热点快看

07-04 19:00Daetama数据科学完整准备工作系统指南与精选学习资源汇总 07-04 19:00AI驱动配音平台 Speakmulti 07-04 18:59Umi-OCR图片转文字识别软件 07-04 18:59用AI生成你最爱的画家或艺术运动风格绘画 07-04 18:59创一AI短视频脚本工具，专为创作者与编导设计

热点追踪

持续追踪iPhone 17系列液态硅胶壳曝光：8色可选+挂绳孔设计 持续追踪iOS 26整合ChatGPT-5：AI全面赋能苹果智能生态 持续追踪真我828真粉节揭晓：10000mAh超大电池手机即将亮相？ 持续追踪苹果折叠iPhone曝光：搭载自研C2基带芯片与Touch ID指纹识别