我特别喜欢的三个DeepSeek版本
发布时间:2025-07-04 编辑:游乐网
图片大家好,我是 ai 学习的老章
最近工作非常繁忙,写一篇简短的文章
分享三个我经常使用的 DeepSeek 模型DeepSeek-R1-0528-Qwen3-8B
这是最新版的 DeepSeek-R1-0528,通过思维链蒸馏提取后对 Qwen3-8B-Base 进行了训练:DeepSeek-R1-0528 蒸馏 Qwen3:8B 大模型,使用双 4090 显卡本地部署,效果非常好
这个模型有几个特点让我非常喜欢:
成本极低,模型文件大小仅 16GB,默认参数下,两张 4090 显卡即可流畅运行性能很强,无论是各种 Bench 测试结果还是个人体验,都能轻松应对参数和模型文件是其四倍大小的 Qwen32-B速度非常快,启动时两张 4090 显卡能达到 90Tonken/s目前 DeepSeek-R1-0528-Qwen3-8B 我主要用来做知识库意图识别、问题改写、问题分类
缺点:无法关闭思考功能,我用 vllm 启动,在 Dify 中即使直接关闭或者在提示词中加 no_think 都没用
DeepSeek-R1-0528R1 的小版本更新,但是提升明显,性能和推理能力都增强了不少:DeepSeek R1 最新版本模型,排名第三
这个模型应该算是可以免费使用的最强大的模型之一了吧
网页版我倒是很少用,主要是调 API 接口,主要用于 Obsidian 上查资料,翻译,写文章
图片以及在 Cursor 上写代码
图片缺点:响应速度较慢,在 Cursor 上写代码也不支持 Agent 模式
DeepSeek-V3-Fast近期发现的一个小众版本DeepSeek-V3-Fast,它是基于 DeepSeek V3 0324 版本优化后的极速版本
API 申请地址:
https://www.sophnet.com/#?code=IXFCAK
最大的优势就是推理速度,可以说是快如闪电⚡️
图片目前我主要把它用于 Obsidian 做内容总结,还有沉浸式插件中当翻译工具(确实非常快)
图片缺点是能力略逊于 R1,表现不太稳定
相关阅读
MORE
+- 魅族手机怎么设置天气软件 魅族天气预报功能使用全面教程 07-10 如何在夸克APP手机浏览器中开启和使用阅读模式? 07-10
- 怎么用天眼查查找公司股东名单_天眼查app股东信息查询方法 07-10 使用夸克APP手机浏览器收藏夹的管理技巧有哪些? 07-10
- 夸克网盘APP的隐私保护措施如何保障用户数据安全? 07-10 一加手机微信聊天记录备份失败怎么办 解决微信数据备份问题方法 07-10
- 快易数据恢复如何设定快速扫描所有文件 07-10 AI视频绘图写作精灵好用吗 07-10
- 剪映为什么后面还有很长一段黑屏 剪映视频后半段黑屏解决方法 07-10 剪映如何把文字转化为声音 剪映把文字转换成语音教程 07-10
- 秀米编辑器如何导入视频 07-10 淘宝外卖请客卡怎么分享 07-10
- 快手号直播视频怎么保存?直播视频保存多久? 07-10 华为手机微信聊天记录备份失败怎么办 微信备份问题解决方案分享 07-10
- 视频号如何开播提醒私信?开播提醒私信什么意思? 07-10 使用夸克网盘APP上传大文件时遇到卡顿该如何解决? 07-10
- 剪映如何打开视频草稿 07-10 随手写app使用教程方法 随手写app付费和免费区别 07-10