DeepSeek发布V3.2大模型,API降价并全面开源
9月29日,DeepSeek正式推出V3.2-Exp实验性模型,该版本已在Huggingface与魔搭平台开源。目前官方App、网页端及小程序都已同步更新至V3.2-Exp版本,同时API服务价格也迎来大幅下调。
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
据介绍,DeepSeek-V3.2-Exp是通向新一代架构的过渡版本。在V3.1-Terminus基础上,该版本创新性地采用了DeepSeek Sparse Attention(DSA)稀疏注意力机制,重点优化了长文本处理时的训练与推理效率。这种细粒度稀疏注意力机制在不影响模型性能的前提下,显著提升了长文本的处理速度。
根据华为官方公众号披露,昇腾计算平台已对vLLM/SGLang等推理框架完成适配部署,实现对DeepSeek-V3.2-Exp的即日支持,并向开发者开源全部推理代码及算子实现。
研发团队表示,新模型开发过程中采用了TileLang高级语言进行快速原型开发,使得探索性研究更加高效。最终开源版本同时包含TileLang和CUDA两种算子实现,建议研究型项目优先使用TileLang版本以便调试和迭代。

随着模型服务成本的大幅降低,DeepSeek对API定价进行了相应调整。新版API调用费用较之前降低了50%以上,为开发者提供了更具性价比的服务选择。

回顾此前进展:8月21日发布的DeepSeek-V3.1首创混合推理架构,支持思考与非思考两种模式,在推理效率和Agent能力方面都有显著提升。9月22日推出的Terminus版本进一步优化了语言一致性和Agent性能,使模型表现更加稳定。
为确保实验可靠性,研发团队特意保持V3.2-Exp与V3.1-Terminus相同的训练设置。经各类公开评测集验证,两个版本在各项性能指标上基本保持相当水平。
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
国产存储如何突围,一场持久战略正在展开
如果你最近打算换手机或电脑,可能会发现同样的配置,价格已经比之前贵了一截。OPPO、vivo、荣耀等手机厂商先后对部分机型调价,深圳华强北的商户们发现,一夜之间部分机型的价格变化幅度接近千元。联想部
特斯拉TeraFab项目发布,年产算力超1太瓦
3月30日,据TeslaAI微博消息,TERAFAB项目正式发布,预计将实现每年超过1太瓦(1TW)的算力产出。马斯克预测,未来人形机器人行业的潜在年产量或将达到10亿至100亿台。随着机器人进入更
抖音网红公司参半完成新一轮融资,拟上市
作者 |定焦One 李梦冉网红口腔护理品牌参半,要上市了。3月27日,参半的母公司 "小阔科技 "向港交所递交招股说明书,拟主板挂牌上市。这家诞生于深圳的新锐企业,曾凭借一款益生菌漱口水在80天内狂揽亿
Workbuddy上线小程序版:本地云端直连使用指南
今日,腾讯公关总监张军透露,腾讯版龙虾应用workbuddy推出了小程序版,不仅可以直连本机,还可以直接云上使用。据了解,WorkBuddy是腾讯云推出的桌面Agent工具,定位为职场AI智能体桌面
DeepSeek服务中断说明:当前问题与解决方案详解
3月30日, DeepSeek崩了 登上微博热搜。DeepSeek最新服务状态 显示,DeepSeek网页、App服务出现重大中断。 DeepSeek最新服务状态 截图 事件报告显示,3月29日
- 日榜
- 周榜
- 月榜
相关攻略
2015-03-10 11:25
2015-03-10 11:05
2021-08-04 13:30
2015-03-10 11:22
2015-03-10 12:39
2022-05-16 18:57
2025-05-23 13:43
2025-05-23 14:01
热门教程
- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程

