DeepSeek发布V3.2大模型,API降价并全面开源
9月29日,DeepSeek正式推出V3.2-Exp实验性模型,该版本已在Huggingface与魔搭平台开源。目前官方App、网页端及小程序都已同步更新至V3.2-Exp版本,同时API服务价格也迎来大幅下调。
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
据介绍,DeepSeek-V3.2-Exp是通向新一代架构的过渡版本。在V3.1-Terminus基础上,该版本创新性地采用了DeepSeek Sparse Attention(DSA)稀疏注意力机制,重点优化了长文本处理时的训练与推理效率。这种细粒度稀疏注意力机制在不影响模型性能的前提下,显著提升了长文本的处理速度。
根据华为官方公众号披露,昇腾计算平台已对vLLM/SGLang等推理框架完成适配部署,实现对DeepSeek-V3.2-Exp的即日支持,并向开发者开源全部推理代码及算子实现。
研发团队表示,新模型开发过程中采用了TileLang高级语言进行快速原型开发,使得探索性研究更加高效。最终开源版本同时包含TileLang和CUDA两种算子实现,建议研究型项目优先使用TileLang版本以便调试和迭代。

随着模型服务成本的大幅降低,DeepSeek对API定价进行了相应调整。新版API调用费用较之前降低了50%以上,为开发者提供了更具性价比的服务选择。

回顾此前进展:8月21日发布的DeepSeek-V3.1首创混合推理架构,支持思考与非思考两种模式,在推理效率和Agent能力方面都有显著提升。9月22日推出的Terminus版本进一步优化了语言一致性和Agent性能,使模型表现更加稳定。
为确保实验可靠性,研发团队特意保持V3.2-Exp与V3.1-Terminus相同的训练设置。经各类公开评测集验证,两个版本在各项性能指标上基本保持相当水平。
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
领克GT概念跑车北京车展首发 百公里加速仅2秒
领克首款GT概念跑车亮相北京车展,由中欧团队联合打造。新车采用经典GT比例与低趴宽体设计,配备液态金属蓝涂装与2+2座舱,设有高性能模式按键可激活空气动力学套件。车辆采用后驱布局与AI智能运动控制系统,百公里加速约2秒,设计融合瑞典极简美学并参考全球用户反馈。
英伟达RTX 5070移动版GPU发布 12GB显存性能大幅提升
英伟达推出12GB显存版RTX5070移动GPU,与8GB版同步上市。两者均基于Blackwell架构,核心规格相同,仅显存容量不同。此举旨在缓解GDDR7芯片供应压力,为OEM提供灵活配置,加速笔记本产品布局,更大显存可更好满足游戏与AI应用需求。
微星新款雾面WOLED显示器MAG 276QRY28与276QRDY54正式发售
微星将于5月15日推出两款26 5英寸雾面WOLED显示器MAG276QRY28和276QRDY54,售价分别为2499元和6299元。均采用第四代WOLED面板,具备QHD分辨率、VESADisplayHDRTrueBlack500认证、1500尼特峰值亮度及99 5%DCI-P3色域覆盖。276QRY28刷新率为280Hz,高阶款276QRDY54支持4
中芯国际一季度净利润13.61亿元 同比增长0.4%
中芯国际2026年第一季度营收176 17亿元,同比增长8 1%;净利润13 61亿元,同比增长0 4%。公司预计第二季度收入环比增长14%至16%,毛利率指引上调至20%至22%。这反映出公司在行业复苏中展现出财务韧性,并通过运营优化增强了短期增长势头。
Google Cloud 持续优化 PostgreSQL 核心功能
谷歌云近期分享了其对PostgreSQL核心功能的贡献,重点涉及逻辑复制、升级流程与系统稳定性。更新包括逻辑复制的自动冲突检测、序列同步及订阅管理优化,提升了分布式架构可靠性。升级工具增强缩短了大型数据库升级时间,确保数据完整性。此外,修复了多项漏洞以增强系统稳健性,并预告了结构。
- 日榜
- 周榜
- 月榜
1
2
3
4
5
6
7
8
9
10
相关攻略
2015-03-10 11:25
2015-03-10 11:05
2021-08-04 13:30
2015-03-10 11:22
2015-03-10 12:39
2022-05-16 18:57
2025-05-23 13:43
2025-05-23 14:01
热门教程
- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程
热门话题

