当前位置: 首页
AI
DeepSeek V3.2与Speciale双模型开源,革新智能体技术新高度

DeepSeek V3.2与Speciale双模型开源,革新智能体技术新高度

热心网友 时间:2025-12-02
转载

人工智能领域迎来重大进展,DeepSeek近日发布两款全新模型——DeepSeek-V3.2及其长思考增强版DeepSeek-V3.2-Speciale。这两款模型在推理、智能体等多项基准测试中表现优异,成为当前开源模型中性能最强的代表,部分指标甚至达到国际领先水平。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

标准版DeepSeek-V3.2在公开推理类测试中展现出强大实力,其表现已接近GPT-5,仅略逊于Gemini-3.0-Pro。与Kimi-K2-Thinking相比,V3.2的输出长度显著缩短,计算开销和用户等待时间均大幅降低。该模型还首次将思考模式融入工具使用,支持思考与非思考两种工具调用方式,在智能体测评中达到开源模型最高水平,且未针对测试工具进行特殊训练,显示出较强的泛化能力。

长思考增强版DeepSeek-V3.2-Speciale结合了DeepSeek-Math-V2的定理证明能力,在指令跟随、数学证明和逻辑验证方面表现突出。在主流推理基准测试中,其性能可与Gemini-3.0-Pro媲美。该版本在国际顶级学术竞赛中取得突破性成绩,斩获IMO 2025、CMO 2025、ICPC World Finals 2025及IOI 2025金牌,其中ICPC与IOI成绩分别达到人类选手第二名和第十名的水平。不过,由于该版本消耗的Tokens更多、成本较高,目前仅供研究使用,不支持工具调用,也未针对日常对话和写作任务进行优化。

针对开源模型与专有模型差距扩大的问题,DeepSeek团队分析认为,主要限制因素包括:原始注意力机制在长序列处理效率上的不足、训练后阶段算力投入不足,以及智能体应用场景中泛化能力和指令遵循能力的滞后。为解决这些问题,DeepSeek提出三项创新方案:引入高效的稀疏注意力机制DSA,开发可扩展的强化学习协议,以及设计促进工具使用场景泛化推理的新流程。

DSA机制通过闪电索引用器快速筛选重要token,仅对关键token进行详细分析,将注意力复杂度从平方级降低为近似线性增长。这种设计在保持模型质量的同时,显著提升了长序列推理效率。在H800 GPU上的测试显示,DeepSeek-V3.2实现了显著的端到端加速,在短上下文场景下也通过专门掩码模式进一步提升了效率。

在后训练阶段,DeepSeek采用专家蒸馏与混合式强化学习相结合的方法。团队从同一基础检查点出发,为数学、编程、逻辑推理等六类专业任务训练专属模型,再将这些专家的能力汇聚到统一大模型中。混合式强化学习则采用GRPO算法,将推理、智能体与人类对齐的训练整合到同一阶段,避免灾难性遗忘。为解决思考模式与工具使用的结合问题,团队设计了新的上下文管理机制,确保模型在多轮工具调用中保持推理连续性。

目前,DeepSeek最新网页端、App和API均已更新为DeepSeek-V3.2正式版,Speciale版本则以临时API服务形式开放供社区评测与研究。两款模型的技术报告和开源代码已在模型库平台发布,供研究人员下载使用。

尽管DeepSeek-V3.2在计算效率与推理能力之间取得了平衡,但团队也承认其存在局限性。由于整体训练计算量较少,该模型的世界知识广度仍落后于领先专有模型;在token效率方面,通常需要更长的生成轨迹才能达到相似输出质量;在解决复杂任务方面,与前沿模型相比仍有提升空间。这些挑战将成为未来迭代优化的重点方向。

来源:https://www.itbear.com.cn/html/2025-12/1036153.html

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章
更多
逼AI当山顶洞人!Claude防话痨插件爆火,网友:受够了AI废话

逼AI当山顶洞人!Claude防话痨插件爆火,网友:受够了AI废话

新智元报道编辑:元宇【新智元导读】一个让AI像原始人一样说话的插件,在HN上一夜爆火,冲破2w星。它的核心只是一条简单粗暴的prompt:删掉冠词、客套和一切废话,号称能省下75%的输出token。

时间:2026-04-07 14:55
季度利润翻 8 倍,最赚钱的「卖铲人」财报背后,内存涨价狂潮如何收场?

季度利润翻 8 倍,最赚钱的「卖铲人」财报背后,内存涨价狂潮如何收场?

AI 时代最赚钱的公司,可能从来不是做 AI 的那个。作者|张勇毅编辑|靖宇淘金热里最稳赚的人,从来不是淘金的,是卖铲子的。这句老话在 2026 年的科技行业又应验了一次。只不过这次卖铲子的不是英伟

时间:2026-04-07 14:49
Claude Code Harness+龙虾科研团来了!金字塔分层架构+多智能体

Claude Code Harness+龙虾科研团来了!金字塔分层架构+多智能体

Claw AI Lab团队量子位 | 公众号 QbitAI你还在一个人做科研吗?科研最难的,从来不是问题本身,而是一个想法从文献到实验再到写作,只能靠自己一点点往前推。一个人方向偏了没人提醒,遇到歧

时间:2026-04-07 14:43
让离线强化学习从「局部描摹」变「全局布局」丨ICLR'26

让离线强化学习从「局部描摹」变「全局布局」丨ICLR'26

面对复杂连续任务的长程规划,现有的生成式离线强化学习方法往往会暴露短板。它们生成的轨迹经常陷入局部合理但全局偏航的窘境。它们太关注眼前的每一步,却忘了最终的目的地。针对这一痛点,厦门大学和香港科技大

时间:2026-04-07 14:37
美国犹他州启动新试点项目:AI为患者开具精神类药物处方

美国犹他州启动新试点项目:AI为患者开具精神类药物处方

IT之家 4 月 5 日消息,据外媒 PC Mag 当地时间 4 月 4 日报道,美国医疗机构 Legion Health 在犹他州获得监管批准,启动一项试点项目,允许 AI 系统为患者开具精神类药

时间:2026-04-07 14:30
热门专题
更多
刀塔传奇破解版无限钻石下载大全 刀塔传奇破解版无限钻石下载大全
洛克王国正式正版手游下载安装大全 洛克王国正式正版手游下载安装大全
思美人手游下载专区 思美人手游下载专区
好玩的阿拉德之怒游戏下载合集 好玩的阿拉德之怒游戏下载合集
不思议迷宫手游下载合集 不思议迷宫手游下载合集
百宝袋汉化组游戏最新合集 百宝袋汉化组游戏最新合集
jsk游戏合集30款游戏大全 jsk游戏合集30款游戏大全
宾果消消消原版下载大全 宾果消消消原版下载大全
  • 日榜
  • 周榜
  • 月榜
热门教程
更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程