当前位置: 首页
科技数码
DeepSeek开源模型挑战谷歌,揭示与闭源差距拉大关键

DeepSeek开源模型挑战谷歌,揭示与闭源差距拉大关键

热心网友 时间:2025-12-02
转载

12月1日晚,DeepSeek再次发布了两款全新模型——DeepSeek-V3.2和DeepSeek-V3.2-Speciale,在推理能力上取得全球领先地位。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

这两款模型定位各有侧重。DeepSeek-V3.2旨在平衡推理性能与输出长度,特别适合日常应用场景,例如智能问答和通用人工智能任务处理。9月底公司曾推出实验版V3.2-Exp,而这次则是正式版更新。根据公开推理测试数据显示,V3.2已经达到了GPT-5的水准,仅略微落后于谷歌的Gemini3+Pro。

DeepSeek-V3.2-Speciale堪称此次发布的重头戏,其设计目标是将开源模型的推理能力推向极致,探索人工智能技术的性能边界。据介绍,Speciale作为V3.2的长思考增强版本,同时融合了DeepSeek-Math-V2的定理证明能力,该模型在指令遵循、严谨的数学证明与逻辑验证方面展现出卓越实力。

根据DeepSeek公布的数据,Speciale在多个推理基准测试中均超越了谷歌最先进的Gemini3+Pro。具体而言,在美国数学邀请赛、哈佛MIT数学竞赛、国际奥林匹克数学竞赛等专业测试中,V3.2-Speciale表现均优于Gemini3+Pro,但在编程与理工科博士生测试环节则稍稍落后于谷歌模型。

DeepSeek-V3.2系列与其他模型在各类数学、代码与通用领域评测集上的得分(括号内为消耗Tokens总量约数)

值得关注的是,Speciale模型一举斩获了IMO(国际数学奥林匹克)、ICPC World Finals(国际大学生程序设计竞赛全球总决赛)及IOI(国际信息学奥林匹克)三大金牌。其中,在ICPC与IOI竞赛中的成绩分别达到了人类选手第二名与第十名的水平。

尽管取得了这些突破性成果,DeepSeek在技术报告中坦言,与Gemini3+Pro等前沿闭源模型相比,自家产品仍存在一定局限性。首先,V3.2的世界知识广度仍落后于领先的专有模型;其次在令牌效率方面,V3.2通常需要更多的令牌才能达到与Gemini3+Pro相当的输出质量;在处理复杂任务时也不如前沿模型表现优异。

DeepSeek表示,团队计划在未来通过增加预训练计算量来填补知识空白,并致力于优化模型推理链的智能密度以提升效率,持续改进基础模型和训练后方案。

值得一提的是,在技术报告中,DeepSeek还谈到当前开源与闭源模型之间的差距正在拉大。

DeepSeek指出,推理模型的发布是大模型发展的关键转折点,推动了整体性能的大幅跃升。自这一里程碑事件以来,大模型能力进入快速发展期。然而,过去几个月中出现了明显的分化趋势:尽管开源领域持续取得进步,但闭源专有模型如谷歌、OpenAI、Anthropic的性能增长速度明显更快。

“闭源模型与开源模型之间的性能差距并未缩小,反而日益扩大,专业系统在处理复杂任务时展现出越来越强的优势。”DeepSeek认为,这其中存在三个关键的技术缺陷。

一方面,在架构层面,对标准注意力机制的过度依赖严重制约了长序列处理的效率;其次,在资源分配方面,开源模型在后训练阶段的计算投入不足,限制了模型在高难度任务上的表现;最后,在人工智能领域,开源模型在泛化能力和指令遵循能力方面与专业模型相比存在明显差距,影响了实际部署效果。

为了突破这些限制,DeepSeek在9月底发布实验版V3.2-Exp时,提出了稀疏注意力机制,希望显著降低计算复杂度。经过两个月的实验验证,DeepSeek确认了稀疏注意力机制的有效性,并表示在不牺牲长上下文性能的前提下,团队成功解决了关键的计算复杂度问题。

此次发布的两款模型均引入了这一创新机制。据DeepSeek透露,除了在多个推理基准测试中V3.2性能大幅提升外,在智能体场景中,V3.2也成为一种具有成本效益的替代方案,不仅缩小了开源模型与前沿专有模型之间的性能差距,运营成本也显著降低。

目前,DeepSeek的最新网页端、App和API均已更新为正式版DeepSeek-V3.2,但增强版Speciale目前仅以临时API服务形式开放,供社区评测与研究使用。

在海外社交媒体上,有网友认为DeepSeek此次发布取得了不起的成就,“能够匹配GPT-5和Gemini3+Pro的开源模型已经出现,性能差距正式消除。”DeepSeek不断证明,严谨的工程设计可以超越单纯的参数规模。但正如DeepSeek所述,我们仍需正视开源与闭源在整体性能上的差距,不断突破开源技术的性能边界。

来源:https://www.itbear.com.cn/html/2025-12/1036363.html

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章
更多
英特尔CPU还要第三次涨价!只因需求太旺盛

英特尔CPU还要第三次涨价!只因需求太旺盛

Intel CPU或将迎来新一轮涨价,供需失衡是主因 市场最近又有风声传来。据行业门户techpowerup报道,处理器巨头英特尔正准备启动新一轮的价格调整。如果消息属实,这将是继今年二月和三月两轮上涨之后,短期内又一次价格上调。 具体来看,根据中国市场研究机构Minutes Logic Socie

时间:2026-04-06 12:34
8G显卡再战十年!NV新技术:显存爆降85%画质不变

8G显卡再战十年!NV新技术:显存爆降85%画质不变

随着3A大作对画面精度的追求持续升级 现如今,3A游戏对画面细节的追逐几乎陷入了“军备竞赛”。高清材质包一个比一个大,直接带来的后果就是:曾经被视为甜点配置的8GB显存显卡,如今越来越力不从心。爆显存、游戏卡顿、被迫降低画质设置——这些窘境成了不少玩家的日常,8GB卡甚至被戏称为新时代的“残废卡”。

时间:2026-04-06 10:22
微星 2026 款泰坦 18 Max 游戏本国行上市:7 热管 2 风扇,整机双烤 260W

微星 2026 款泰坦 18 Max 游戏本国行上市:7 热管 2 风扇,整机双烤 260W

微星泰坦 18 Max 2026款国行发布:极致双烤260W性能,散热系统全面解析 对于追求极致性能的游戏玩家和专业创作者而言,顶级游戏本市场迎来了一个重磅选项。近日,微星正式在国内推出了其旗舰级新品——2026款泰坦 18 Max(Raider 18 Max HX)游戏笔记本电脑,旨在重新定义高性

时间:2026-04-06 07:03
旗舰配置 25000Pa 吸力 + 95℃ 自清洁:石头 A30 CE 洗地机 1278 元免费用 15 天

旗舰配置 25000Pa 吸力 + 95℃ 自清洁:石头 A30 CE 洗地机 1278 元免费用 15 天

京东百亿补贴开启:石头 A30 CE 系列洗地机享“买贵双倍赔”与“15天免费试用” 如果您正在关注高品质清洁电器,那么现在有一个不容错过的限时机会。石头科技旗下的 A30 CE 系列智能洗地机现已加入“京东百亿补贴”专场。本次促销不仅带来极具竞争力的价格,更提供了两大核心保障:一是“买贵双倍赔”的

时间:2026-04-06 07:02
比官方预告时间更早:消息称“超级小爱”PC 客户端正推送给小米笔记本 Pro 14

比官方预告时间更早:消息称“超级小爱”PC 客户端正推送给小米笔记本 Pro 14

比官方预告时间更早:消息称“超级小爱”PC 客户端正推送给小米笔记本 Pro 14 四月份伊始,小米在AI落地应用方面便带来了令人惊喜的新进展。据知名数码博主@懒酱的日记本透露,备受期待的“超级小爱”PC客户端已开始向小米笔记本 Pro 14用户推送。此次推送的时间点,较官方之前公布的四月中旬计划明

时间:2026-04-06 07:01
热门专题
更多
刀塔传奇破解版无限钻石下载大全 刀塔传奇破解版无限钻石下载大全
洛克王国正式正版手游下载安装大全 洛克王国正式正版手游下载安装大全
思美人手游下载专区 思美人手游下载专区
好玩的阿拉德之怒游戏下载合集 好玩的阿拉德之怒游戏下载合集
不思议迷宫手游下载合集 不思议迷宫手游下载合集
百宝袋汉化组游戏最新合集 百宝袋汉化组游戏最新合集
jsk游戏合集30款游戏大全 jsk游戏合集30款游戏大全
宾果消消消原版下载大全 宾果消消消原版下载大全
  • 日榜
  • 周榜
  • 月榜
热门教程
更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程