当前位置: 首页
科技数码
DeepSeek发布两款开源模型,性能比肩谷歌且坦言与闭源差距扩大

DeepSeek发布两款开源模型,性能比肩谷歌且坦言与闭源差距扩大

热心网友 时间:2025-12-02
转载

人工智能领域迎来令人振奋的突破,DeepSeek近日正式推出两款重磅模型——DeepSeek-V3.2与DeepSeek-V3.2-Speciale。这两款模型在推理能力方面展现出国际领先水准,引发了业界的广泛关注。其中,V3.2定位为平衡推理性能与输出长度的通用型模型,擅长处理日常对话场景和智能体任务等应用。该模型此前已发布实验版本,此次正式版在公开测试中达到GPT-5的基准水平,仅在部分指标上略逊于谷歌Gemini3+Pro。

作为技术升级的核心产品,V3.2-Speciale被定位为“开源模型推理能力的极限探索者”。该模型创新性地融合了长思考增强技术与DeepSeek-Math-V2的数学证明能力,构建起包含指令跟随、逻辑验证和数学推理的复合能力体系。在数学竞赛测试中,Speciale在美国数学邀请赛、哈MIT数学竞赛等权威赛事中均超越Gemini3+Pro,国际奥数竞赛成绩更是达到人类选手前1%的水平。不过在编程和理工科博士生测试中,其表现与谷歌模型仍存在一定差距。

技术测评数据显示,Speciale在ICPC全球总决赛和IOI竞赛中分别取得人类选手第二名和第十名的成绩,展现出接近顶尖人类选手的复杂问题解决能力。但DeepSeek团队坦言,与闭源专有模型相比,V3.2系列仍存在三方面局限:世界知识广度不足、Token使用效率偏低,以及复杂任务处理能力有待提升。针对这些短板,研发团队计划通过扩大预训练计算量和优化推理链密度进行改进。

当前开源与闭源模型的发展差距成为行业焦点。技术报告指出,自推理模型技术突破以来,虽然开源社区持续进步,但谷歌、OpenAI等闭源模型的性能增速明显更快。这种分化主要体现在三个层面:标准注意力机制对长序列处理的效率制约、后训练阶段计算资源投入不足,以及智能体泛化能力与指令遵循能力的差距。这些因素导致专有系统在复杂任务中的优势持续扩大。

为突破技术瓶颈,DeepSeek在9月实验版中引入的稀疏注意力机制(DSA)已通过验证。该机制通过优化计算复杂度,在不损失长上下文处理能力的前提下,显著提升模型效率。正式版两款模型均采用这项创新技术,使得V3.2在智能体场景中成为兼具性能与成本优势的解决方案。实际测试表明,其推理性能提升的同时,计算资源消耗较前代降低37%。

目前DeepSeek-V3.2已完成全平台更新,用户可通过网页端、移动应用和API接口使用。增强版Speciale则以临时API形式开放,供研究机构和开发者进行深度测评。海外技术社区对此反响热烈,部分专家认为这两款模型的发布标志着开源模型与专有系统的性能差距进入动态平衡阶段。虽然完全消除差距仍需时间,但DeepSeek通过工程优化突破参数规模限制的路径,为行业提供了新的发展思路。

来源:https://www.itbear.com.cn/html/2025-12/1036290.html

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章
更多
中国科学院院士卿凤翎出席2026科技节红毯活动

中国科学院院士卿凤翎出席2026科技节红毯活动

2026年上海科技节将于5月23日至31日举行,主题为“科技让生活更美好”。活动涵盖七大板块,旨在全方位展现科创活力。本届科学红毯环节创新采用“主红毯+分红毯”模式,集中展示科技创新代表人物与团队。中国科学院院士卿凤翎作为杰出科学家代表亮相红毯。

时间:2026-05-23 20:57
雷军谈小米造车十年规划与心态调整

雷军谈小米造车十年规划与心态调整

与一年前的喧嚣相比,如今的小米汽车,似乎正进入一个“静水深流”的阶段。创始人雷军在与媒体交流时,给出了一个颇为务实的基调:放平心态,不争一个月之长短。在他看来,造车是“十年之功”,只要踏踏实实把车造好、服务好消费者,成为全球前五的车厂只是时间问题。 这份从容,源于内部的深刻变化。2026年的小米汽车

时间:2026-05-23 20:57
香港特首李家超祝贺黎家盈当选

香港特首李家超祝贺黎家盈当选

神舟二十三号载人飞行任务将于5月24日发射,乘组包括香港前警司黎家盈。她经过严格训练,成为首位来自香港的航天员。香港特区行政长官李家超对此表示祝贺,称这是香港为国家航天事业贡献力量的骄傲时刻。黎家盈将负责空间科学实验,并对任务充满信心。

时间:2026-05-23 20:56
537天刷新世界纪录 全球首次攻克三大技术难题

537天刷新世界纪录 全球首次攻克三大技术难题

近日,中国深海材料科学研究取得一项里程碑式突破。由中国船舶集团第七二五研究所主导的“深海原位腐蚀长期观测”项目,在万米海底持续开展537天后圆满结束。这场超长周期的深海极端环境材料试验,不仅创造了该领域新的世界纪录,更标志着我国在深海材料科学与工程技术上,实现了从“短期探测”到“长期驻留观测”的重大

时间:2026-05-23 20:55
三星T9运动相机内存卡选购指南 高速读写稳定可靠

三星T9运动相机内存卡选购指南 高速读写稳定可靠

三星T9microSD存储卡专为运动摄影设计,具备高速读写与强大兼容性。其写入速度达130MB s,支持4K 8K高码率视频流畅录制,读取速度200MB s提升传输效率。提供128GB至512GB容量选择,并拥有防水、防摔等六重防护,适应户外严酷环境。该卡性能均衡,能全面满足运动相机对速度、容量及稳定性的要求。

时间:2026-05-23 20:53
热门专题
更多
刀塔传奇破解版无限钻石下载大全 刀塔传奇破解版无限钻石下载大全
洛克王国正式正版手游下载安装大全 洛克王国正式正版手游下载安装大全
思美人手游下载专区 思美人手游下载专区
好玩的阿拉德之怒游戏下载合集 好玩的阿拉德之怒游戏下载合集
不思议迷宫手游下载合集 不思议迷宫手游下载合集
百宝袋汉化组游戏最新合集 百宝袋汉化组游戏最新合集
jsk游戏合集30款游戏大全 jsk游戏合集30款游戏大全
宾果消消消原版下载大全 宾果消消消原版下载大全
  • 日榜
  • 周榜
  • 月榜
热门教程
更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程