当前位置: 首页
科技数码
DeepSeek新模型发布:性能亮点与上手评测

DeepSeek新模型发布:性能亮点与上手评测

热心网友 时间:2026-02-11
转载

DeepSeek正在推进新版本模型的灰度测试,或是V4正式亮相前的终极灰度版。

2月11日,部分用户打开DeepSeek App后收到更新版本的提示。APP更新后(1.7.4),用户可体验到DeepSeek最新模型。本次升级后,模型上下文长度将从128K扩展至1M,接近提升10倍;知识库更新至2025年5月,多项核心能力获得实质性提升。


作者实测发现,DeepSeek在问答中称,当前的版本很可能也不是V4,极有可能是V3系列的最终进化形态,或是V4正式亮相前的终极灰度版。


野村证券于2月10日发布报告称,预计2026年2月中旬推出的DeepSeek V4模型,不会重现去年V3发布时引发的全球AI算力需求恐慌。该行认为,V4的核心价值在于通过底层架构创新推动AI应用商业化落地,而非颠覆现有AI价值链。

据测评,新版本在复杂任务处理能力上已对齐Gemini 3 Pro及K2.5等主流闭源模型。野村进一步指出,V4预计将引入mHC与Engram两项创新技术,从算法与工程层面突破算力芯片与内存瓶颈。内部初步测试显示,V4在编程任务中的表现已超越Anthropic Claude及OpenAI GPT系列同代模型。

此次发布的关键意义在于进一步压缩训练与推理成本,为全球大语言模型及AI应用企业缓解资本开支压力提供可行路径。

创新架构针对硬件瓶颈优化

野村证券报告指出,算力芯片性能与HBM内存瓶颈,始终是国产大模型产业绕不开的硬约束。即将发布的DeepSeek V4所引入的mHC(超连接与流形约束超连接)与Engram架构,正是从训练与推理两个维度,针对上述短板进行系统级优化。

mHC
全称为“流形约束超连接”。它旨在解决Transformer模型在层数极深时,信息流动的瓶颈和训练不稳定的问题。
简单说,它让神经网络层之间的“对话”更丰富、更灵活,同时通过严苛的数学“护栏”防止信息被放大或破坏。实验证明,采用mHC的模型在数学推理等任务上表现更优。

Engram
一个“条件记忆”模块。它的设计理念是将“记忆”与“计算”解耦。
模型中的静态知识(如实体、固定表达)被专门存储在一个稀疏的内存表中,这个表可以放在廉价的DRAM里。当需要推理时,再去快速查找。这释放了昂贵的GPU内存(HBM),让其专注于动态计算。

mHC技术通过改善训练稳定性和收敛效率,在一定程度对冲国产芯片在互联带宽与计算密度上的代际差距;而Engram架构则致力于重构内存调度机制,在HBM供应受限的背景下,以更高效的存取策略突破显存容量与带宽制约。野村认为,这两项创新共同构成一套面向国产硬件生态的适配方案,具有明确的工程落地价值。

报告进一步指出,V4发布带来的最直接商业影响,是训练与推理成本的实质性下降。成本端的优化将有效激发下游应用需求,进而催生新一轮AI基础设施建设周期。在此过程中,中国AI硬件厂商有望受益于需求放量与投资前置带来的双重拉动。

市场格局从"一家独大"转向"群雄割据"

野村报告回顾了DeepSeek-V3/R1发布一年后的市场格局变化。在2024年底,DeepSeek的两个模型曾占据OpenRouter上开源模型Token使用量的一半以上。


但到2025年下半年,随着更多玩家加入,其市场份额已显著下降。市场从"一家独大"走向了"群雄割据"。V4面临的竞争环境远比一年前复杂。DeepSeek的"算力管理效率"叠加"性能提升"加速了中国大语言模型与应用发展,也改变了全球竞争格局,推动开源模型更受关注。

软件公司迎来价值提升机遇

野村认为,全球主要云服务商正全力追逐通用人工智能,资本开支竞赛远未停歇,因此V4预计不会对全球AI基础设施市场造成去年那种级别的冲击波。

但全球大模型及应用开发商正背负着日益沉重的资本开支负担。V4若能在维持高性能的同时显著降低训练与推理成本,将帮助这些企业更快地将技术转化为收入,缓解盈利压力。

在应用侧,更强大、更高效的V4将催生更强大的AI智能体。报告观察到,像阿里通义千问App等已经能够以更自动化的方式执行多步骤任务,AI智能体正从"对话工具"转型为能处理复杂任务的"AI助手"。

这些能执行多任务的智能体需要更频繁地与底层大模型交互,将消耗更多Token,进而推高算力需求。因此模型效能的提升不仅不会"杀死软件",反而为领先的软件公司创造了价值。野村强调,需要关注那些能率先利用新一代大模型能力打造出颠覆性AI原生应用或智能体的软件公司。它们的增长天花板可能因模型能力的飞跃而被再次推高。

来源:https://www.163.com/dy/article/KLGR4TAL05198NMR.html

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章
更多
iPhone防抢功能详解:检测抢夺后自动锁定如何保护手机安全

iPhone防抢功能详解:检测抢夺后自动锁定如何保护手机安全

手机被抢后,最令人担忧的往往不是设备本身的损失,而是手机在解锁状态下被他人获取,导致个人隐私泄露与账户安全风险。近期有消息指出,苹果公司正在研发一项全新的iPhone防抢夺安全功能,旨在解决这一核心痛点:当系统检测到设备正被人从用户手中突然夺走时,将自动触发锁定机制,立即保护机内数据。 这项功能实际

时间:2026-05-27 21:25
COMPUTEX精英电脑新品发布 多款WCL平台迷你主机亮相

COMPUTEX精英电脑新品发布 多款WCL平台迷你主机亮相

COMPUTEX 台北国际电脑展即将于下周盛大开幕,作为全球科技产业的重要风向标,各大厂商均已蓄势待发。精英电脑(ECS)近日正式确认参展,并将在展会上重点展示其主板与迷你电脑两大核心产品线,集中呈现公司在AI智能体、边缘计算解决方案、高效数据处理以及智能医疗与嵌入式应用等前沿领域的技术布局与创新成

时间:2026-05-27 21:24
三星工会加薪诉求引争议 李在明批其要求缺乏底线

三星工会加薪诉求引争议 李在明批其要求缺乏底线

韩国总统李在明批评三星电子工会要求将半导体部门15%营业利润作为绩效奖励“过分”,强调利润应分享给投资者和股东。劳资调解失败后,劳动部长将主持恢复谈判,以避免事态升级。这场纠纷触及利润分配等深层议题,其结果可能影响韩国未来劳资政策。

时间:2026-05-27 21:23
韩国KOSPI指数大涨5.5% 日韩股市涨幅持续扩大

韩国KOSPI指数大涨5.5% 日韩股市涨幅持续扩大

亚洲市场日韩股市显著上涨。日经225指数涨幅扩大至3%,报61621 47点;韩国KOSPI指数涨势更猛,涨幅达5 5%,站上7600点关口。两大股指同步大幅上扬,显示区域市场风险偏好显著改善,后续表现及对亚太其他市场的影响值得关注。

时间:2026-05-27 21:22
渡渡鸟B860M隐主板侧插接口设计解析与装机指南

渡渡鸟B860M隐主板侧插接口设计解析与装机指南

街未觉醒推出渡渡鸟B860M-隐主板,采用侧插接口设计并引入磁吸式“隐翼结构”隐藏接口线材,提升装机整洁度。主板融入渡渡鸟IP元素,配备12+1+1+1相供电、DDR5高频内存支持及PCIeGen5扩展接口,提供2 5Gb网卡与Wi-Fi7连接,旨在主流价位提供优化体验。

时间:2026-05-27 21:21
热门专题
更多
刀塔传奇破解版无限钻石下载大全 刀塔传奇破解版无限钻石下载大全
洛克王国正式正版手游下载安装大全 洛克王国正式正版手游下载安装大全
思美人手游下载专区 思美人手游下载专区
好玩的阿拉德之怒游戏下载合集 好玩的阿拉德之怒游戏下载合集
不思议迷宫手游下载合集 不思议迷宫手游下载合集
百宝袋汉化组游戏最新合集 百宝袋汉化组游戏最新合集
jsk游戏合集30款游戏大全 jsk游戏合集30款游戏大全
宾果消消消原版下载大全 宾果消消消原版下载大全
  • 日榜
  • 周榜
  • 月榜
热门教程
更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程