DeepSeek-V4与姚顺雨大模型联袂发布,下月震撼登场
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
新智元报道
编辑:艾伦
【新智元导读】据《白鲸实验室》独家爆料,DeepSeek V4 和由姚顺雨领衔操刀的混元新模型,均预计将于下个月(2026年4月)发布。
3月11日,OpenRouter 新上线了两个神秘模型——Healer Alpha 与 Hunter Alpha。
OpenRouter 页面显示,Healer Alpha 被描述为具备视觉、听觉、推理与行动能力的前沿全模态模型;
社区因此迅速将其与尚未发布的新一代国产模型联系起来,据称捕捉到了“系统提示词中要求严格遵守中国法律法规”。
而就在3月12日,据《白鲸实验室》独家爆料(独家|梁文锋将把DeepSeek V4撞上姚顺雨):
DeepSeek V4 将于4月正式上线。
作为梁文锋打磨已久的多模态大模型,DeepSeek-V4 除了代码能力跃升,还会在长期记忆上取得突破。
这一方向与 DeepSeek 团队近几个月的公开研究脉络基本一致。
2026年1月,梁文锋署名的论文《Conditional Memory via Scalable Lookup》提出“条件记忆”机制;
拓展阅读:梁文锋署名新论文,DeepSeek-V4架构首曝?直击Transformer致命缺陷
2025年12月的《mHC: Manifold-Constrained Hyper-Connections》则继续指向底层架构优化。
拓展阅读:刚刚,DeepSeek扔出大杀器,梁文锋署名!暴力优化AI架构
两篇论文都在尝试处理 Transformer 在记忆、训练稳定性和长上下文上的瓶颈。
据《白鲸实验室》独家爆料(独家|梁文锋将把DeepSeek V4撞上姚顺雨):
梁文锋过去半年的主要工作,是补齐 DeepSeek 在视觉内容处理和 AI 搜索上的短板。
为强化 AI 搜索能力,DeepSeek 早在去年就已经与百度展开合作。
梁文锋这次为 DeepSeek V4 设定的关键迭代方向,正是长期记忆能力。
DeepSeek V4 还将深度适配国产芯片,并有望成为首个完全跑在国产算力生态上的大模型。
另一个已被公开验证的现实是,DeepSeek 的产品声量已经抬高了市场预期。
DeepSeek App 上线至2025年2月9日,累计下载量已超过1.1亿次,周活跃用户规模最高接近9700万。
姚顺雨的的全新混元模型
也计划于4月发布
DeepSeek 之外,腾讯也在为4月准备新动作。
姚顺雨已于2025年12月出任腾讯总办首席AI科学家,同时兼任 AI Infra 部和大语言模型部负责人;
拓展阅读:突发!OpenAI大神姚顺雨,任腾讯首席AI科学家
据《白鲸实验室》独家爆料(独家|梁文锋将把DeepSeek V4撞上姚顺雨):
姚顺雨也将在4月发布新的混元模型,规模约为30B 参数。
早在2025年初,姚顺雨就已经接受邀请回国;实际上,姚顺雨对新模型的准备早已开始,而不是只有官宣后的不到半年时间。
今年1月末,《晚点LatePost》也已爆料(字节、阿里、腾讯 AI 大战全记录:一场影响命运的战争):
在腾讯内部,姚顺雨要求团队不要以打榜为导向。
从公开轨迹看,4月这一轮更新不会只是一次参数竞赛。
DeepSeek 的已知研究正向长期记忆、多模态和底层架构延伸,腾讯混元则在上文下学习真实任务评测上加快补课。
两条路线很不一样,但都在试图回答同一个问题:下一个阶段的大模型,究竟该怎样真正走进生产环境。
参考资料:
独家|梁文锋将把DeepSeek V4撞上姚顺雨
字节、阿里、腾讯 AI 大战全记录:一场影响命运的战争
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
具身智能研发框架Dexbotic重塑机器人开发流程
近日,开源具身智能原生框架Dexbotic宣布正式支持以RLinf作为其分布式强化学习后端。对具身智能开发者而言,这不仅是一次普通的工程适配,更意味着VLA模型研发中长期存在的「SFT与RL割裂」问题,正在被真正打通。 这是一种典型的「乐高式协作」:双方不强行Fork、不粗暴揉合代码,而是保持清晰边
CTO如何平衡AI效率提升与团队建设管理
最近,一个反复出现的新闻标题越来越常见:某大型企业一边高调宣扬AI带来的效率提升,一边大规模裁员。 主角轮番更替,背后的逻辑却如出一辙。企业既面临内部削减成本的压力,又需要向外界展示竞争优势。对许多企业而言,这意味着加大AI的使用力度,同时裁减被认为“多余”的员工——尽管目前对AI能力与可靠性的评估
OpenAI发布三款实时语音模型支持推理翻译与转录
OpenAI近期在语音AI领域动作频频,正式发布了三款全新的实时语音模型。官方表示,此举旨在“为开发者开启全新的语音应用类别”,推动语音交互技术的创新边界。这三款模型分别聚焦推理、翻译与转录三大核心功能,各具特色,预示着实时语音应用将迎来更丰富的可能性。 简单来说,这三款新品分别瞄准了实时对话推理、
捷克Albert超市借力AI货架扫描机器人提升运营效率
近日,Brain Corp发布了与捷克领先零售商Albert合作扩展AI货架扫描机器人的最新成果报告。报告显示,由人工智能驱动的自动化库存盘点解决方案在实际门店运营中取得了“高度成功”的表现,有效提升了零售运营的效率和准确性。 Albert是捷克知名的零售品牌,隶属于国际零售巨头Ahold Delh
OpenAI发布Daybreak网络安全AI模型
网络安全领域迎来重大进展。今日,OpenAI正式推出其专为网络安全打造的AI模型——Daybreak。这并非一次普通的功能升级,而是一个集成了多重技术能力的全新解决方案。 根据官方披露,Daybreak的核心架构由三大关键部分组成:其一是作为推理基础的GPT-5 5模型;其二是强大的Codex代码生
- 日榜
- 周榜
- 月榜
1
2
3
4
5
6
7
8
9
10
相关攻略
2015-03-10 11:25
2015-03-10 11:05
2021-08-04 13:30
2015-03-10 11:22
2015-03-10 12:39
2022-05-16 18:57
2025-05-23 13:43
2025-05-23 14:01
热门教程
- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程
热门话题

