DeepSeek引发AGI反思潮技术价值被低估与重估

数码系统

相机 win10

测评 win11

手机智车

华为 Tesla

小米理想

苹果蔚来

游戏软件

LOL 抖音

原神微信

当前位置：首页

DeepSeek引发AGI反思潮技术价值被低估与重估

热心网友时间：2026-05-16

转载

二月，AI行业发生了一些耐人寻味的变化。

一、DeepSeek 反思潮

一场由DeepSeek引发的集体反思，正在席卷整个行业。无论是大厂内部的“AGI创业团队”，还是那些明星创业公司，都不得不重新审视自己的战略。这个不花一分钱推广、仅凭技术实力就冲到DAU 4000万的玩家，给所有人上了一课：在AGI这场游戏里，过去的玩法可能不灵了。

最直接的变化，是战略重心的回调。大模型创业公司开始把“技术突破”重新摆到最高优先级，其重要性甚至超越了产品迭代。有接触过月之暗面（Moonshot）联合创始人张予彤的VC反馈，DeepSeek的崛起让团队深刻反思了过去一年“类互联网打法”的局限性——过度依赖产品投流，而在基础模型上的投入相对不足。接下来，Moonshot计划将更多资源倾斜到技术研发上。

这并非个例。对于那些以技术生态位为目标的AGI公司来说，这几乎成了一种普遍转向。与之相伴的，是产品团队地位的微妙变化。DeepSeek的成功似乎传递出一个信号：在AGI时代，极致的模型能力本身或许就是最好的增长引擎，产品经理和流量投放的传统角色，正在被重新定义。

2024年那场轰轰烈烈的“投流大战”，最终以DeepSeek的“零投放”神话画上句号。投入越多，此刻的反思可能就越深。例如，MiniMax前产品一号位的离职，据传就与创始人在市场投放策略上存在分歧有关。这家公司早期的组织架构完全遵循互联网产品逻辑，按产品线划分团队，产品人员一度超过200人。但从2024年年中开始，调整就已启动，产品团队的规模预计将进一步收索。

另一个值得玩味的现象，是巨头之间攻守态势的逆转。

过去一周，腾讯元宝接入了DeepSeek的模型能力后，在中国区苹果应用商店的免费榜排名迅速攀升至第二，仅次于DeepSeek，将此前势头正猛的字节豆包甩在身后。在这场“DeepSeek+”的浪潮中，相比百度、阿里、字节等拥有自研模型“技术包袱”的大厂，腾讯反而显得轻装上阵。其元宝产品连同微信等生态，迅速拥抱外部最强模型，一举从过去两年的被动追赶，转向了主动进攻。

要知道，过去两年腾讯在大模型和AIGC领域虽持续投入，但声量始终不温不火，甚至因为资源向基础模型倾斜，影响了文生视频等方向的投入，导致部分核心人才流向快手、字节等竞争对手。某种程度上，DeepSeek的出现，意外地“助攻”了腾讯的大模型业务。

这种局面甚至催生了一种极端论调：基础模型的研究，最终可能只需要DeepSeek一家就够了。随之而来的，是投资圈开始出现老股东寻求退股的声音，认为“智谱、阶跃甚至字节、阿里等公司的大模型都没戏了”。对于这种观点，需要保持警惕，现在下结论为时过早。

有个比喻或许能形象地描绘当前中国大模型创业的格局：

一个天赋与资源俱佳的“富二代学霸”，做出了一份接近满分的答卷，并且把答案公开了。另一个能承担资源与面子成本的“富二代学渣”，直接抄了答案，也拿到了高分。现在，剩下一群靠自身努力、原本能考七八十分的“寒门学子”，以及同样出身优越但努力方向错了的“学生”，站在原地，不知所措。

现实世界的竞争往往无关公平，只论结果。打破这种结构性困境极其困难，可能需要“一命二运三风水四积阴德五读书”般的多重因素叠加，但对于场上的玩家而言，除了继续前行，别无选择。

回到现实层面，字节跳动大模型团队的调整，正是对竞争格局剧变的直接回应。在DeepSeek横空出世之前，行业内外对字节豆包的评价颇高，其增长势头也一度对Kimi形成了合围之势。然而，DeepSeek霸屏整个春节后，字节内部清醒地认识到，AGI依然是一个高悬枝头的果实，需要更具战斗力的将领带队攻坚。

据验证，字节的基础模型技术研发负责人近期发生了变更。此前由朱文佳负责的这部分工作，在春节后调整为由吴永辉接手。包括黄文灏等2024年新加入的技术骨干，都将向吴永辉汇报。而朱文佳则转向负责模型应用方向，两人均向梁汝波汇报。

回顾2023年字节大模型团队组建之初，核心成员多来自内部业务线，如搜索、抖音、西瓜视频、TikTok等，这些成员在字节过往的成功产品中屡经战阵。朱文佳麾下各小组的负责人，也少有外部空降的高阶人才。

但从2024年年中开始，情况发生了变化，越来越多AGI领域的知名技术人才被招入麾下，团队开始“换血”。知情人士分析，这背后的原因在于，以朱文佳为代表的、拥有搜索广告推广背景的团队，其技术范式与需要碘伏性创新的大模型研发，可能存在不适配的情况。字节和MiniMax等公司早期对强化学习（RL）技术路线的低估，就是一个例证。吴永辉的上任，意味着字节换血的决心更加彻底。

吴永辉此前在谷歌的职级仅次于Jeff Dean，是Gemini项目的核心贡献者之一。据硅谷华人技术圈的信源，他擅长模型工程。谷歌自发布Transformer以来，在大模型赛道上的创新是系统性的，涵盖从底层框架、算力集群到上层算法的全栈能力。从知识结构和经验来看，吴永辉确实更契合大模型技术掌舵人的角色。

有信息显示，朱文佳在主导技术研发期间，在人才任用上更倾向于倚重曾并肩作战的“老战友”，同时在基础研究的创新想法采纳上，风格相对保守。这种逻辑不难理解：面对AGI极高的不确定性，使用熟悉的团队能最大程度降低沟通成本。如果AGI是一个触手可及的“低垂果实”，那么依靠成熟团队和资源碾压的策略或许可行，但现实显然更为复杂。

据了解，新加入字节的技术人员曾提出过诸如SPPO强化学习、火星优化器等高效训练方向的技术方案，但一些方案在自行验证有效后，经朱文佳移交身边团队复现，却被反馈“不work”而搁置。此前字节内部文生视频方向曾进行赛马，其他团队胜出，但后续成果被划归到了朱文佳直接领导的Seed团队。

大模型是一项有极高门槛的创新技术，无论在大厂还是创业公司，都需要真正的创业者心态。第一批低估AGI技术难度的人已经被市场教育，但并非所有人都已吸取教训。

二、AGI 的壁垒在哪？

“算法是没有壁垒的。”一位专注大模型领域的风险投资人这样评论道。类似的论调还有：“DeepSeek现象只是昙花一现，6个月后就会被追上”，以及“大模型创业公司必然消亡，最终赢家只有DeepSeek和互联网大厂，看看腾讯元宝就知道了”。

在匆忙下结论之前，或许应该先回答一个更根本的问题：DeepSeek已经实现终极的AGI了吗？答案显然是否定的。即便是DeepSeek官方也承认，其最新的R1模型仍存在通用能力不足、语言混淆、提示词敏感、软件工程能力欠缺等缺陷。

如果在这个问题上能达成共识，那么接下来的思考就顺理成章：

第一，DeepSeek是否必然能解决通向AGI的所有技术难题？

第二，实现终极AGI，是否仅凭DeepSeek一己之力就已足够？

第三，中国是否只有DeepSeek一家，具备攻克AGI各项技术难关的实力？

以腾讯元宝为例。虽然接入DeepSeek让它赢得了阶段性胜利，但没人能保证DeepSeek会永远“开源”或保持领先。一旦“开卷考试”的规则改变，竞争格局必将再次翻转。

对于上述问题，持怀疑态度是合理的。原因很简单：DeepSeek并未，也不可能汇聚中国乃至全球所有的顶尖AGI人才。即便是曾经群星璀璨的OpenAI，也在2023至2024年间经历了核心人才的大量流失，其发展进程同样受到影响。

如果将AGI视为整个AI行业共同奔赴的终极目标，而非某一家公司的专属责任，就会产生一种朴素的预感：这场AGI的大航海时代，需要的不仅仅是一个“DeepSeek”，最终也不会只有一个“DeepSeek”。AGI是一个需要庞大生态的行业，而非一个单一的产品。

在近期的行业交流中，一个观点被反复提及：造成从业者这种“既高度重视，又下意识低估”的矛盾心理，根源或许在于互联网思维的强大惯性。

有经历过互联网大战的从业者举例：“互联网产品的竞争，到最后往往只剩一家，比如出行大战、3Q大战。”但这种类比可能并不恰当。因为互联网时代的产品技术，如搜索广告推荐，当其范式从谷歌确立再传入国内时，技术天花板已大致可见。而DeepSeek的出现恰恰证明，AGI的天花板远比OpenAI目前所触及的更高，前方仍是未知的星辰大海。

能与AGI或大模型在技术难度和不确定性上类比的，或许是自动驾驶的L4级别，或是英伟达的GPU芯片。虽然L4自动驾驶至今未能完全实现，但从L2到L4的演进过程中，已经催生了不同维度的商业化产品（如扫地机器人）。同样，AGI也将是一个逐步取得突破、并在此过程中持续催生新商业形态的漫长旅程。

有些团队确实不具备参与最终AGI角逐的技术实力，但这并不能推导出“DeepSeek是唯一有资格的创业团队”或“中国只需要一家AGI公司”的结论。即便是海外的基础模型阵营，也在能力上形成了差异化分工，例如GPT更擅长理解指令，而Claude在代码生成上表现突出。

回顾更大的行业规律：如果说搜索广告推荐技术由谷歌开启，在字节跳动手中推至巅峰；那么，由OpenAI开启的大模型技术，又将由谁推向极致？互联网时代用了二十年才得出答案，期间故事无数。AGI时代，又怎会在短短两年内就决出最终的胜者？

那么，AGI的真正壁垒究竟是什么？

一个核心观点是：算法的优势与技术的创新，虽然无法构成永恒的壁垒，但却能赢得至关重要的“时间差”。

以月之暗面为例。事实上，Moonshot与DeepSeek均成立于2023年上半年，前后相差仅一个月。

更早之前，在2021年智源研究院的“悟道”大模型项目中，Moonshot创始人杨植麟便是悟道2.0的核心开发者之一，从底层Transformer到上层大模型训练，拥有系统性的研究背景。相比之下，DeepSeek创始团队，包括梁文锋，虽是计算机科班出身，但在NLP、Transformer与预训练等大模型核心技术的积累上，与Moonshot团队客观上存在一个学习与追赶的时间差。

如果从Moonshot成立之初就具备训练千亿参数模型的能力算起，到DeepSeek于2024年5月发布V2模型，这个时间差粗略估算大约是一年；如果严格考量V2模型在训练成本大幅降低上的研发周期，这个差距也至少在半年以上。

然而，由于Moonshot在过去两年将战略重心偏向了产品增长与市场投放，而非底层技术的持续突破，它与DeepSeek在基础模型上的差距，从2023年的“领先半年以上”，戏剧性地变成了2025年的“落后XXX年”。在互联网思维的过度指导下，一进一退之间，Moonshot至少丧失了一年的先发优势，从主动陷入了被动。

据知情人士透露，DeepSeek内部计划在今年3月发布V3.5模型，并在6月前发布V4。这意味着，即便其他团队的基础模型能力在6月追平了当前的V3或R1，作为先行者，DeepSeek已经利用这个时间差，赢得了宝贵的下一代技术研发窗口，以及这半年内构建起的生态护城河。模型效果可以追赶，但用户习惯和生态优势却难以轻易撼动。

是坐享其成，还是投身竞争，亦或是认清形势、及早转向自身优势领域？这对所有参与者来说，都是一道不易回答的选择题。尽管DeepSeek当前风头无两，但AGI依然是一个高悬的果实，它的成熟离不开持续不断的底层创新。

在这条漫长的跋涉之路上，一定会有人退出，无论是投资人、创业者还是技术人员。但无论如何，这条路上不会，也不应该只有DeepSeek一个身影。

来源:https://www.leiphone.com/category/ai/fFgDL0QtukcIvAnq.html

上一篇：十万卡集群建设必要性解析：从技术储备到应用前景

下一篇：谷歌首席科学家Jeff Dean揭秘Gemini研发历程