DeepSeek引发AGI反思潮 技术价值被低估与重估
二月,AI行业发生了一些耐人寻味的变化。
一、DeepSeek 反思潮
一场由DeepSeek引发的集体反思,正在席卷整个行业。无论是大厂内部的“AGI创业团队”,还是那些明星创业公司,都不得不重新审视自己的战略。这个不花一分钱推广、仅凭技术实力就冲到DAU 4000万的玩家,给所有人上了一课:在AGI这场游戏里,过去的玩法可能不灵了。
最直接的变化,是战略重心的回调。大模型创业公司开始把“技术突破”重新摆到最高优先级,其重要性甚至超越了产品迭代。有接触过月之暗面(Moonshot)联合创始人张予彤的VC反馈,DeepSeek的崛起让团队深刻反思了过去一年“类互联网打法”的局限性——过度依赖产品投流,而在基础模型上的投入相对不足。接下来,Moonshot计划将更多资源倾斜到技术研发上。
这并非个例。对于那些以技术生态位为目标的AGI公司来说,这几乎成了一种普遍转向。与之相伴的,是产品团队地位的微妙变化。DeepSeek的成功似乎传递出一个信号:在AGI时代,极致的模型能力本身或许就是最好的增长引擎,产品经理和流量投放的传统角色,正在被重新定义。
2024年那场轰轰烈烈的“投流大战”,最终以DeepSeek的“零投放”神话画上句号。投入越多,此刻的反思可能就越深。例如,MiniMax前产品一号位的离职,据传就与创始人在市场投放策略上存在分歧有关。这家公司早期的组织架构完全遵循互联网产品逻辑,按产品线划分团队,产品人员一度超过200人。但从2024年年中开始,调整就已启动,产品团队的规模预计将进一步收索。
另一个值得玩味的现象,是巨头之间攻守态势的逆转。
过去一周,腾讯元宝接入了DeepSeek的模型能力后,在中国区苹果应用商店的免费榜排名迅速攀升至第二,仅次于DeepSeek,将此前势头正猛的字节豆包甩在身后。在这场“DeepSeek+”的浪潮中,相比百度、阿里、字节等拥有自研模型“技术包袱”的大厂,腾讯反而显得轻装上阵。其元宝产品连同微信等生态,迅速拥抱外部最强模型,一举从过去两年的被动追赶,转向了主动进攻。
要知道,过去两年腾讯在大模型和AIGC领域虽持续投入,但声量始终不温不火,甚至因为资源向基础模型倾斜,影响了文生视频等方向的投入,导致部分核心人才流向快手、字节等竞争对手。某种程度上,DeepSeek的出现,意外地“助攻”了腾讯的大模型业务。
这种局面甚至催生了一种极端论调:基础模型的研究,最终可能只需要DeepSeek一家就够了。随之而来的,是投资圈开始出现老股东寻求退股的声音,认为“智谱、阶跃甚至字节、阿里等公司的大模型都没戏了”。对于这种观点,需要保持警惕,现在下结论为时过早。
有个比喻或许能形象地描绘当前中国大模型创业的格局:
一个天赋与资源俱佳的“富二代学霸”,做出了一份接近满分的答卷,并且把答案公开了。另一个能承担资源与面子成本的“富二代学渣”,直接抄了答案,也拿到了高分。现在,剩下一群靠自身努力、原本能考七八十分的“寒门学子”,以及同样出身优越但努力方向错了的“学生”,站在原地,不知所措。
现实世界的竞争往往无关公平,只论结果。打破这种结构性困境极其困难,可能需要“一命二运三风水四积阴德五读书”般的多重因素叠加,但对于场上的玩家而言,除了继续前行,别无选择。
回到现实层面,字节跳动大模型团队的调整,正是对竞争格局剧变的直接回应。在DeepSeek横空出世之前,行业内外对字节豆包的评价颇高,其增长势头也一度对Kimi形成了合围之势。然而,DeepSeek霸屏整个春节后,字节内部清醒地认识到,AGI依然是一个高悬枝头的果实,需要更具战斗力的将领带队攻坚。
据验证,字节的基础模型技术研发负责人近期发生了变更。此前由朱文佳负责的这部分工作,在春节后调整为由吴永辉接手。包括黄文灏等2024年新加入的技术骨干,都将向吴永辉汇报。而朱文佳则转向负责模型应用方向,两人均向梁汝波汇报。
回顾2023年字节大模型团队组建之初,核心成员多来自内部业务线,如搜索、抖音、西瓜视频、TikTok等,这些成员在字节过往的成功产品中屡经战阵。朱文佳麾下各小组的负责人,也少有外部空降的高阶人才。
但从2024年年中开始,情况发生了变化,越来越多AGI领域的知名技术人才被招入麾下,团队开始“换血”。知情人士分析,这背后的原因在于,以朱文佳为代表的、拥有搜索广告推广背景的团队,其技术范式与需要碘伏性创新的大模型研发,可能存在不适配的情况。字节和MiniMax等公司早期对强化学习(RL)技术路线的低估,就是一个例证。吴永辉的上任,意味着字节换血的决心更加彻底。
吴永辉此前在谷歌的职级仅次于Jeff Dean,是Gemini项目的核心贡献者之一。据硅谷华人技术圈的信源,他擅长模型工程。谷歌自发布Transformer以来,在大模型赛道上的创新是系统性的,涵盖从底层框架、算力集群到上层算法的全栈能力。从知识结构和经验来看,吴永辉确实更契合大模型技术掌舵人的角色。
有信息显示,朱文佳在主导技术研发期间,在人才任用上更倾向于倚重曾并肩作战的“老战友”,同时在基础研究的创新想法采纳上,风格相对保守。这种逻辑不难理解:面对AGI极高的不确定性,使用熟悉的团队能最大程度降低沟通成本。如果AGI是一个触手可及的“低垂果实”,那么依靠成熟团队和资源碾压的策略或许可行,但现实显然更为复杂。
据了解,新加入字节的技术人员曾提出过诸如SPPO强化学习、火星优化器等高效训练方向的技术方案,但一些方案在自行验证有效后,经朱文佳移交身边团队复现,却被反馈“不work”而搁置。此前字节内部文生视频方向曾进行赛马,其他团队胜出,但后续成果被划归到了朱文佳直接领导的Seed团队。
大模型是一项有极高门槛的创新技术,无论在大厂还是创业公司,都需要真正的创业者心态。第一批低估AGI技术难度的人已经被市场教育,但并非所有人都已吸取教训。
二、AGI 的壁垒在哪?
“算法是没有壁垒的。”一位专注大模型领域的风险投资人这样评论道。类似的论调还有:“DeepSeek现象只是昙花一现,6个月后就会被追上”,以及“大模型创业公司必然消亡,最终赢家只有DeepSeek和互联网大厂,看看腾讯元宝就知道了”。
在匆忙下结论之前,或许应该先回答一个更根本的问题:DeepSeek已经实现终极的AGI了吗?答案显然是否定的。即便是DeepSeek官方也承认,其最新的R1模型仍存在通用能力不足、语言混淆、提示词敏感、软件工程能力欠缺等缺陷。
如果在这个问题上能达成共识,那么接下来的思考就顺理成章:
第一,DeepSeek是否必然能解决通向AGI的所有技术难题?
第二,实现终极AGI,是否仅凭DeepSeek一己之力就已足够?
第三,中国是否只有DeepSeek一家,具备攻克AGI各项技术难关的实力?
以腾讯元宝为例。虽然接入DeepSeek让它赢得了阶段性胜利,但没人能保证DeepSeek会永远“开源”或保持领先。一旦“开卷考试”的规则改变,竞争格局必将再次翻转。
对于上述问题,持怀疑态度是合理的。原因很简单:DeepSeek并未,也不可能汇聚中国乃至全球所有的顶尖AGI人才。即便是曾经群星璀璨的OpenAI,也在2023至2024年间经历了核心人才的大量流失,其发展进程同样受到影响。
如果将AGI视为整个AI行业共同奔赴的终极目标,而非某一家公司的专属责任,就会产生一种朴素的预感:这场AGI的大航海时代,需要的不仅仅是一个“DeepSeek”,最终也不会只有一个“DeepSeek”。AGI是一个需要庞大生态的行业,而非一个单一的产品。
在近期的行业交流中,一个观点被反复提及:造成从业者这种“既高度重视,又下意识低估”的矛盾心理,根源或许在于互联网思维的强大惯性。
有经历过互联网大战的从业者举例:“互联网产品的竞争,到最后往往只剩一家,比如出行大战、3Q大战。”但这种类比可能并不恰当。因为互联网时代的产品技术,如搜索广告推荐,当其范式从谷歌确立再传入国内时,技术天花板已大致可见。而DeepSeek的出现恰恰证明,AGI的天花板远比OpenAI目前所触及的更高,前方仍是未知的星辰大海。
能与AGI或大模型在技术难度和不确定性上类比的,或许是自动驾驶的L4级别,或是英伟达的GPU芯片。虽然L4自动驾驶至今未能完全实现,但从L2到L4的演进过程中,已经催生了不同维度的商业化产品(如扫地机器人)。同样,AGI也将是一个逐步取得突破、并在此过程中持续催生新商业形态的漫长旅程。
有些团队确实不具备参与最终AGI角逐的技术实力,但这并不能推导出“DeepSeek是唯一有资格的创业团队”或“中国只需要一家AGI公司”的结论。即便是海外的基础模型阵营,也在能力上形成了差异化分工,例如GPT更擅长理解指令,而Claude在代码生成上表现突出。
回顾更大的行业规律:如果说搜索广告推荐技术由谷歌开启,在字节跳动手中推至巅峰;那么,由OpenAI开启的大模型技术,又将由谁推向极致?互联网时代用了二十年才得出答案,期间故事无数。AGI时代,又怎会在短短两年内就决出最终的胜者?
那么,AGI的真正壁垒究竟是什么?
一个核心观点是:算法的优势与技术的创新,虽然无法构成永恒的壁垒,但却能赢得至关重要的“时间差”。
以月之暗面为例。事实上,Moonshot与DeepSeek均成立于2023年上半年,前后相差仅一个月。
更早之前,在2021年智源研究院的“悟道”大模型项目中,Moonshot创始人杨植麟便是悟道2.0的核心开发者之一,从底层Transformer到上层大模型训练,拥有系统性的研究背景。相比之下,DeepSeek创始团队,包括梁文锋,虽是计算机科班出身,但在NLP、Transformer与预训练等大模型核心技术的积累上,与Moonshot团队客观上存在一个学习与追赶的时间差。
如果从Moonshot成立之初就具备训练千亿参数模型的能力算起,到DeepSeek于2024年5月发布V2模型,这个时间差粗略估算大约是一年;如果严格考量V2模型在训练成本大幅降低上的研发周期,这个差距也至少在半年以上。
然而,由于Moonshot在过去两年将战略重心偏向了产品增长与市场投放,而非底层技术的持续突破,它与DeepSeek在基础模型上的差距,从2023年的“领先半年以上”,戏剧性地变成了2025年的“落后XXX年”。在互联网思维的过度指导下,一进一退之间,Moonshot至少丧失了一年的先发优势,从主动陷入了被动。
据知情人士透露,DeepSeek内部计划在今年3月发布V3.5模型,并在6月前发布V4。这意味着,即便其他团队的基础模型能力在6月追平了当前的V3或R1,作为先行者,DeepSeek已经利用这个时间差,赢得了宝贵的下一代技术研发窗口,以及这半年内构建起的生态护城河。模型效果可以追赶,但用户习惯和生态优势却难以轻易撼动。
是坐享其成,还是投身竞争,亦或是认清形势、及早转向自身优势领域?这对所有参与者来说,都是一道不易回答的选择题。尽管DeepSeek当前风头无两,但AGI依然是一个高悬的果实,它的成熟离不开持续不断的底层创新。
在这条漫长的跋涉之路上,一定会有人退出,无论是投资人、创业者还是技术人员。但无论如何,这条路上不会,也不应该只有DeepSeek一个身影。
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
可视化建站工具快站:零代码轻松创建专业网站
在众多可视化建站平台中,搜狐快站以其一站式的解决方案,成为企业搭建官网和移动端应用的优选工具。它提供直观的拖拽式页面编辑器、功能完善的内容管理后台、海量行业模板库,并确保所有页面完美适配手机、平板等不同屏幕。更值得一提的是,其额外集成了App快速生成、微信公众号管理以及微信小程序开发等核心能力,全面
智合同智慧应用平台助力企业高效签约
智合同是一款深度融合人工智能技术与法律服务的创新平台,由天津滨海高新技术产业开发区内一家具备独角兽潜力的科技企业自主研发。目前,品牌已在武汉、深圳、南京等核心城市设立分支机构,形成覆盖全国的服务网络,专注于提供基于人工智能、大数据与互联网的综合解决方案。 自2016年成立以来,智合同在知识产权与技术
iH5互动大师专业H5制作工具2000多家知名企业选择
在数字内容创作领域,一款高效且专业的工具往往是品牌与用户建立深度连接的关键。无论是国际巨头如Google、Uber,还是国内领先企业如京东、澎湃新闻,其背后频繁出现的动态、交互式内容,常离不开一类核心技术的支持——H5。目前,已有超过2000家知名品牌借助专业的H5工具进行创意表达,而一个汇聚了十万
高级面试辅导助你成功通过求职面试
面试教练(JobInterviewCoach)是一家致力于提供专业级面试辅导服务的在线平台,其核心使命在于系统化赋能求职者,全面提升面试准备效率与成功率。无论您是即将踏入社会的应届毕业生,还是寻求职业突破的资深职场人,该平台均能通过体系化的工具与个性化服务,助您从容应对求职过程中的关键挑战。 平台官
Huru人工智能视频面试平台助你高效准备求职
在当今竞争激烈的求职市场中,视频面试已成为企业招聘的常见环节。如何系统、高效地准备面试,成为众多求职者关注的焦点。Huru ai 作为一款人工智能驱动的面试准备平台,正通过智能模拟与实时反馈,为求职者提供专业、个性化的面试提升方案。 简而言之,Huru ai 是一个基于 AI 技术的视频面试模拟与辅
- 日榜
- 周榜
- 月榜
1
2
3
4
5
6
7
8
9
10
相关攻略
2015-03-10 11:25
2015-03-10 11:05
2021-08-04 13:30
2015-03-10 11:22
2015-03-10 12:39
2022-05-16 18:57
2025-05-23 13:43
2025-05-23 14:01
热门教程
- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程
热门话题

