谷歌与DeepMind合并后为何仍存分歧

数码系统

相机 win10

测评 win11

手机智车

华为 Tesla

小米理想

苹果蔚来

游戏软件

LOL 抖音

原神微信

当前位置：首页

业界动态

谷歌与DeepMind合并后为何仍存分歧

热心网友时间：2026-05-21

转载

今年的Google I/O主题演讲，信息量一如既往地密集，甚至密集到让外界有些眼花缭乱，抓不住重点。

作为中国AI行业长期对标的标杆，Google的一举一动都备受关注。然而，本届I/O大会却让不少从业者感到些许困惑：旗舰顶级模型缺席，Agent产品的步伐也显得有些“补课”意味。人们不禁要问，Google此刻的战略重心究竟在哪里？

过去两天，通过与DeepMind CTO Koray Ka vukcuoglu、Google首席AI科学家Jeff Dean以及CEO Sundar Pichai等关键人物的深入交流，一幅更清晰的图景逐渐浮现。而这一切，似乎又绕回到了那个老生常谈却又至关重要的问题上：Google与DeepMind的关系。

Google的当务之急

一个非常明确的信号是，Google内部上下此刻达成了高度共识：它自视为唯一真正的AI全栈公司。这种自信在交流中表露无遗，甚至超出了外界的预期。但这也不免让人联想到ChatGPT横空出世后，Google曾经历过的短暂慌乱——那时它对Bard和自身AI基础设施同样信心十足，却因过度自信而遭遇挫折。

历史是否会重演？接下来的故事版本，很大程度上取决于其内部的资源分配决策。当初先押注Bard，后来证明将资金和算力倾注给DeepMind才是更正确的选择。如今，又到了一个关键的路口。

既然“全栈”被视为巨大的竞争优势，那么Google当前的资源分配逻辑也随之清晰：不再盲目地将最优资源全部堆砌到最前沿的模型探索上，而是更加侧重于“最具可用性的模型”（the most usable models）。

是不是有点似曾相识？

从这个角度看，Gemini 1.5 Flash系列绝非妥协的产物，反而具有最重要的战略意义，并且很可能占据了当前可用算力资源的大头。这与OpenAI和Anthropic等公司聚焦于打造最强标杆模型的策略，形成了鲜明对比。

I/O主题演讲中有一个容易被忽略的演示：Gemini 1.5 Flash在TPU 8i上处理任务时，其吞吐速度之快，恍惚间让人看到了当年那个只追求极致速度的Groq的影子。与此同时，市场对于新模型的一些体验反馈开始出现褒贬不一的声音。现在看来，这其实是上述优先级策略和资源分配必然会导致的结果。

原因何在？其实Google已经反复强调过。Pichai在小范围交流中提到，他们看到的需求量极其庞大，且仍在持续增长。回顾互联网、移动手机的发展历程，就知道此刻应该做什么：迅速识别并满足重度用户之外最广泛的需求。结合当前Agent的热潮，为其提供最可用、最合适而非单纯“最强”的模型，就是Google眼中最重要的机会和当务之急。

那么，这一决策将如何影响未来几个月的竞争格局？

可以预见的是，Pichai所面临的“舆论环境”，很可能将再次因为这些决策而紧张一段时间。

DeepMind的处境与落差

Koray开玩笑说，他连续三年穿着同一件T恤与我交谈。而我问他的问题也有一条贯穿的主线：第一年，我问如何定义“原生多模态”；第二年，探讨多模态的具体实现以及Veo为何如此强大；今年，话题则回到了对当初这个并非共识的技术选择的回顾与评估——它究竟为Google带来了什么。

作为DeepMind对外最主要的代言人，他形容这是Google最正确的决定之一。虽然已不再站在I/O主舞台的中央，但内部影响力依然举足轻重的Jeff Dean也认为，本届大会的各种发布中，视频生成模型Veo的迭代版本“Omni”意义重大，它真正将Gemini过去积累的多模态能力融入了视频领域。

在由DeepMind主导的模型研发线上，他们所定义的“智能”必须面向未来，不能仅仅是对今天已在语言等领域表现突出的能力做单线延伸。但关于如何训练出这样的智能，目前依然没有“标准配方”，本质上仍需要不断进行大规模实验。

而实验，就意味着巨大的资源占用。

经过多次交流，一个明显的张力感浮现出来：Google甚至需要考虑，当看到模型在某一模态上的能力显著超越其他模态时，也需要进行“克制”。

Omni也是本届I/O大会上，唯一由伟大的DeepMind CEO Demis Hassabis亲自站台发布的模型。但发布后，已经有不少体验反馈认为其效果未达预期。一个重要原因在于，此次率先发布的是Omni Flash版本。

这与Gemini先发布Flash版本的策略有所不同。Pichai对Omni的定义，是一个在代际上领先于现有所有模型的全新模型。因此，出于安全和负责任的态度，选择先发布Omni Flash。

结合上文提到的Google对当前“最重要的事”的判断，这可能再次埋下伏笔。

DeepMind所追求的原生多模态路线，其发展似乎可以分为三个阶段：

最初，这是一个即便在内部也压力重重、并非共识的技术赌注；

到了第二阶段，因为这条路线成功催生了像Veo和Nano Banana这样令人惊艳的成果，许多质疑随之消散；

然而现在进入第三阶段，其纯粹技术探索的色彩正在减弱。令人惊讶的是，它似乎更多地被Google这个商业实体的实际需求所内化和吸纳了。

一个非常有意思的内部思考方式也指向这一点：Google认为，这种原生多模态能力正在产生的另一个重要回报，在于它对Google“软硬件结合”全栈路线的助力。多模态能力可以用来加速自身硬件（如TPU）的迭代优化，AI已经开始用于这种“内循环”，而不是优先用于让DeepMind继续捣鼓出下一个Nano Banana级别的突破性产品。

于是，那个幽灵般的问题再次浮现：DeepMind有能力打造出的最强模型，与目前能切实提升搜索等核心业务收入和用户体验的实用模型，究竟谁对Google更重要？

现在看来，Google和DeepMind，似乎仍然没有完全站在同一条心上。

来源:https://36kr.com/p/3818729353905029

上一篇：小米车主高阶驾驶培训限时报名三小时课程仅需199元

下一篇：嘉豪品牌营销策略是否过度引发行业思考