谷歌与DeepMind合并后为何仍存分歧
今年的Google I/O主题演讲,信息量一如既往地密集,甚至密集到让外界有些眼花缭乱,抓不住重点。
作为中国AI行业长期对标的标杆,Google的一举一动都备受关注。然而,本届I/O大会却让不少从业者感到些许困惑:旗舰顶级模型缺席,Agent产品的步伐也显得有些“补课”意味。人们不禁要问,Google此刻的战略重心究竟在哪里?
过去两天,通过与DeepMind CTO Koray Ka vukcuoglu、Google首席AI科学家Jeff Dean以及CEO Sundar Pichai等关键人物的深入交流,一幅更清晰的图景逐渐浮现。而这一切,似乎又绕回到了那个老生常谈却又至关重要的问题上:Google与DeepMind的关系。
Google的当务之急
一个非常明确的信号是,Google内部上下此刻达成了高度共识:它自视为唯一真正的AI全栈公司。这种自信在交流中表露无遗,甚至超出了外界的预期。但这也不免让人联想到ChatGPT横空出世后,Google曾经历过的短暂慌乱——那时它对Bard和自身AI基础设施同样信心十足,却因过度自信而遭遇挫折。
历史是否会重演?接下来的故事版本,很大程度上取决于其内部的资源分配决策。当初先押注Bard,后来证明将资金和算力倾注给DeepMind才是更正确的选择。如今,又到了一个关键的路口。
既然“全栈”被视为巨大的竞争优势,那么Google当前的资源分配逻辑也随之清晰:不再盲目地将最优资源全部堆砌到最前沿的模型探索上,而是更加侧重于“最具可用性的模型”(the most usable models)。
是不是有点似曾相识?
从这个角度看,Gemini 1.5 Flash系列绝非妥协的产物,反而具有最重要的战略意义,并且很可能占据了当前可用算力资源的大头。这与OpenAI和Anthropic等公司聚焦于打造最强标杆模型的策略,形成了鲜明对比。
I/O主题演讲中有一个容易被忽略的演示:Gemini 1.5 Flash在TPU 8i上处理任务时,其吞吐速度之快,恍惚间让人看到了当年那个只追求极致速度的Groq的影子。与此同时,市场对于新模型的一些体验反馈开始出现褒贬不一的声音。现在看来,这其实是上述优先级策略和资源分配必然会导致的结果。
原因何在?其实Google已经反复强调过。Pichai在小范围交流中提到,他们看到的需求量极其庞大,且仍在持续增长。回顾互联网、移动手机的发展历程,就知道此刻应该做什么:迅速识别并满足重度用户之外最广泛的需求。结合当前Agent的热潮,为其提供最可用、最合适而非单纯“最强”的模型,就是Google眼中最重要的机会和当务之急。

那么,这一决策将如何影响未来几个月的竞争格局?
可以预见的是,Pichai所面临的“舆论环境”,很可能将再次因为这些决策而紧张一段时间。
DeepMind的处境与落差
Koray开玩笑说,他连续三年穿着同一件T恤与我交谈。而我问他的问题也有一条贯穿的主线:第一年,我问如何定义“原生多模态”;第二年,探讨多模态的具体实现以及Veo为何如此强大;今年,话题则回到了对当初这个并非共识的技术选择的回顾与评估——它究竟为Google带来了什么。
作为DeepMind对外最主要的代言人,他形容这是Google最正确的决定之一。虽然已不再站在I/O主舞台的中央,但内部影响力依然举足轻重的Jeff Dean也认为,本届大会的各种发布中,视频生成模型Veo的迭代版本“Omni”意义重大,它真正将Gemini过去积累的多模态能力融入了视频领域。
在由DeepMind主导的模型研发线上,他们所定义的“智能”必须面向未来,不能仅仅是对今天已在语言等领域表现突出的能力做单线延伸。但关于如何训练出这样的智能,目前依然没有“标准配方”,本质上仍需要不断进行大规模实验。
而实验,就意味着巨大的资源占用。
经过多次交流,一个明显的张力感浮现出来:Google甚至需要考虑,当看到模型在某一模态上的能力显著超越其他模态时,也需要进行“克制”。
Omni也是本届I/O大会上,唯一由伟大的DeepMind CEO Demis Hassabis亲自站台发布的模型。但发布后,已经有不少体验反馈认为其效果未达预期。一个重要原因在于,此次率先发布的是Omni Flash版本。

这与Gemini先发布Flash版本的策略有所不同。Pichai对Omni的定义,是一个在代际上领先于现有所有模型的全新模型。因此,出于安全和负责任的态度,选择先发布Omni Flash。
结合上文提到的Google对当前“最重要的事”的判断,这可能再次埋下伏笔。
DeepMind所追求的原生多模态路线,其发展似乎可以分为三个阶段:
最初,这是一个即便在内部也压力重重、并非共识的技术赌注;
到了第二阶段,因为这条路线成功催生了像Veo和Nano Banana这样令人惊艳的成果,许多质疑随之消散;
然而现在进入第三阶段,其纯粹技术探索的色彩正在减弱。令人惊讶的是,它似乎更多地被Google这个商业实体的实际需求所内化和吸纳了。
一个非常有意思的内部思考方式也指向这一点:Google认为,这种原生多模态能力正在产生的另一个重要回报,在于它对Google“软硬件结合”全栈路线的助力。多模态能力可以用来加速自身硬件(如TPU)的迭代优化,AI已经开始用于这种“内循环”,而不是优先用于让DeepMind继续捣鼓出下一个Nano Banana级别的突破性产品。
于是,那个幽灵般的问题再次浮现:DeepMind有能力打造出的最强模型,与目前能切实提升搜索等核心业务收入和用户体验的实用模型,究竟谁对Google更重要?
现在看来,Google和DeepMind,似乎仍然没有完全站在同一条心上。
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
极狐阿尔法S3上市 5.98万起售 B级空间支持99秒换电
极狐贝塔S3纯电家轿上市,换电版采用电池租用方案起售价5 98万元。该车定位B级,空间利用率高,提供灵活租电方案与快速换电服务。品牌同时明确了“贝塔”系列,与“问道”“阿尔法”系列构成三大产品支柱。车辆配备智能座舱与丰富配置,续航版本多样,高配智驾版将于第四季度交付。
特斯拉辅助驾驶系统FSD更名 中文名称正式变更
特斯拉在中国将FSD功能更名为“特斯拉辅助驾驶”,价格不变。新功能整合了原有基础与增强辅助驾驶能力,旨在逐步实现极少干预的驾驶。此次更名延续了去年简化策略,或与监督版FSD在华获批有关。名称“降级”但功能与价格未变,体现了车企在技术宣传、法规合规与用户预期之间寻求平衡的谨慎态。
微软Win11预览版更新 屏幕色调等新功能上线
微软向WindowsInsider推送Win11最新预览版,新增“屏幕色调”辅助功能以降低亮度,讲述人支持即插即用盲文显示器,语音访问加入语音隔离技术以提升识别率并保障隐私。此次更新聚焦无障碍体验优化与智能交互的精准安全。
京东方争取三星Galaxy S27 OLED订单以价格优势切入供应链
中国面板企业京东方正积极争取成为三星GalaxyS27系列OLED面板的第二供应商。其技术已基本达标,并提供了较三星显示当前内部价格更低约5美元的报价,以增强三星手机成本竞争力。此举若成功,将打破三星旗舰机型长期由自家显示部门独家供应的传统,可能引发内部供应链生态的重大调整。
三星折叠屏新机或采用钛铝框架应对苹果液态金属
三星研发钛铝复合机身框架,外层钛合金提升强度与抗刮擦性,内层铝合金增强散热。此举被视为对苹果液态金属技术的回应,旨在提升折叠屏等高端机型的耐用与散热表现。因成本高昂,两者预计仅用于顶级产品线,苹果或用于iPhoneUltra铰链,三星则瞄准下一代三折折叠设备。材料竞赛将推动超高端。
- 日榜
- 周榜
- 月榜
1
2
3
4
5
6
7
8
9
10
相关攻略
2015-03-10 11:25
2015-03-10 11:05
2021-08-04 13:30
2015-03-10 11:22
2015-03-10 12:39
2022-05-16 18:57
2025-05-23 13:43
2025-05-23 14:01
热门教程
- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程
热门话题

