谷歌I/O 2026发布Gemini智能体开启全新AI时代
如果说去年的AI竞赛还停留在“功能展示”阶段,那么今年,风向彻底变了。5月20日的谷歌I/O开发者大会,清晰地传递出一个信号:AI正在从对话框里的新奇玩具,演变为一个能真正替你“干活”的行动系统。谷歌的野心,是构建一个覆盖信息、创作乃至交易的全新数字生态,而这一切的核心,正从简单的功能堆砌,转向以“智能体”为主导的主动服务。

硬件算力与基础模型的双重进化,构成了这场变革的基石。多模态交互正变得像人类对话一样自然,而基于智能体的全新工作流,已经开始重塑搜索、电商、创意乃至科学研究的每一个角落。
算力与模型:构建AI新基建
任何上层应用的繁荣,都离不开底层基础设施的强力支撑。这一次,谷歌在算力架构上实现了创新突破:首次采用双芯片战略,将训练和推理任务分开优化,以追求极致效率。
专攻模型训练的TPU 8t,其原始算力接近上一代的3倍,专为大规模预训练而生。配合全新的基础设施,训练任务不再受限于单个数据中心,理论上可以跨全球调动超过100万颗TPU,这规模堪称行业之最。
而负责推理的TPU 8i,则专注于降低延迟、提升生成速度。现场演示中,用即将发布的Flash模型生成一个小游戏,屏幕上的代码输出速度接近每秒1500个Token,流畅得让人印象深刻。

模型层面,主角是全新的Gemini 3.5 Flash。别看名字叫“Flash”,它的能力可一点不“闪存”。在编码、智能体能力和工具调用等体现实用价值的任务上,它已经大幅超越了上一代的3.1 Pro。

一个有力的证据是,在衡量真实世界经济价值任务的GDPval-AA测试中,3.5 Flash拿到了1656 Elo分,远超3.1 Pro的1314分。当然,为了换取这种“干活”能力的全面暴涨,它在纯抽象推理和世界知识测试上做出了一些权衡。这其实是个很聪明的策略:牺牲一部分“纸上谈兵”的理论能力,换来实实在在的生产力提升。
更吸引人的是它的性价比。这代模型的输出速度比其他前沿模型快4倍,价格却更加亲民:输入每百万Token 1.50美元,输出每百万Token 9.00美元,比3.1 Pro便宜了足足40%。同时,它的知识截止日期更新到了2025年1月,上下文窗口也达到了100万Token。至于满血旗舰版Gemini 3.5 Pro,则要等到下个月才会亮相。


除了文本模型,多模态领域也迎来了重磅选手:Gemini Omni Flash。这是一个能“根据任何输入创造出任何东西”的世界模型。它对物理世界有着近乎直觉的理解。

你可以用一段简单的描述,让它生成蛋白质折叠的黏土动画;也能上传一段自拍视频,在保留人物动作表演的同时,随意更换背景和环境。目前的Omni Flash是该系列的首个模型,效果仍有优化空间,而更强大的Omni Pro已经在路上了。

智能体:全面接管数字生活与工作
“智能体”是贯穿本届谷歌I/O大会所有产品的灵魂。无论是技术开发还是日常生活,它正在成为新的底层逻辑。
面向开发者的平台Antigra vity迎来了2.0版本大更新。全球可用的Antigra vity CLI将彻底取代旧版命令行工具。更重要的是,开发者现在可以把谷歌内部使用的Agent Harness直接部署到自己的服务器上。

它的效率提升是惊人的。配合Gemini 3.5 Flash,速度提升了12倍。演示中,93个子智能体并行工作,在12小时内发出了超过1.5万次模型请求,处理了26亿Token,最终从零构建了一个功能完善的操作系统核心。你甚至能在这个AI编写的系统里跑命令行、放动画、玩《毁灭战士》——这在之前的Gemini 3.1 Pro上是不可能完成的任务。
对于普通消费者,对应的智能体叫做Gemini Spark,你可以把它理解为谷歌版的“私人云端AI助理”。

在工作中,你可以让Spark翻阅各种文档、邮件和聊天记录,然后用你习惯的语气自动生成一份团队周报。在生活中,它的能力更显贴心。比如筹办一场街区派对,Spark会自动创建实时追踪表格,通过邮箱跟进邻居回复,对未回复者拟好催促邮件。它甚至能自己去网盘翻出小区的业主公约,提醒你周五下午前不能布置充气城堡,最后顺手做出一份精美的派对宣传幻灯片。
为了支撑Spark这类云端智能体的消耗,谷歌调整了订阅体系,新推出了每月100美元的Ultra计划,提供5倍用量、20TB存储并优先使用Antigra vity。原先每月250美元的顶配计划则降价至200美元。
安卓系统也为此进行了适配,新增了专属的智能体监控区域Android Halo。在状态栏顶部,它会实时显示智能体正在后台忙什么、进展到哪一步、是否需要你确认。这预示着一个趋势:未来的手机UI,将是为智能体服务,而不仅仅是App。

Gemini App本身也采用了名为Neural Expressive的全新设计语言。

其中的Daily Brief功能,会在每天早上自动翻阅你的邮箱和日历,提炼出当天最重要的事项并建议下一步行动。NotebookLM也与Gemini彻底打通,支持上传EPUB电子书,并能一键将成堆的资料转化为带动画的电影级讲解视频,或者生成手绘、黏土等10种风格的信息图。
更重要的是,所有新发布的模型都接入了Gemini App,而谷歌全家桶的各种应用,也通过Agents实现了语音互联。

“动嘴不动手”的体验延伸到了办公场景。在Docs Live中,你只需对着麦克风随意口述想法,甚至中途改口纠正,Gemini会自动帮你整理成一份格式完美的文档。今年夏天,这套语音功能还将接入Gmail Live和Google Keep的实时模式。
搜索与电商:架构大重构
每月活跃用户已突破10亿的AI Mode搜索,迎来了底层升级。传统的搜索框现在支持上传图片、文件和视频进行跨模态理解,搜索结果页与对话式追问实现了无缝整合。
更关键的是,你可以在搜索中创建“搜索智能体”。

比如,你想盯住某只特定财务指标的生物科技股,智能体会7×24小时在后台监控市场,过滤噪音,只将核心异动信息推送给你。找房子、盯球鞋发售,都可以交给后台智能体去办。
搜索甚至具备了实时写代码、构建交互界面的能力,这正是“UI服务智能体”理念的体现。

当你询问“黑洞如何影响时空”时,搜索后台会调用隔离的智能体环境,实时编写代码、运行渲染,直接在结果页生成一个带参数滑块、可拖拽互动的可视化模型。

询问周末带家人去哪玩,它能直接生成一个包含行车时间、天气、餐厅预约的互动日程表。
谷歌全家桶的其他产品也顺势进化。地图迎来了十年最大升级“Ask Maps”。“Ask YouTube”则能让你直接提问“如何教3岁孩子从平衡车过渡到自行车”,它会整理出知识概览,并直接跳转到最对口的视频片段,还支持结合上下文继续追问。
电商领域的升级直接触及了商业底座,推出了完整的三件套。基础是UCP(通用商业协议),你可以把它理解为智能体电商时代的“HTTP”,为AI购物制定了通用规则,目前已获得亚马逊、Meta、微软等巨头的支持。

随之而来的是AP2(智能体支付协议),它解决了让AI花钱的安全顾虑。你可以设定具体品牌、商品和金额上限三道“护栏”,全部满足后智能体才会下单,且每一笔交易都有防篡改的数字授权书作为凭证。
基于这两套协议,谷歌推出了“通用购物车”。你在搜索、聊天、看视频甚至读邮件时看到的商品,都能直接扔进这个跨商家的智能购物车。它会自动帮你找折扣、盯库存。更智能的是,如果你同时加入了主板和CPU,它会主动检查两者接口是否匹配,不匹配会立刻提醒,避免了买错配件的尴尬。
创意工具与科学研究:全面开花
设计与创意工具在这一波浪潮中获得了全面提效。Google Pics作为Workspace的新成员,专攻图像创作与编辑,支持精准的目标分割和替换。
UI设计工具Stitch支持实时语音协作,两个不懂设计的人对着屏幕提要求,界面就能实时响应修改,并直接导出代码发布。整合了工作流的Google Flow创意工作室接入了Omni模型,现在可以保留原始表演动作只改环境特效;单张图片能同时生成16段不同机位和镜头语言的视频。

大规模场景修改能让一段视频的时间从清晨一键切换到深夜,且光影自洽。Flow Music则展示了强大的混音能力,录一段钢琴弹奏,提示“往R&B方向走,加女声”,系统就能生成一首制作精良的完整曲目。
AI生成内容的泛滥让鉴伪成为刚需。SynthID水印技术目前已标记了超过1000亿张图文视频和累计6万年时长的音频。在Chrome浏览器中,右键点击图片即可查验真伪。OpenAI也与Kakao、ElevenLabs等公司一起加入了SynthID阵营。

硬件载体方面,Android XR智能眼镜分为两条线:带镜片显示屏的版本将于今年晚些时候扩大测试;今年秋天首发的将是音频眼镜,由Gentle Monster和Warby Parker设计,三星制造,同时支持苹果和安卓系统。
科学领域的探索体现了技术的终极价值。Gemini for Science包含假设生成器、计算发现引擎等工具,能将复杂的医药数据分析时间从几小时压缩到几分钟。

AI天气预报模型Weather Next成功提前3天精准预测了梅丽莎飓风路径,比传统模型更准,为当地争取了宝贵的撤离时间。代码安全领域推出了能自动寻找并修复漏洞的Code Mender。谷歌旗下的Isomorphic Labs正在用AI加速针对免疫疾病和癌症的新药研发。
从底层算力到前沿科学,从日常琐事到宏大叙事,谷歌的AI正在以一种系统化、行动化的姿态,深入渗透进真实世界的每一个角落。这场发布会揭示的,不再仅仅是技术的进步,而是一场围绕“智能体”展开的、关于未来人机协作方式的全面重构。
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
可灵AI制作气泡上升破裂特效详细教程
在可灵AI中生成气泡从液体底部升起到水面破裂的特写镜头时,若效果不佳,可尝试:将过程拆解为三个物理阶段并用精确参数描述;利用首尾帧控制并配合光学破裂指令;启用视频3 0模型并注入液体粘度、表面张力等物理参数;上传真实液体基底图并开启表面法线重建功能,以引导模型模拟真。
AI模特换装视频效果真实自然吗服装电商实测解析
使用可灵AI制作服装电商换装视频时,需提供高清、姿态标准且背景简洁的原图。调整参数时应强化物理模拟与运动平滑,关闭风格化增强。复杂服装可采用分层替换与局部重绘处理。最后,引入真实动作参考视频进行微观校准,可显著提升动作自然度与布料动态真实感。
QoderWake数字分身动作捕捉与还原技术详解
QoderWake数字分身通过五大核心技术实现动作精准捕捉与还原。基于Session账本三维锚定行为轨迹,确保可追溯与复现。Harness-First架构隔离意图与执行,保障操作安全。Critic-Refiner机制自动验证动作质量并闭环纠偏。防腐治理动态评估动作有效性,防止模板老化。Connector生态建立跨工具动作映射,确保异构系统间操作一致。这些技术
简历工作经历优化技巧 AI助你告别流水账式写法
简历应避免流水账式经历和空洞评价。工作经历需用“动词+成果+数据”结构突出价值,如具体增长或性能提升数据。自我评价应基于事实,清晰展示核心优势与证明。AI工具可辅助优化结构,但关键数据、业务背景及岗位匹配逻辑需自行把控,核心在于用结果和证据展现个人价值。
阿里云发布全栈芯片路线图 平头哥真武M890性能提升三倍
阿里云推出平头哥新一代AI芯片真武M890,配备144GB显存,算力性能达上一代3倍,支撑智能体高频模型调用。该芯片已实战验证,未来将推出后续型号。平头哥坚持软硬一体策略,通义千问大模型在其上自主运行并实现性能提升,阿里云目标以此扩大AI市场份额。
- 日榜
- 周榜
- 月榜
1
2
3
4
5
6
7
8
9
10
相关攻略
2015-03-10 11:25
2015-03-10 11:05
2021-08-04 13:30
2015-03-10 11:22
2015-03-10 12:39
2022-05-16 18:57
2025-05-23 13:43
2025-05-23 14:01
热门教程
- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程
热门话题

