谷歌I/O 2026发布Gemini智能体开启全新AI时代

数码系统

相机 win10

测评 win11

手机智车

华为 Tesla

小米理想

苹果蔚来

游戏软件

LOL 抖音

原神微信

当前位置：首页

AI资讯

谷歌I/O 2026发布Gemini智能体开启全新AI时代

热心网友时间：2026-05-21

转载

如果说去年的AI竞赛还停留在“功能展示”阶段，那么今年，风向彻底变了。5月20日的谷歌I/O开发者大会，清晰地传递出一个信号：AI正在从对话框里的新奇玩具，演变为一个能真正替你“干活”的行动系统。谷歌的野心，是构建一个覆盖信息、创作乃至交易的全新数字生态，而这一切的核心，正从简单的功能堆砌，转向以“智能体”为主导的主动服务。

硬件算力与基础模型的双重进化，构成了这场变革的基石。多模态交互正变得像人类对话一样自然，而基于智能体的全新工作流，已经开始重塑搜索、电商、创意乃至科学研究的每一个角落。

算力与模型：构建AI新基建

任何上层应用的繁荣，都离不开底层基础设施的强力支撑。这一次，谷歌在算力架构上实现了创新突破：首次采用双芯片战略，将训练和推理任务分开优化，以追求极致效率。

专攻模型训练的TPU 8t，其原始算力接近上一代的3倍，专为大规模预训练而生。配合全新的基础设施，训练任务不再受限于单个数据中心，理论上可以跨全球调动超过100万颗TPU，这规模堪称行业之最。

而负责推理的TPU 8i，则专注于降低延迟、提升生成速度。现场演示中，用即将发布的Flash模型生成一个小游戏，屏幕上的代码输出速度接近每秒1500个Token，流畅得让人印象深刻。

模型层面，主角是全新的Gemini 3.5 Flash。别看名字叫“Flash”，它的能力可一点不“闪存”。在编码、智能体能力和工具调用等体现实用价值的任务上，它已经大幅超越了上一代的3.1 Pro。

一个有力的证据是，在衡量真实世界经济价值任务的GDPval-AA测试中，3.5 Flash拿到了1656 Elo分，远超3.1 Pro的1314分。当然，为了换取这种“干活”能力的全面暴涨，它在纯抽象推理和世界知识测试上做出了一些权衡。这其实是个很聪明的策略：牺牲一部分“纸上谈兵”的理论能力，换来实实在在的生产力提升。

更吸引人的是它的性价比。这代模型的输出速度比其他前沿模型快4倍，价格却更加亲民：输入每百万Token 1.50美元，输出每百万Token 9.00美元，比3.1 Pro便宜了足足40%。同时，它的知识截止日期更新到了2025年1月，上下文窗口也达到了100万Token。至于满血旗舰版Gemini 3.5 Pro，则要等到下个月才会亮相。

除了文本模型，多模态领域也迎来了重磅选手：Gemini Omni Flash。这是一个能“根据任何输入创造出任何东西”的世界模型。它对物理世界有着近乎直觉的理解。

你可以用一段简单的描述，让它生成蛋白质折叠的黏土动画；也能上传一段自拍视频，在保留人物动作表演的同时，随意更换背景和环境。目前的Omni Flash是该系列的首个模型，效果仍有优化空间，而更强大的Omni Pro已经在路上了。

智能体：全面接管数字生活与工作

“智能体”是贯穿本届谷歌I/O大会所有产品的灵魂。无论是技术开发还是日常生活，它正在成为新的底层逻辑。

面向开发者的平台Antigra vity迎来了2.0版本大更新。全球可用的Antigra vity CLI将彻底取代旧版命令行工具。更重要的是，开发者现在可以把谷歌内部使用的Agent Harness直接部署到自己的服务器上。

它的效率提升是惊人的。配合Gemini 3.5 Flash，速度提升了12倍。演示中，93个子智能体并行工作，在12小时内发出了超过1.5万次模型请求，处理了26亿Token，最终从零构建了一个功能完善的操作系统核心。你甚至能在这个AI编写的系统里跑命令行、放动画、玩《毁灭战士》——这在之前的Gemini 3.1 Pro上是不可能完成的任务。

对于普通消费者，对应的智能体叫做Gemini Spark，你可以把它理解为谷歌版的“私人云端AI助理”。

在工作中，你可以让Spark翻阅各种文档、邮件和聊天记录，然后用你习惯的语气自动生成一份团队周报。在生活中，它的能力更显贴心。比如筹办一场街区派对，Spark会自动创建实时追踪表格，通过邮箱跟进邻居回复，对未回复者拟好催促邮件。它甚至能自己去网盘翻出小区的业主公约，提醒你周五下午前不能布置充气城堡，最后顺手做出一份精美的派对宣传幻灯片。

为了支撑Spark这类云端智能体的消耗，谷歌调整了订阅体系，新推出了每月100美元的Ultra计划，提供5倍用量、20TB存储并优先使用Antigra vity。原先每月250美元的顶配计划则降价至200美元。

安卓系统也为此进行了适配，新增了专属的智能体监控区域Android Halo。在状态栏顶部，它会实时显示智能体正在后台忙什么、进展到哪一步、是否需要你确认。这预示着一个趋势：未来的手机UI，将是为智能体服务，而不仅仅是App。

Gemini App本身也采用了名为Neural Expressive的全新设计语言。

其中的Daily Brief功能，会在每天早上自动翻阅你的邮箱和日历，提炼出当天最重要的事项并建议下一步行动。NotebookLM也与Gemini彻底打通，支持上传EPUB电子书，并能一键将成堆的资料转化为带动画的电影级讲解视频，或者生成手绘、黏土等10种风格的信息图。

更重要的是，所有新发布的模型都接入了Gemini App，而谷歌全家桶的各种应用，也通过Agents实现了语音互联。

“动嘴不动手”的体验延伸到了办公场景。在Docs Live中，你只需对着麦克风随意口述想法，甚至中途改口纠正，Gemini会自动帮你整理成一份格式完美的文档。今年夏天，这套语音功能还将接入Gmail Live和Google Keep的实时模式。

搜索与电商：架构大重构

每月活跃用户已突破10亿的AI Mode搜索，迎来了底层升级。传统的搜索框现在支持上传图片、文件和视频进行跨模态理解，搜索结果页与对话式追问实现了无缝整合。

更关键的是，你可以在搜索中创建“搜索智能体”。

比如，你想盯住某只特定财务指标的生物科技股，智能体会7×24小时在后台监控市场，过滤噪音，只将核心异动信息推送给你。找房子、盯球鞋发售，都可以交给后台智能体去办。

搜索甚至具备了实时写代码、构建交互界面的能力，这正是“UI服务智能体”理念的体现。

当你询问“黑洞如何影响时空”时，搜索后台会调用隔离的智能体环境，实时编写代码、运行渲染，直接在结果页生成一个带参数滑块、可拖拽互动的可视化模型。

询问周末带家人去哪玩，它能直接生成一个包含行车时间、天气、餐厅预约的互动日程表。

谷歌全家桶的其他产品也顺势进化。地图迎来了十年最大升级“Ask Maps”。“Ask YouTube”则能让你直接提问“如何教3岁孩子从平衡车过渡到自行车”，它会整理出知识概览，并直接跳转到最对口的视频片段，还支持结合上下文继续追问。

电商领域的升级直接触及了商业底座，推出了完整的三件套。基础是UCP（通用商业协议），你可以把它理解为智能体电商时代的“HTTP”，为AI购物制定了通用规则，目前已获得亚马逊、Meta、微软等巨头的支持。

随之而来的是AP2（智能体支付协议），它解决了让AI花钱的安全顾虑。你可以设定具体品牌、商品和金额上限三道“护栏”，全部满足后智能体才会下单，且每一笔交易都有防篡改的数字授权书作为凭证。

基于这两套协议，谷歌推出了“通用购物车”。你在搜索、聊天、看视频甚至读邮件时看到的商品，都能直接扔进这个跨商家的智能购物车。它会自动帮你找折扣、盯库存。更智能的是，如果你同时加入了主板和CPU，它会主动检查两者接口是否匹配，不匹配会立刻提醒，避免了买错配件的尴尬。

创意工具与科学研究：全面开花

设计与创意工具在这一波浪潮中获得了全面提效。Google Pics作为Workspace的新成员，专攻图像创作与编辑，支持精准的目标分割和替换。

UI设计工具Stitch支持实时语音协作，两个不懂设计的人对着屏幕提要求，界面就能实时响应修改，并直接导出代码发布。整合了工作流的Google Flow创意工作室接入了Omni模型，现在可以保留原始表演动作只改环境特效；单张图片能同时生成16段不同机位和镜头语言的视频。

大规模场景修改能让一段视频的时间从清晨一键切换到深夜，且光影自洽。Flow Music则展示了强大的混音能力，录一段钢琴弹奏，提示“往R&B方向走，加女声”，系统就能生成一首制作精良的完整曲目。

AI生成内容的泛滥让鉴伪成为刚需。SynthID水印技术目前已标记了超过1000亿张图文视频和累计6万年时长的音频。在Chrome浏览器中，右键点击图片即可查验真伪。OpenAI也与Kakao、ElevenLabs等公司一起加入了SynthID阵营。

硬件载体方面，Android XR智能眼镜分为两条线：带镜片显示屏的版本将于今年晚些时候扩大测试；今年秋天首发的将是音频眼镜，由Gentle Monster和Warby Parker设计，三星制造，同时支持苹果和安卓系统。

科学领域的探索体现了技术的终极价值。Gemini for Science包含假设生成器、计算发现引擎等工具，能将复杂的医药数据分析时间从几小时压缩到几分钟。

AI天气预报模型Weather Next成功提前3天精准预测了梅丽莎飓风路径，比传统模型更准，为当地争取了宝贵的撤离时间。代码安全领域推出了能自动寻找并修复漏洞的Code Mender。谷歌旗下的Isomorphic Labs正在用AI加速针对免疫疾病和癌症的新药研发。

从底层算力到前沿科学，从日常琐事到宏大叙事，谷歌的AI正在以一种系统化、行动化的姿态，深入渗透进真实世界的每一个角落。这场发布会揭示的，不再仅仅是技术的进步，而是一场围绕“智能体”展开的、关于未来人机协作方式的全面重构。

来源:https://www.51cto.com/article/843901.html

上一篇： AI出行数据服务商崛起：得场景者得智能驾驶未来

下一篇：镁伽科技当选江苏省人工智能协会副会长推动AI产业高质量发展

游乐网为非赢利性网站，所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系youleyoucom@outlook.com。

热门专题

刀塔传奇破解版无限钻石下载大全

洛克王国正式正版手游下载安装大全

思美人手游下载专区

好玩的阿拉德之怒游戏下载合集

不思议迷宫手游下载合集

百宝袋汉化组游戏最新合集

jsk游戏合集30款游戏大全

宾果消消消原版下载大全

日榜
周榜
月榜

洛克王国绿色命运之钥获取攻略与详细步骤

洛克王国VIP扭蛋机具体位置与获取方法

光遇2026年520发布会爆料内容全解析

洛克王国S2赛季异色精灵盒子查看与使用指南

洛克王国城堡守护者具体位置与寻找攻略

星辰变归来神兽获取攻略新手快速入手指南

洛克王国宠物医院地址查询与位置导航指南

星辰变归来时装系统详解新手入门穿搭攻略

阴阳师2026年520兑换码领取方法与最新福利一览

星辰变归来境界系统详解与修炼攻略

漫蛙漫画防走失网页链接

日本宝可梦卡牌遭恶意破坏抵制黄牛行为引关注

三国志将星闪耀零氪能玩吗微氪玩家体验与氪金程度解析

少女前线2追放维尔德强度评测技能解析与培养攻略

客官里面请手游氪金指南与零氪金新手攻略

东离剑游纪手游抽卡机制与角色获取攻略详解

客官里面请手游深山探险全流程攻略与资源获取详解

镭明闪击手游哨所掩体高效布局与实战部署攻略

宝可梦冠军手游Mega进化种族值与能力数值全解析

地下城之光手游装备搭配与职业流派加点全攻略

漫蛙漫画防走失网页链接

《问剑长生》新大区预创角开启，是什么福利让玩家直呼夯爆了？

紧急！Axios 被投毒，3亿项目受到影响！教你怎么自查！

兆易创新2025年年营收92亿元，净利16亿元

TensorFlow - AI开发平台,AI开发框架

解决sql server2008注册表写入失败，vs2013核心功能安装失败

《九牧之野》S3乱世诡道主题服开启：4月18日上线，预备盟奖励与开服福利一文看懂

donk：对待季军赛的心态和决赛不一样，总之已经拿不到冠军了

iPhone 15耳机连接后音量小原因排查与解决

蛮荒领主手游测试资格获取方式蛮荒领主内测资格申请渠道与条件详解