面包屑图标 当前位置: 首页
AI资讯
热点详情

谷歌AI发布会多模态新作惊艳亮相

AI热点日报
AI热点日报时间:2026-07-03
热点解读

Google AI 技术持续突破,带来多模态新体验,令人耳目一新。本次发布的多款重磅产品,覆盖模型开源、图像生成与机器人交互三大方向,每一款都看点十足。 先看要点 Gemma 3 多语言表现亮眼:Google 发布了参数规模从 1B 到 27B、上下文窗口达 128K 的多模态模型 Gemma 3,

Google AI 技术持续突破,带来多模态新体验,令人耳目一新。本次发布的多款重磅产品,覆盖模型开源、图像生成与机器人交互三大方向,每一款都看点十足。

先看要点

  • Gemma 3 多语言表现亮眼:Google 发布了参数规模从 1B 到 27B、上下文窗口达 128K 的多模态模型 Gemma 3,支持超过 140 种语言。社区对其有望在单个 GPU 或 TPU 上运行的潜力充满期待。
  • Gemini 2.0 Flash 文生图更直接:Gemini 2.0 Flash 新增原生图像生成功能,让用户直接在模型内生成与语境相关的图像。开发者可通过 Google AI Studio 抢先体验。
  • Gemini Robotics 让 AI 真正走进现实:Google 在 YouTube 展示了 Gemini Robotics,这是一套先进的视觉-语言-动作模型,使机器人能够更自然、更灵活地与真实世界互动。

Gemma 3 模型:开源领域的重磅新突破

作为一款开源大模型,Gemma 3 在 LMArena 基准测试中取得了出色成绩——这并非依靠营销包装,而是实打实的评测数据。

Gemma 3 的发布还刷新了同类模型的 Pareto 前沿,大幅领先于其他同量级模型。换句话说,如果你正在寻找一款能在单卡 GPU 上运行、同时保持顶级性能的开源模型,Gemma 3 是目前最值得关注的选项之一。

更重要的是,Gemma 3 将视觉能力作为核心功能之一,全面吸纳了此前的 PaliGemma 模型特性(ShieldGemma 则继续作为单独分支存在)。这意味着它不再是单纯的文本模型,而是能够直接处理图像的多模态工具。

Gemini 2.0 Flash 文生图

Gemini 2.0 Flash 现已提供原生图像生成能力,用户可以直接在模型内部创建与文本内容紧密相关的图像。虽然界面稍显复杂,但一旦找到入口,图像编辑将变得前所未有地简单——无需再切换到外部工具。

Google 开发者团队成员 Kaushik Shivakumar 表示:“非常高兴能公开 Gemini 的原生图像生成功能,目前仍处于实验阶段,我们已取得了很多进展,但也期待大家的进一步反馈!”而另一位工程师 Mostafa Dehghani 则兴奋地形容,这个团队“每一天都是不平凡的,既充满混乱,又富含创造力”。

创作者社区对 Gemini 2.0 Flash 的表现普遍赞叹,不少人已经开始期待未来能看到类似 Gemma 这样具备图像生成能力的 AI 模型出现——毕竟开源的力量最具吸引力。

Gemini Robotics 模型

Google DeepMind 推出了基于 Gemini 2.0 的全新一代机器人 AI 模型——Gemini Robotics,重点强调推理能力、互动性、灵活性与泛化性。这不再是实验室里只会重复动作的机械臂,而是能真正感知环境并自主决策的智能体。

值得注意的是,Google DeepMind 宣布与 Apptronik 合作,共同打造搭载 Gemini 2.0 技术的类人机器人,其中包括 Apptronik 的 Apollo 机器人。Gemini Robotics-ER 允许机器人利用 Gemini 模型的具身推理能力,实现物体检测、互动识别与障碍规避。根据官方数据,通过这一技术,机器人在基准测试中的表现相比当前最先进的模型提升了一倍,泛化能力令人惊叹。

Google DeepMind 明确表示,Gemini Robotics 模型的目标是让机器人能够更自然、更灵活地适应多样化任务环境,实现真正的智能互动。从演示视频来看,机器人已经能够对人类指令做出流畅反应,例如拿取特定物品、避开障碍物等——这距离我们想象中的服务机器人又近了一步。

热点追踪提示词
你是一名 AI 行业编辑,请围绕下面这条热点输出一份资讯解读:
热点:谷歌AI发布会多模态新作惊艳亮相要求:
1. 先用一句话解释这条热点在讲什么
2. 再总结它为什么重要
3. 说明会影响哪些 AI 产品或内容方向
4. 最后给出 3 个适合资讯站使用的标题
来源:https://www.53ai.com/news/MultimodalLargeModel/2025031348517.html
ai 人工智能

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关热点
AI热点2026-07-04 09:10
小米MiMo-V2系列模型2026年6月30日下线,Pro版已自动切换至V2.5

小米MiMo开放平台宣布,MiMo-V2系列的四款模型将于2026年6月30日正式下线,平台已推动开发者向V2 5系列迁移。具体涉及mimo-v2-pro、mimo-v2-omni、mimo-v2-flash和mimo-v2-tts模型。平台设置了系统替换时间作为缓冲:pro和omni模型于2026

AI热点2026-07-04 09:10
款长安猎手K50重庆车展上市14.19万起

2026重庆车展上,2026款长安猎手K50正式上市,共推出10款车型,售价14 19万至17 89万元。新车主要针对续航、电池和动力进行升级,搭载2 0T增程系统与双电机,纯电续航超180公里,快充仅需16分钟。全系标配30kW外放电功能,储备电量达239kWh,并新增山地与涉水模式,提升通过性。

AI热点2026-07-04 09:10
上期所与普陀区签战略协议深化金融区域联动

上海期货交易所与上海市普陀区人民政府于6月12日签署战略合作协议,旨在建立长期共赢的合作机制,共同服务上海国际金融中心与国际贸易中心的联动发展。双方高层领导均出席签约仪式,彰显了对此次合作的高度重视。协议聚焦于发挥期货市场专业资源与区域发展综合优势,深化务实合作,探索金融创新与实体经济深度融合,以期

AI热点2026-07-04 09:09
世纪华通平价大宗交易成交757万股 金额1.09亿元

6月12日,世纪华通发生一笔大宗交易,以每股14 37元的价格成交757 24万股,成交总额为1 09亿元。值得注意的是,该成交价与当日市场收盘价持平,属于平价交易。此次交易额占该股当日总成交额的1 51%。市场分析认为,平价成交反映了买卖双方对当前股价水平的共识,交易行为相对平稳,未对市场预期造成

延伸阅读