谷歌Gemini 3 Flash模型发布,深夜突袭OpenAI,性能超GPT-4o
12月18日,就在Gemini 3 Pro发布尚不足一个月之际,谷歌在北京时间今日凌晨宣布,推出更注重效率的Gemini 3 Flash模型。

谷歌为其赋予了清晰的定位:在显著降低使用成本的同时,尽最大可能保留旗舰模型的专业级推理能力,使其更胜任日常应用场景。
测试结果显示,Gemini 3 Flash不仅全面超越了多款前代Gemini 2.5 Pro模型,还在多项核心对比中与OpenAI的GPT-5.2旗鼓相当。而后者正是OpenAI为应对Gemini 3 Pro而紧急推出的新版本。
在Humanity‘s Last Exam等高难度基准测试中,双方在无需借助外部工具的情况下,表现差距不足一个百分点。
在专门用于评估多模态理解和推理能力的MMMU-Pro测试中,Gemini 3 Flash取得了81.2%的成绩,略高于GPT-5.2的79.5%。
这表明,即使在“Extra High”推理模式下,Gemini 3 Flash仍能与GPT-5.2保持接近的性能,已展现出对OpenAI不容小觑的竞争压力。

据了解,谷歌已将Gemini 3 Flash作为默认模型,推送至Gemini App以及搜索中的AI Mode。谷歌表示,该模型面向全球用户免费开放,旨在提供更强大的日常AI助手能力。
此外,谷歌AI Mode还新增了对Nano Banana Pro的直接访问入口。美国地区的用户只需在模型选择器中依次启用“Thinking with 3 Pro”和“Create Images Pro”,即可在聊天界面中直接生成图像。
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
Claude代码助手插件解决编程中断难题
对于深度依赖Claude Code进行开发的用户而言,最令人沮丧的体验莫过于在终端中“盲开”:你永远无法知晓当前对话的上下文容量还剩多少,只能被动等待系统提示耗尽,导致所有精心构建的对话逻辑和代码成果瞬间归零。 就在近期,一个典型的开发场景几乎让项目进度停滞:在编写一个复杂的批量交互脚本时,与Cla
谷歌Gemma 4大模型本地部署安装配置完全指南
4月3日凌晨,谷歌DeepMind向开源AI社区投下了一枚重磅冲击波:Gemma 4正式发布。 这个拥有310亿参数的模型,性能提升堪称“暴力”。在数学竞赛基准上,它从上一代的20 8%直接跃升至89 2%;编程能力方面,LiveCodeBench得分从29 1%飙升至80%。更关键的是,它采用了A
Linux CUPS打印系统高危漏洞可零点击获取root权限
近日,Linux生态系统中一项基础且至关重要的服务——打印服务CUPS被披露存在高危安全漏洞。根据网络安全媒体cyberkendra的报道,攻击者无需任何身份凭证,即可通过远程方式执行恶意代码,并最终获取系统的最高root权限。 这组漏洞由安全研究员Asim Manizada在人工智能工具的辅助下发
手机运行Gemma 4模型实测与可行性分析
昨天看到一条消息,说有人在 iPhone 17 Pro 上运行 Google 最新发布的 Gemma 4 模型,推理速度超过了每秒 40 个 token。第一反应是:这可能吗? 要知道,Gemma 4 是 Google 在 4 月 2 号刚发布的开源模型家族中的旗舰款。其参数量最大的 31B 版本在
大模型训练合成数据生成的十大实用策略
合成数据,这个曾经被视为“辅助工具”的技术选项,如今正快速演进为驱动大模型开发与迭代的核心基础设施。对于任何致力于长期模型训练、优化和持续升级的团队而言,构建高质量的合成数据能力已成为一项战略性任务。 背后的驱动力非常现实:获取大规模、高质量的训练数据始终是AI团队面临的主要瓶颈。数据或许存在,但面
- 日榜
- 周榜
- 月榜
1
2
3
4
5
6
7
8
9
10
相关攻略
2015-03-10 11:25
2015-03-10 11:05
2021-08-04 13:30
2015-03-10 11:22
2015-03-10 12:39
2022-05-16 18:57
2025-05-23 13:43
2025-05-23 14:01
热门教程
- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程
热门话题

