当前位置: 首页
科技数码
谷歌Gemini+3模型发布:响应速度提升2.5倍,输出速度快45%

谷歌Gemini+3模型发布:响应速度提升2.5倍,输出速度快45%

热心网友 时间:2026-03-04
转载

美东时间3月3日周二,谷歌正式推出Gemini 3系列中速度最快、性价比最高的模型——Gemini 3.1 Flash-Lite。这款模型专为开发者大规模高频工作负载设计,能够以更经济的价格实现出色的智能表现。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

Gemini 3.1 Flash-Lite于当天起以预览版形式向开发者开放,可通过谷歌AI Studio的Gemini API接入,企业用户则可经由谷歌云Vertex AI平台使用。使用该模型无需特定硬件或软件配置,用户只需通过API调用即可快速接入。

谷歌透露,根据Artificial Analysis基准测试,3.1 Flash-Lite在首个答案响应时间上较Gemini 2.5 Flash提升2.5倍,输出速度提升45%,同时保持相近或更优的质量水准。

谷歌表示,该模型在Arena.ai排行榜上获得1432的Elo评分,并在多项推理与多模态理解基准测试中超越同级别其他模型,甚至优于上一代体积更大的Gemini模型。目前已有Latitude、Cartwheel、Whering等企业在早期测试中使用该模型,并反馈出显著的效率与成本优势。

定位与价格:高频场景下的性价比首选

谷歌DeepMind在模型说明文件中将3.1 Flash-Lite定位为“具备成本效益、速度快,针对高频、对延迟敏感的任务(如翻译和内容分类)进行优化”的模型,是Gemini 3系列原生多模态推理模型家族的新成员。

在价格方面,3.1 Flash-Lite定价为每百万输入token 0.25美元、每百万输出token 1.50美元。谷歌在最新博客中指出,该定价仅为大型模型的一小部分,适合需要大规模部署、同时对成本高度敏感的开发者企业用户。

该模型支持文本、图像、音频与视频等多模态输入,上下文窗口最长可达100万token,输出上限为6.4万token,可满足从文件摘要到复杂多模态任务的广泛需求。

性能基准:超越同级并挑战上一代旗舰

在核心性能指标上,谷歌援引Artificial Analysis基准测试数据称,3.1 Flash-Lite的首个答案响应时间比Gemini 2.5 Flash快2.5倍,输出速度提升45%。

在智能能力评估方面,该模型在Arena.ai排行榜上获得1432的Elo评分,在GPQA Diamond测试中得分86.9%,在MMMU Pro测试中得分76.8%,谷歌表示这两项成绩均超越同级别竞争模型。

值得注意的是,谷歌特别强调3.1 Flash-Lite在部分基准测试中甚至超越了上一代体积更大的Gemini 2.5 Flash,这意味着在特定工作负载下,用户无需支付旗舰模型的价格即可获得更优性能。

核心特性:可调节的“思考层级”

除速度与成本外,3.1 Flash-Lite的一项差异化功能是在AI Studio和Vertex AI中内置“思考层级”控制,允许开发者根据任务复杂程度灵活调整模型的推理深度。

谷歌在最新博客中写道,这一功能“对于管理高频工作负载至关重要”。对于翻译、内容审核等以成本为优先的批量任务,开发者可选用较低思考层级以压缩成本;对于生成用户界面、创建模拟场景或遵循复杂指令等需要深度推理的任务,则可调高思考层级以提升输出质量。

在架构层面,谷歌DeepMind披露,3.1 Flash-Lite基于Gemini 3 Pro构建,训练使用谷歌自研的张量处理单元及JAX与ML Pathways软件框架完成。

企业反馈:效率与指令遵循能力获高度认可

多家早期测试企业对3.1 Flash-Lite给出了正面评价,尤其集中于速度、指令遵循能力和规模化处理能力三个维度。

AI叙事平台Latitude的AI负责人Kolby Nottingham表示:“谷歌的模型在同类别产品中展现出无与伦比的指令遵循能力和速度,成功率比我们之前使用的模型高出20%,推理速度快60%,使Latitude能够为更广泛的受众提供复杂的叙事体验。”

AI动画工具Cartwheel首席科学家Andrew Carr称该模型为“智能与速度比无可匹敌”,并指出:“它在工具调用方面表现出色,能够在更大模型所需时间的一小部分内快速探索代码库。我们拥有大量多模态标注使用场景,在大规模应用中,Flash-Lite成为我们处理更多数据、获取更多洞察的关键解锁工具。”

时尚应用Whering的CEO Bianca Rangecroft表示,通过将3.1 Flash-Lite整合进分类流程,Whering在商品标签标注上实现了“100%的一致性”,即使面对复杂的时尚品类,也能提供“确定、可重复的结果”。

企业AI平台HubX联合创始人Kaan Ortabas则提供了具体数据:“作为根编排与内容引擎,Gemini 3.1 Flash-Lite持续实现10秒以内的完成时间、接近实时的流式输出、约97%的结构化输出合规率以及94%的意图路由准确率,在速度、指令精准度和成本效益之间取得了卓越平衡。”

来源:https://www.163.com/dy/article/KN5K6QPJ05198NMR.html

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章
更多
我国自主研发新晶体刷新世界纪录实现从零到一突破

我国自主研发新晶体刷新世界纪录实现从零到一突破

近日,我国科研领域传来重大捷报:由中国科学家自主创新研发的氟化硼酸铵(ABF)非线性光学晶体,成功实现了真空紫外激光的158 9纳米直接倍频输出,创下该波段全球最短波长纪录。这项发表于国际顶级学术期刊《自然》(Nature)的研究成果,标志着我国在深紫外激光晶体材料这一战略前沿领域,实现了从理论原创

时间:2026-05-14 10:22
AI泡沫远未到来当前发展更似互联网早期阶段

AI泡沫远未到来当前发展更似互联网早期阶段

当前这场人工智能基础设施建设热潮,究竟处于互联网发展历程中的哪个阶段?是类似1995年互联网商业化起步的加速期,还是1997年基础设施全面铺开的中段,抑或已接近1999年泡沫破裂的前夜?华尔街资深投资者们依据各自的历史经验,给出了截然不同的判断。 基金经理、Niles Investment Mana

时间:2026-05-14 10:22
七彩虹将星X16 Pro 2026款16英寸游戏本上市 首发价7799元

七彩虹将星X16 Pro 2026款16英寸游戏本上市 首发价7799元

备受关注的七彩虹将星 X16 Pro 2026 游戏本现已登陆京东商城开启预售。这款16英寸性能猛兽以“英特尔酷睿i7-14650HX处理器 + NVIDIA RTX 5060笔记本电脑GPU”的强劲组合为核心,辅以16GB DDR5高频内存与512GB PCIe 4 0高速固态硬盘,首发到手价仅为

时间:2026-05-14 09:51
索尼WH-1000X系列新款耳机渲染图曝光 或命名The ColleXion

索尼WH-1000X系列新款耳机渲染图曝光 或命名The ColleXion

索尼的头戴式降噪耳机产品线,或将迎来一位定位独特的新成员。近日,网络上流传出一组据称是索尼新一代高端头戴式降噪耳机的高清渲染图,其暂定名称为“The ColleXion”。多方信息显示,这款新品并非旨在取代当前旗舰WH-1000XM6,而是定位在其之上的一个全新高端系列,旨在满足对设计和质感有更高要

时间:2026-05-14 09:51
中国天眼FAST望远镜国产钢丝绳自主研发制造全解析

中国天眼FAST望远镜国产钢丝绳自主研发制造全解析

为“中国天眼”FAST研制一根完全国产化的高性能钢丝绳,这不仅是简单的部件替代,更是一场历时近三年、汇聚全国顶尖力量的系统性技术攻关。如今,FAST索驱动系统所需的核心部件——特种钢丝绳,已实现从原材料冶炼、结构设计到专用检测设备的全链条自主可控,彻底摆脱了长期依赖进口的局面。 作为全球最大单口径射

时间:2026-05-14 09:51
热门专题
更多
刀塔传奇破解版无限钻石下载大全 刀塔传奇破解版无限钻石下载大全
洛克王国正式正版手游下载安装大全 洛克王国正式正版手游下载安装大全
思美人手游下载专区 思美人手游下载专区
好玩的阿拉德之怒游戏下载合集 好玩的阿拉德之怒游戏下载合集
不思议迷宫手游下载合集 不思议迷宫手游下载合集
百宝袋汉化组游戏最新合集 百宝袋汉化组游戏最新合集
jsk游戏合集30款游戏大全 jsk游戏合集30款游戏大全
宾果消消消原版下载大全 宾果消消消原版下载大全
  • 日榜
  • 周榜
  • 月榜
热门教程
更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程