面包屑图标 当前位置: 首页
AI资讯
热点详情

谷歌Gemma 3开源模型部署效率超越DeepSeek-V3/R1

AI热点日报
AI热点日报时间:2026-07-03
热点解读

谷歌近期正式推出开源模型Gemma 3,其在部署效率方面全面领先DeepSeek-V3和R1。根据最新发布的评分排名,Gemma 3 27B版本仅需一块GPU(或TPU)即可运行,而相比之下,DeepSeek的两款模型各自需要32块H100 GPU。两者之间的效率差距极为显著。下面先快速回顾其八大核

谷歌近期正式推出开源模型Gemma 3,其在部署效率方面全面领先DeepSeek-V3和R1。根据最新发布的评分排名,Gemma 3 27B版本仅需一块GPU(或TPU)即可运行,而相比之下,DeepSeek的两款模型各自需要32块H100 GPU。两者之间的效率差距极为显著。下面先快速回顾其八大核心卖点:

  1. 基于Gemini 2.0技术打造,技术底蕴深厚
  2. 提供1B、4B、12B和27B四种规模,满足不同应用场景
  3. 被谷歌誉为“全球最佳单芯片模型”,可通过单GPU或TPU完成部署
  4. 在LMArena排行榜上,于非推理开源模型类别中表现最优,超越了Llama-405B、DeepSeek-V3和o3-mini,仅次于DeepSeek R1
  5. 支持多模态功能,4B及以上版本具备“高级文本与视觉推理能力”,可分析图像、文本及短视频内容
  6. 拥有128k token的上下文窗口,开箱即用,无需额外配置
  7. 支持超过35种语言,预训练数据覆盖140余种语言
  8. 整个训练过程未使用GPU,27B版本基于6144张TPUv5P卡完成

谷歌开源模型Gemma 3,部署效率完胜DeepSeek-V3/R1

从训练成本角度分析,技术报告指出,每种模型配置均已调优,以最大程度缩短训练步耗时。对于视觉编码器部分,谷歌预先计算了每张图片的嵌入向量,训练时直接调用这些嵌入结果,因此未额外增加语言模型的训练开销。不过,报告并未公开具体的训练费用明细。值得关注的是,Gemma 3 27B作为一款密集模型,在非推理开源模型赛道上成功夺得第一名,尽管比推理模型DeepSeek R1稍弱,但已显著领先于DeepSeek-V3 671B/37B。即便与前沿闭源大模型同场竞技,它也能跻身前十,这一成绩极具说服力。

(对 Gemma 3 27B IT 模型在 Chatbot Arena 中的评估(Chiang 等,2024)。所有模型均通过盲测对比评估,由人工评审员以并排方式进行评分。每项评分基于 Elo 评级系统。Gemma-3-27B-IT 的数据为初步结果,于 2025 年 3 月 8 日 收到。)

关于训练数据,Gemma 3 27B训练了14万亿tokens,12B版本为12万亿,4B版本为4万亿,1B版本为2万亿。训练token数量的增加,主要为了适应图像与文本混合数据在预训练中的应用。同时,多语言数据的占比也得到提升,以扩大语言覆盖范围。谷歌引入了单语数据和平行数据,并借鉴了Chung等(2023)提出的策略,以解决不同语言数据分布不均的问题。谷歌从一开始便确立了清晰的开源思路:在发布自有前沿模型Gemini的同时,同步推出开源小模型Gemma,专门用于安卓操作系统的端侧部署。此次Gemma 3的发布延续了这一策略,目前它已成为最适合端侧部署的开源模型。总体而言,谷歌闭源大模型的API使用成本及部署效率,目前均略优于DeepSeek-V3/R1。接下来,就看DeepSeek-R2如何迎战了。

热点追踪提示词
你是一名 AI 行业编辑,请围绕下面这条热点输出一份资讯解读:
热点:谷歌Gemma 3开源模型部署效率超越DeepSeek-V3/R1要求:
1. 先用一句话解释这条热点在讲什么
2. 再总结它为什么重要
3. 说明会影响哪些 AI 产品或内容方向
4. 最后给出 3 个适合资讯站使用的标题
来源:https://www.53ai.com/news/OpenSourceLLM/2025031302847.html
ai 人工智能

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关热点
AI热点2026-07-04 09:10
小米MiMo-V2系列模型2026年6月30日下线,Pro版已自动切换至V2.5

小米MiMo开放平台宣布,MiMo-V2系列的四款模型将于2026年6月30日正式下线,平台已推动开发者向V2 5系列迁移。具体涉及mimo-v2-pro、mimo-v2-omni、mimo-v2-flash和mimo-v2-tts模型。平台设置了系统替换时间作为缓冲:pro和omni模型于2026

AI热点2026-07-04 09:10
款长安猎手K50重庆车展上市14.19万起

2026重庆车展上,2026款长安猎手K50正式上市,共推出10款车型,售价14 19万至17 89万元。新车主要针对续航、电池和动力进行升级,搭载2 0T增程系统与双电机,纯电续航超180公里,快充仅需16分钟。全系标配30kW外放电功能,储备电量达239kWh,并新增山地与涉水模式,提升通过性。

AI热点2026-07-04 09:10
上期所与普陀区签战略协议深化金融区域联动

上海期货交易所与上海市普陀区人民政府于6月12日签署战略合作协议,旨在建立长期共赢的合作机制,共同服务上海国际金融中心与国际贸易中心的联动发展。双方高层领导均出席签约仪式,彰显了对此次合作的高度重视。协议聚焦于发挥期货市场专业资源与区域发展综合优势,深化务实合作,探索金融创新与实体经济深度融合,以期

AI热点2026-07-04 09:09
世纪华通平价大宗交易成交757万股 金额1.09亿元

6月12日,世纪华通发生一笔大宗交易,以每股14 37元的价格成交757 24万股,成交总额为1 09亿元。值得注意的是,该成交价与当日市场收盘价持平,属于平价交易。此次交易额占该股当日总成交额的1 51%。市场分析认为,平价成交反映了买卖双方对当前股价水平的共识,交易行为相对平稳,未对市场预期造成

延伸阅读