Gemini 3 Pro登顶多模态评测:豆包、Qwen3-VL展现中国AI实力

2025年12月31日,一份最新的多模态视觉语言模型综合能力评测结果正式公布。在这次评估中,谷歌研发的Gemini-3-pro凭借83.64分的成绩位列榜首,展现出强劲的技术实力。字节跳动推出的豆包大模型获得73.15分,跻身榜单前三名,体现了国内企业在多模态人工智能领域的快速进步。
本次评估从基础认知、视觉推理和视觉应用三个层面全面考察了各模型的表现。Gemini-3-pro在三项指标中均取得领先,分别获得89.01分、82.82分和79.09分,整体性能优势明显。
在国内模型中,商汤科技的SenseNova V6.5 Pro以75.35分排名靠前,紧随其后的是豆包视觉版。该版本在基础认知方面表现优异,得分达到82.70,优于部分国际同类产品,仅在视觉推理环节略有不足。
此外,百度研发的ERNIE-5.0-Preview与阿里巴巴推出的Qwen3-vl也双双进入前五名。其中,Qwen3-vl成为本次榜单中唯一一个总分突破70分且开放源代码的模型,显示出较高的技术透明度与社区支持潜力。
在国际主流模型中,Anthropic公司开发的Claude-opus-4-5获得71.44分,而OpenAI的GPT-5.2(high)得分为69.16分,排名处于中下游位置。评测结果显示,当前多模态模型竞争格局正持续演变,国内外技术差距逐步缩小,多个本土模型已在关键能力上具备全球竞争力。
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
2026年618大促AI全场景应用深度解析与产业观察
2026年618大促将全面融合AI技术,覆盖全场景与产业链。平台通过持续研发,将AI应用于零售、物流、健康及工业等数千场景,旨在提升产业效率与消费体验。以“附身智能”JoyInside为代表的AI能力正接入超千万台智能设备。京东在AI基础设施层面已构建全栈产品矩阵及多个垂直模型,研发投入大幅增长。
AI训练数据选择难题破解智能配方秤精准筛选方案
字节跳动与加州大学提出InfoLaw框架,解决大模型因重复使用高质量数据导致的性能下降问题。该框架量化数据信息获取量,结合质量、重复次数与模型规模等因素,建立预测性能的统一曲线,可主动搜索最优数据混合比例,提升训练数据利用效率。
AI视觉识别模糊的原因与解决方法
2026年5月提出的MoCam采用分阶段新视角合成方法:早期利用粗糙点云确定布局,后期切换至原始视频修正错误并补充细节。该方法解决了传统方式中几何与外观冲突导致的画面模糊问题,在静态与动态场景中均提升了生成质量与控制精度,为影视、虚拟现实等领域提供了新思路。
芯片AI与智慧家电三企同步启动港股招股
5月18日,港股市场迎来新股集中招股。云英谷科技、深演智能和华曦达三家公司同步启动招股,分别聚焦显示驱动芯片、AI营销与智慧家庭产品,申购均于21日截止。同日,翼菲科技上市首日大涨,龙丰集团通过港交所聆讯。
腾讯吐司与蚂蚁灵光对比评测普通人如何选择AI应用开发工具
腾讯“吐司”与蚂蚁“灵光”均主打AI生成应用,但路径不同。吐司能打包生成APK文件,实现真正安装,过程耗时较长;灵光生成HTML页面,速度更快但依赖平台运行。两者均降低了应用制作门槛,适合生成简单工具,但面临分发挑战,且无法满足专业开发需求。
- 日榜
- 周榜
- 月榜
1
2
3
4
5
6
7
8
9
10
相关攻略
2015-03-10 11:25
2015-03-10 11:05
2021-08-04 13:30
2015-03-10 11:22
2015-03-10 12:39
2022-05-16 18:57
2025-05-23 13:43
2025-05-23 14:01
热门教程
- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程
热门话题

