文心4.5 Turbo登顶SuperCLUE多模态榜,总分并列国内第一
8 月 29 日消息,中文多模态视觉语言模型测评基准(SuperCLUE-VLM)8 月榜单正式发布,百度 ERNIE-4.5-Turbo-VL 多模态大模型以 66.47 分的成绩并列位居国内模型第一,在真实场景任务下的领先优势明显。
本次评估覆盖 Claude-Opus-4.1、Gemini-2.5-Pro、GPT-5 (high)、ERNIE-4.5-Turbo-VL、Doubao-Seed-1.6-thinking、hunyuan-t1-vision、Qwen-V1-Max-Latest 等国内外 15 款多模态模型。基于中文场景特点,SuperCLUE-VLM 围绕基础认知、视觉推理和视觉应用三大核心维度进行评测,全面考察模型在真实任务场景下的能力。
测评结果显示,Gemini-2.5-Pro 以总分 74.99 分领先,OpenAI GPT-5 (high) 以总分 68.59 分位居第二,百度 ERNIE-4.5-Turbo-VL-32k-preview 以总分 66.47 分并列国内模型第一。有分析人士点评,文心大模型在多模态领域的多维度领先优势十分突出。ERNIE-4.5-Turbo-VL 等国内其他头部模型在视觉推理、视觉应用等高阶任务上的显著进步,凸显了中国在多模态大模型领域的竞争潜力。

SuperCLUE-VLM 多模态视觉语言基准评测总榜
据早前公开报道,6 月 30 日百度开源文心 4.5 系列 10 款模型,其中 ERNIE-4.5-VL 视觉语言模型(ERNIE-4.5-VL-28B-A3B;ERNIE-4.5-VL-424B-A47B)具备复杂的图文与视频理解能力,支持超过 100 种语言交互,其跨模态能力覆盖文档处理、视频管理、学习解题等核心任务场景。
作为国内最早投入大模型产研的企业,百度依托“芯片-框架-模型-应用”的全栈自研体系,持续推动文心大模型能力进化。得益于飞桨文心的联合优化,文心大模型的能力拓展和效率提升。截至目前,飞桨文心开发者数量已超过 2185 万,服务超过 67 万家企业,创建的模型达到 110 万。
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
香港女警黎家盈任载荷专家 资讯科技专长助力航天任务
5月23日上午,酒泉卫星发射中心举行神舟二十三号载人飞行任务新闻发布会,正式宣布任务计划。根据安排,神舟二十三号载人飞船将于北京时间5月24日23时08分准时发射升空。 本次飞行乘组的组成备受瞩目。神舟二十三号任务乘组由指令长朱杨柱、航天员张志远以及来自中国香港的载荷专家黎家盈共同构成。这标志着中国
苹果Beats新款头戴耳机通过FCC认证即将上市
美国联邦通信委员会数据库出现一款型号为A3577的蓝牙头戴式耳机,并非已知的AirPodsMax2。目前公开信息极少,仅有一张普通耳机耳罩图片。推测其可能属于苹果旗下Beats品牌的新一代产品,如BeatsStudioPro的更新型号,但具体身份仍有待后续信息确认。
永辉超市转型裁员三万人 CEO涨薪引争议
永辉超市因大连御锦拖欠股权转让尾款36亿余元申请强制执行,担保人王健林承担连带责任。永辉近年推行“胖改”后关店裁员约三万人,CEO薪酬却大幅上涨。追债成功与否存疑,万达自身债务压力使款项回收难度极大。此事关乎永辉现金流,已成为生存攸关的紧迫问题。
神舟二十三号首次搭载港澳航天员 紫荆花绽放太空
神舟二十三号乘组名单公布,首次包含港澳地区选拔的航天员。香港女性载荷专家黎家盈入选,任务标识中的紫荆花象征其身份,体现中国载人航天选拔的包容性。乘组搭配合理,确保任务安全并提升科学效能。港澳同胞参与标志着空间站运营更开放融合,未来将有更多科研人员加入。
笔记本电脑破解量子难题,量子霸权论断被推翻
近期研究显示,经典算法利用张量网络等方法,在笔记本电脑上高效完成了曾被宣称需量子计算才能快速解决的模拟任务,结果与量子研究吻合。这表明经典计算仍具潜力,未来计算发展可能需要量子硬件与经典算法的协同推进。
- 日榜
- 周榜
- 月榜
1
2
3
4
5
6
7
8
9
10
相关攻略
2015-03-10 11:25
2015-03-10 11:05
2021-08-04 13:30
2015-03-10 11:22
2015-03-10 12:39
2022-05-16 18:57
2025-05-23 13:43
2025-05-23 14:01
热门教程
- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程
热门话题

