文心4.5 Turbo登顶SuperCLUE多模态榜单,性能比肩GPT-5

8月28日,中文多模态视觉语言模型测评基准SuperCLUE-VLM正式公布了8月榜单。百度ERNIE-4.5-Turbo-VL多模态大模型以66.47分的成绩,在国内模型中并列第一,尤其在真实场景任务中展现出明显优势。
本次评测涵盖了来自国内外的15款主流多模态模型,包括Claude-Opus-4.1、Gemini-2.5-Pro、GPT-5(high)、ERNIE-4.5-Turbo-VL、Doubao-Seed-1.6-thinking、hunyuan-t1-vision、Qwen-V1-Max-Latest等。
SuperCLUE-VLM围绕中文场景特点,从基础认知、视觉推理和视觉应用三大维度展开全面测评,重点考察模型在真实任务中的综合表现。
测评结果显示,Gemini-2.5-Pro以总分74.99分位居榜首,OpenAI GPT-5(high)以68.59分排名第二,百度ERNIE-4.5-Turbo-VL-32k-preview则以66.47分的成绩并列国内第一。
有分析指出,文心大模型在多模态领域的多个维度均表现突出。ERNIE-4.5-Turbo-VL等国内头部模型在视觉推理、视觉应用等高阶任务上的显著进步,展现出中国在多模态大模型领域的竞争实力。
据悉,百度于6月30日开源了文心4.5系列的10款模型。其中,ERNIE-4.5-VL视觉语言模型具备强大的图文与视频理解能力,支持超过100种语言交互,其跨模态能力广泛覆盖文档处理、视频管理、学习解题等多个核心任务场景。
作为国内最早布局大模型研发的企业,百度依托“芯片-框架-模型-应用”全栈自研体系,持续推动文心大模型的能力升级。
通过飞桨与文心的协同优化,文心大模型在能力拓展和运行效率方面实现显著提升。
截至目前,飞桨文心平台的开发者数量已突破2185万,服务企业超过67万家,累计创建的模型数量达到110万个。
免责声明
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
最新文章
小米智能家庭屏Max 27发布:27英寸K歌影视全能屏,售价3999元
8月18日消息,小米首款定位 "闺蜜机 "的智能家庭屏——小米智能家庭屏Max 27将于8月21日开售,售价3999元。目前,小米智能家庭屏Max 27的详细配置已在小米商城公布。该机采用27英寸防眩光
李想与乘龙卡车司机碰杯致歉:此前言论冒失但无恶意
8月18日消息,今日,理想汽车CEO李想在社交平台发布了一则视频。据视频画面,李想介绍,需要卡车将理想i8运往全国各地,因此在交付前两天,理想汽车CEO李想请卡车师傅们吃了饭。值得一提的是,宴席进行
星河动力智神星二号火箭百吨级发动机成功试车,我国民营可复用火箭再突破
8月18日消息,据星河动力航天最新公众号介绍,近日,CQ-90百吨级液氧 煤油发动机燃气发生器试车取得圆满成功。这是智神星二号新一代大型可重复使用运载火箭的主动力系统,该火箭计划2026年完成首飞。
蔚来高管沈斐回应公布数据:过程数据对外 除了哗众取宠外几乎没啥意义
8月18日消息,今日,蔚来乐道总裁沈斐在微博发文称,不会轻易公布各类预定金、大定等非最终结果类数据,大家也不要相信这些“据说”、“网传”等三方数据。沈斐表示,公司也不允许任何一位用户顾问、或者门店透
vivo OriginOS 8月更新来袭:新增后台堆叠与电池镂空功能
8 月 17 日消息,vivo 手机操作系统最新微博 @OriginOS原系统 昨日宣布,OriginOS 全面接入「铁路 12306」,跟随 8 月版本推送,陆续分批覆盖 OriginOS 5
热门推荐
热门教程
更多- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程



















