当前位置: 首页
科技数码
面壁智能开源MiniCPM-V 4.5:8B参数端侧多模态模型,号称行业最强

面壁智能开源MiniCPM-V 4.5:8B参数端侧多模态模型,号称行业最强

热心网友 时间:2025-08-29
转载

8月27日最新消息,面壁智能于8月26日正式开源了其8B参数规模的MiniCPM-V 4.5多模态旗舰模型,这也是业界首款具备“高刷新率”视频解析能力的多模态人工智能系统。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

据悉,MiniCPM-V 4.5在视频流畅度解析、长视频内容理解、光学字符识别及文档结构分析等维度均达到同规模模型的最优水准,其综合性能甚至超越了参数规模达72B的Qwen2.5-VL模型,被业界誉为“终端侧最强多模态模型”。

\

研发团队指出,传统多模态模型在处理视频内容时,由于需要兼顾计算效率与能耗控制,通常仅能采用每秒1帧的采样频率进行分析。这种处理方式虽能维持基本的推理效率,却不可避免地丢失了大量视觉细节,限制了模型对动态场景的精细化理解能力。

MiniCPM-V 4.5开创性地实现了高帧率视频解析技术,通过将原有的二维重构器升级为三维视频压缩架构,实现了对视频片段的密集型特征提取。在保持同等视觉令牌消耗的前提下,该模型可处理的视频帧数量提升至传统方案的6倍,视觉压缩效率达到96倍,整体性能较同类产品提升12至24倍。

凭借显著提升的采样频率,该模型实现了从“静态幻灯片式”观看向“动态场景式”理解的跨越式进步。面对快速变化的画面内容,MiniCPM-V 4.5在识别精度与细节捕捉方面均优于Gemini-2.5-Pro、GPT-5、GPT-4o等主流云端大模型。

在专门评估高帧率视频理解能力的MotionBench和FavorBench测试平台上,MiniCPM-V 4.5不仅取得同尺寸模型的最佳成绩,更在多项指标上超越72B参数的Qwen2.5-VL,展现出显著的性能优势

\

这款仅需8B参数的紧凑型模型,在图像理解、视频分析、复杂文档解析等多模态任务中持续突破性能瓶颈。

\

在图像理解维度,MiniCPM-V 4.5于OpenCompass综合评测中表现突出,不仅领先于GPT-4o、GPT-4.1、Gemini-2.0-Pro等多款闭源模型,更实现对72B参数Qwen2.5-VL的跨级超越

\

视频理解方面,该模型在LVBench、MLVU、Video-MME、LongVideoBench等权威测评体系中均取得同规模最佳成绩。

\

面对复杂文档解析任务,MiniCPM-V 4.5在OmniDocBench测评体系的OverallEdit、TextEdit、TableEdit三项核心指标中,均达到通用多模态模型的顶尖水平。

\

值得关注的是,该模型同步支持标准模式与深度思考双模式运行,在保证响应速度的同时兼顾复杂任务处理能力。标准模式适用于日常多模态场景,而深度思考模式则专为处理复合型推理难题设计。

在VideoMME视频理解测试与OpenCompass单图评测中,MiniCPM-V 4.5均达到同规格模型最优水平,并在显存占用、平均推理耗时等效率指标上保持领先

特别是在涵盖短、中、长三类视频的Video-MME综合评测中,采用3帧打包推理策略的MiniCPM-V 4.5,其纯推理时间消耗仅为同级模型的十分之一(未计入视频采样耗时)。

附模型开源地址:

  • Github:https://github.com/OpenBMB/MiniCPM-o
  • Hugging Face:https://huggingface.co/openbmb/MiniCPM-V-4_5
  • ModelScope:https://www.modelscope.cn/models/OpenBMB/MiniCPM-V-4_5
来源:https://www.ithome.com/0/878/512.htm

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章
更多
硬核科技提速转化,守护健康五大关键利器

硬核科技提速转化,守护健康五大关键利器

  新华社重庆3月29日电 题:硬核科技加速转化为守护人民健康利器  新华社记者李松、徐鹏航  2026医学装备大会暨医学装备展览会3月26日至29日在重庆举行。走进大会展览现场,一台CT设备前围满

时间:2026-03-29 19:01
AI时代资深编辑的困境:如何应对技术与内容平衡的挑战?

AI时代资深编辑的困境:如何应对技术与内容平衡的挑战?

“就像塑料花,远看艳丽,凑近却闻不到花香。”3月28日下午,静安区图书馆与静安区作家协会联合主办的“静安讲坛”上,资深编辑、作家朱蕊用一段AI为自己诗歌创作的乐曲《风停了》开启与读者关于“AI时代,

时间:2026-03-29 19:01
吉利星愿累计交付突破60万辆,2025瞄准全品类销冠

吉利星愿累计交付突破60万辆,2025瞄准全品类销冠

IT之家 3 月 29 日消息,今日,吉利银河最新宣布星愿累计交付突破 60 万辆。IT之家注意到,吉利 A0 级纯电小车 —— 吉利星愿于 2024 年 10 月 9 日发布上市,最新的 2026

时间:2026-03-29 19:01
2025北京人工智能产业规模将突破4500亿元

2025北京人工智能产业规模将突破4500亿元

新京报贝壳财经讯(记者韦英姿)3月29日,2026中关村论坛年会的“AI未来论坛:跃迁·投资·共生”现场披露,北京2025年人工智能产业规模达4500亿元,占全国半数,企业数量突破2500家。其中,

时间:2026-03-29 19:01
国产混动无人机系统成熟,选购攻略与6大技术亮点解析

国产混动无人机系统成熟,选购攻略与6大技术亮点解析

据新华社消息,2025年12月10日,一套60千瓦国产混合动力电推进系统完成飞行演示验证,标志着小型无人机混动动力“心脏”逐步成熟。此前,无人机动力系统分途发展:燃油驱动中大型机续航强但噪音大,电力

时间:2026-03-29 19:01
热门专题
更多
刀塔传奇破解版无限钻石下载大全 刀塔传奇破解版无限钻石下载大全
洛克王国正式正版手游下载安装大全 洛克王国正式正版手游下载安装大全
思美人手游下载专区 思美人手游下载专区
好玩的阿拉德之怒游戏下载合集 好玩的阿拉德之怒游戏下载合集
不思议迷宫手游下载合集 不思议迷宫手游下载合集
百宝袋汉化组游戏最新合集 百宝袋汉化组游戏最新合集
jsk游戏合集30款游戏大全 jsk游戏合集30款游戏大全
宾果消消消原版下载大全 宾果消消消原版下载大全
  • 日榜
  • 周榜
  • 月榜
热门教程
更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程