面壁智能开源MiniCPM-V 4.5:8B参数端侧多模态模型,号称行业最强
8月27日最新消息,面壁智能于8月26日正式开源了其8B参数规模的MiniCPM-V 4.5多模态旗舰模型,这也是业界首款具备“高刷新率”视频解析能力的多模态人工智能系统。
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
据悉,MiniCPM-V 4.5在视频流畅度解析、长视频内容理解、光学字符识别及文档结构分析等维度均达到同规模模型的最优水准,其综合性能甚至超越了参数规模达72B的Qwen2.5-VL模型,被业界誉为“终端侧最强多模态模型”。

研发团队指出,传统多模态模型在处理视频内容时,由于需要兼顾计算效率与能耗控制,通常仅能采用每秒1帧的采样频率进行分析。这种处理方式虽能维持基本的推理效率,却不可避免地丢失了大量视觉细节,限制了模型对动态场景的精细化理解能力。
MiniCPM-V 4.5开创性地实现了高帧率视频解析技术,通过将原有的二维重构器升级为三维视频压缩架构,实现了对视频片段的密集型特征提取。在保持同等视觉令牌消耗的前提下,该模型可处理的视频帧数量提升至传统方案的6倍,视觉压缩效率达到96倍,整体性能较同类产品提升12至24倍。
凭借显著提升的采样频率,该模型实现了从“静态幻灯片式”观看向“动态场景式”理解的跨越式进步。面对快速变化的画面内容,MiniCPM-V 4.5在识别精度与细节捕捉方面均优于Gemini-2.5-Pro、GPT-5、GPT-4o等主流云端大模型。
在专门评估高帧率视频理解能力的MotionBench和FavorBench测试平台上,MiniCPM-V 4.5不仅取得同尺寸模型的最佳成绩,更在多项指标上超越72B参数的Qwen2.5-VL,展现出显著的性能优势。

这款仅需8B参数的紧凑型模型,在图像理解、视频分析、复杂文档解析等多模态任务中持续突破性能瓶颈。

在图像理解维度,MiniCPM-V 4.5于OpenCompass综合评测中表现突出,不仅领先于GPT-4o、GPT-4.1、Gemini-2.0-Pro等多款闭源模型,更实现对72B参数Qwen2.5-VL的跨级超越。

视频理解方面,该模型在LVBench、MLVU、Video-MME、LongVideoBench等权威测评体系中均取得同规模最佳成绩。

面对复杂文档解析任务,MiniCPM-V 4.5在OmniDocBench测评体系的OverallEdit、TextEdit、TableEdit三项核心指标中,均达到通用多模态模型的顶尖水平。

值得关注的是,该模型同步支持标准模式与深度思考双模式运行,在保证响应速度的同时兼顾复杂任务处理能力。标准模式适用于日常多模态场景,而深度思考模式则专为处理复合型推理难题设计。
在VideoMME视频理解测试与OpenCompass单图评测中,MiniCPM-V 4.5均达到同规格模型最优水平,并在显存占用、平均推理耗时等效率指标上保持领先。
特别是在涵盖短、中、长三类视频的Video-MME综合评测中,采用3帧打包推理策略的MiniCPM-V 4.5,其纯推理时间消耗仅为同级模型的十分之一(未计入视频采样耗时)。

附模型开源地址:
- Github:https://github.com/OpenBMB/MiniCPM-o
- Hugging Face:https://huggingface.co/openbmb/MiniCPM-V-4_5
- ModelScope:https://www.modelscope.cn/models/OpenBMB/MiniCPM-V-4_5
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
硬核科技提速转化,守护健康五大关键利器
新华社重庆3月29日电 题:硬核科技加速转化为守护人民健康利器 新华社记者李松、徐鹏航 2026医学装备大会暨医学装备展览会3月26日至29日在重庆举行。走进大会展览现场,一台CT设备前围满
AI时代资深编辑的困境:如何应对技术与内容平衡的挑战?
“就像塑料花,远看艳丽,凑近却闻不到花香。”3月28日下午,静安区图书馆与静安区作家协会联合主办的“静安讲坛”上,资深编辑、作家朱蕊用一段AI为自己诗歌创作的乐曲《风停了》开启与读者关于“AI时代,
吉利星愿累计交付突破60万辆,2025瞄准全品类销冠
IT之家 3 月 29 日消息,今日,吉利银河最新宣布星愿累计交付突破 60 万辆。IT之家注意到,吉利 A0 级纯电小车 —— 吉利星愿于 2024 年 10 月 9 日发布上市,最新的 2026
2025北京人工智能产业规模将突破4500亿元
新京报贝壳财经讯(记者韦英姿)3月29日,2026中关村论坛年会的“AI未来论坛:跃迁·投资·共生”现场披露,北京2025年人工智能产业规模达4500亿元,占全国半数,企业数量突破2500家。其中,
国产混动无人机系统成熟,选购攻略与6大技术亮点解析
据新华社消息,2025年12月10日,一套60千瓦国产混合动力电推进系统完成飞行演示验证,标志着小型无人机混动动力“心脏”逐步成熟。此前,无人机动力系统分途发展:燃油驱动中大型机续航强但噪音大,电力
- 日榜
- 周榜
- 月榜
相关攻略
2015-03-10 11:25
2015-03-10 11:05
2021-08-04 13:30
2015-03-10 11:22
2015-03-10 12:39
2022-05-16 18:57
2025-05-23 13:43
2025-05-23 14:01
热门教程
- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程

