阿里通义Qwen3-VL开源4B与8B模型,超越GPT-5 Nano

10月15日最新消息,阿里通义今日正式宣布,其多模态大模型家族Qwen3-VL系列再添新成员——基于Dense架构的Qwen3-VL-8B和Qwen3-VL-4B模型现已开源上线。
这两款密集架构的视觉理解模型在显存占用上更具优势,同时完整继承了Qwen3-VL系列的全部能力,每个尺寸都提供了Instruct和Thinking两个版本。
其中Qwen3-VL-8B在STEM、VQA、OCR、视频理解和Agent任务等公开评测中表现优异,不仅超越了Gemini 2.5 Flash Lite和GPT-5 Nano,甚至能够媲美上一代超大规模模型Qwen2.5-VL-72B。
而4B版本则在端侧展现出更高的性价比,特别适合需要AI视觉理解的智能终端部署。
值得一提的是,这两款视觉理解模型实现了“视觉精准”与“文本稳健”的协同突破:针对小模型常见的“跷跷板”问题(提升视觉能力往往会牺牲文本性能,反之亦然),阿里通过架构创新和技术优化,让模型在保持文本理解能力的同时,增强了多模态感知与视觉理解能力,在小身材里塞进了更强的视觉和文本能力。
新模型现已上线魔搭社区和Hugging Face平台,同时提供FP8量化版本,开源地址如下:
https://modelscope.cn/collections/Qwen3-VL-5c7a94c8cb144b
https://huggingface.co/collections/Qwen/qwen3-vl-68d2a7c1b8a8afce4ebd2dbe
免责声明
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
中英AI融合:德龙谈中国学习与人机协同新路径
第二届世界中国学大会接近尾声时,“数智时代下的中国学研究”成为各场次讨论的焦点话题。从主论坛到分会场,这一主题引发了学界的广泛关注。当人工智能技术开始介入古籍研究,新的机遇与挑战随之浮现。学者们如何
百度文心助手升级:降低AI视频创作门槛,解锁多场景玩法
百度搜索近日在人工智能生成内容(AIGC)领域取得突破性进展,其自主研发的文心助手全面升级多模态创作能力,现已支持AI图片、视频、音乐、播客等8种内容形态的实时生成。用户通过单一入口即可调用多工具组
X平台算法升级:Grok AI接管推荐系统,实现亿级内容精准匹配
马斯克旗下的社交平台X即将迎来一次重大算法升级。据内部消息,该平台计划在本周全面推行基于人工智能的内容推荐机制,通过自主研发的AI模型Grok对每日超1亿条用户生成内容进行深度分析,以实现更精准的信
AI创作者新疆支教:纳米科技为边疆学子播撒梦想种子
在新疆某偏远地区的基层学校里,一场别开生面的科技支教活动正在展开。一位专注于纳米AI创作的志愿者带着前沿技术走进课堂,为当地学生打开了通往人工智能世界的大门。这场跨越地理距离的教学实践,不仅让学生们
百度升级AIGC创作能力:实时互动数字人智能体开放
近日,百度搜索在人工智能领域迈出重要一步,同步推出两大创新成果:全面升级的文心助手AIGC创作功能,以及行业首个具备开放式实时互动能力的数字人智能体。升级后的文心助手新增八大创作模态,涵盖AI图片生
相关攻略
热门教程
更多- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程



















