当前位置: 首页
AI
阿里云Qwen3-VL-30B开源模型性能对标GPT-5-Mini

阿里云Qwen3-VL-30B开源模型性能对标GPT-5-Mini

热心网友 时间:2025-10-05
转载

10月4日最新动态,阿里云通义千问团队正式开源发布Qwen3-VL-30B-A3B-Instruct和Thinking两大模型,同时推出FP8精度的新版本,以及超大规模模型Qwen3-VL-235B-A22B的FP8优化版本。

阿里云通义千问开源

据介绍,最新开源的Qwen3-VL-30B-A3B-Instruct与Thinking模型虽然参数规模更精简,但依然保持了卓越性能,完整继承了Qwen3-VL系列的核心能力。仅需30亿激活参数,就能在STEM学科、视觉问答(VQA)、文字识别(OCR)、视频理解和智能体(Agent)等多项任务中,与GPT-5-Mini和Claude4-Sonnet等业界标杆相抗衡,部分场景表现更胜一筹。

阿里云通义千问开源

阿里云通义千问开源

阿里云通义千问开源

目前这些模型已在魔搭社区和Hugging Face平台开放免费下载,并同步上线Qwen Chat服务。

以Qwen3-VL-30B-A3B-Instruct为例,其主要特性包括:

通义千问3-VL系列——迄今为止最先进的视觉语言模型。

新一代产品在各项能力上实现全方位升级:更精准的文本理解与生成能力、更敏锐的视觉感知与推理能力、更长的上下文处理长度、更强的空间定位与视频动态理解能力,以及更出色的智能体交互性能。

提供从边缘计算到云端部署的密集型和MoE架构选择,同时包含标准Instruct版本和推理增强型Thinking版本,满足不同场景需求。

核心技术突破:

• 视觉智能体:支持操作PC/移动端图形界面,可识别UI元素、理解功能逻辑、调用系统工具完成复杂任务

• 视觉编码增强:直接从图像/视频生成Draw.io图表和HTML/CSS/JS代码

• 三维空间感知:准确判断目标的相对位置、视角关系和遮挡状态,在2D场景理解基础上拓展3D空间推理能力

• 长文本与视频理解:原生支持256K上下文窗口,可扩展至1M规模,能完整解析书籍内容和数小时视频素材

• 多模态推理:在STEM和数学领域展现出强大的因果分析和逻辑推理能力

• 全场景视觉识别:经过高质量训练,可精准识别名人面孔、动漫角色、商品品牌、地理地标、动植物种类等

• 多语言OCR:支持32种语言文字识别(原19种),在低光照、模糊抖动等恶劣条件下仍保持稳定表现

• 媲美纯文本模型的语义理解能力:实现视觉与语言信息的无缝融合,形成统一认知体系

资源获取渠道:

魔搭社区:Qwen3-VL

Hugging Face:Qwen3-VL

来源:https://www.ithome.com/0/887/463.htm

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章
更多
腾讯Ardot设计智能体公测上线 一键将设计稿转为前端代码

腾讯Ardot设计智能体公测上线 一键将设计稿转为前端代码

腾讯AI设计工具Ardot开放公测,可将自然语言描述直接转化为可编辑设计稿并一键生成代码。该工具旨在简化设计开发流程,用户用语言描述界面即可实时生成可调整的初稿并转换为可用代码,有助于提升原型验证与团队协作效率,降低实现门槛。其实际价值取决于生成精度、交互能力及代码质。

时间:2026-05-19 09:28
阿里云峰会5月20日重磅发布全新升级千问大模型

阿里云峰会5月20日重磅发布全新升级千问大模型

千问大模型宣布将于5月20日阿里云峰会推出更全能、强大的“新朋友”,可能为全新大模型或多模态AI平台,预示技术路径与产品格局新变化。该发布与云生态深度绑定,将推动AI应用拓展、成本优化及生态开放,引发行业新浪潮。

时间:2026-05-19 09:28
云境标书AI加入英伟达初创加速计划 AI赋能招投标行业新突破

云境标书AI加入英伟达初创加速计划 AI赋能招投标行业新突破

云境标书AI”入选NVIDIA初创加速计划,获得技术、专家及生态资源支持。该产品专注于招投标领域,利用AI技术高效解析文件、生成内容,并内置合规风控与多行业知识库。其服务注重数据安全与用户所有权,提供免费基础功能与灵活付费模式,旨在提升投标效率与中标率。

时间:2026-05-19 09:28
酷开企业AI操作系统发布 引领企业管理AI原生转型

酷开企业AI操作系统发布 引领企业管理AI原生转型

酷开科技发布原生AI企业操作系统,旨在将战略目标转化为可执行、可追踪的数字化流程。该系统通过企业、岗位、个人及任务四大智能体协同运作,在“人机协同”原则下提升管理效率。同时,酷开配套提供理论书籍与咨询服务,形成完整转型方案,助力企业特别是中小企业迈向AI原生管理新阶段。

时间:2026-05-19 09:28
如祺出行AI数据战略:以高价值场景驱动世界模型训练

如祺出行AI数据战略:以高价值场景驱动世界模型训练

具身智能发展面临高质量数据短缺挑战。如祺出行依托平台优势,日均产出1600小时多模态真实场景数据,完整覆盖驾驶决策与反馈链条,为世界模型训练提供稀缺资源。公司已构建从采集到标注的全栈数据服务能力,业务拓展至自动驾驶、具身智能与大模型等领域,并与多家头部企业达成合作。

时间:2026-05-19 09:27
热门专题
更多
刀塔传奇破解版无限钻石下载大全 刀塔传奇破解版无限钻石下载大全
洛克王国正式正版手游下载安装大全 洛克王国正式正版手游下载安装大全
思美人手游下载专区 思美人手游下载专区
好玩的阿拉德之怒游戏下载合集 好玩的阿拉德之怒游戏下载合集
不思议迷宫手游下载合集 不思议迷宫手游下载合集
百宝袋汉化组游戏最新合集 百宝袋汉化组游戏最新合集
jsk游戏合集30款游戏大全 jsk游戏合集30款游戏大全
宾果消消消原版下载大全 宾果消消消原版下载大全
  • 日榜
  • 周榜
  • 月榜
热门教程
更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程