当前位置: 首页
AI
开源Yuan 3.0 Flash多模态大模型发布:40B参数,推理仅激活3.7B

开源Yuan 3.0 Flash多模态大模型发布:40B参数,推理仅激活3.7B

热心网友 时间:2025-12-31
转载

12月31日消息,元浪科技旗下YuanLab.ai团队于12月30日正式开源发布了其多模态基础大模型「源Yuan 3.0 Flash」。

Yuan 3.0 Flash是一款参数规模达400亿的多模态基础模型,它采用了稀疏混合专家架构,在单次推理时仅需激活约37亿参数。

该模型创新性地提出并采用了反思抑制强化学习方法,通过引入反思抑制奖励机制,从训练层面引导模型减少无效的“反思”过程。这一方法在提升推理准确性的同时,显著压缩了推理过程中的令牌消耗,从而大幅降低了算力成本。

Yuan 3.0 Flash由视觉编码器、语言主干网络以及多模态对齐模块共同构成。

其语言主干网络采用了局部过滤增强注意力结构与混合专家架构,在提升注意力精度的同时,有效降低了训练与推理的算力开销;

在多模态处理方面,模型通过视觉编码器将视觉信号转换为令牌,并与语言令牌一同输入语言主干网络,再经由多模态对齐模块实现高效、稳定的跨模态特征对齐;

此外,模型还引入了自适应图像分割机制,在支持高分辨率图像理解的同时,降低了显存需求及算力开销。

源Yuan 3.0 Flash 多模态基础大模型开源发布:40B 参数规模,单次推理仅激活约 3.7B

在企业级应用的检索增强生成、多模态检索、多模态表格理解、摘要生成等任务中,Yuan 3.0 Flash的表现已优于GPT-5.1。

在多模态推理与语言推理的综合评测中,Yuan 3.0 Flash的表现精度已接近参数量达2350亿的Qwen3-VL与6710亿的DeepSeek-R1,但其令牌消耗仅为后者的四分之一到二分之一,显著降低了企业应用大模型的部署与运营成本。

源Yuan 3.0 Flash 多模态基础大模型开源发布:40B 参数规模,单次推理仅激活约 3.7B

Yuan 3.0 Flash已全面开源,全系列模型参数与代码均可免费下载使用。开源地址如下:

https://github.com/Yuan-lab-LLM/Yuan3.0

来源:https://www.ithome.com/0/909/646.htm

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章
更多
Perplexity AI学术模式使用指南:精准获取高质量参考文献

Perplexity AI学术模式使用指南:精准获取高质量参考文献

在Perplexity中进行学术文献检索时,若发现结果中混杂着大量新闻、博客或商业推广页面,而高质量的期刊论文、预印本等学术资源却寥寥无几,这通常意味着未能正确启用其“学术搜索”功能。要让AI助手精准定位具有参考价值的学术文献,掌握以下几个关键步骤至关重要。 一、启用Academic学术模式并验证账

时间:2026-05-16 22:44
最先被AI淘汰的将是这些公司而非员工

最先被AI淘汰的将是这些公司而非员工

Daniel Miessler 曾一针见血地指出一个普遍困境:“许多公司并非不愿采用AI,而是根本不知从何用起。人们对AI效果未达预期的多数失望,根源往往在于无法精准描述自身的真实需求。” 这一洞察揭示了AI应用的核心前提:AI本质是高效执行者,它依赖明确、清晰的指令。意图模糊,再先进的模型也无能为

时间:2026-05-16 22:43
AI三维空间感知与几何理解机制原理解析

AI三维空间感知与几何理解机制原理解析

如今的人工智能技术,已经能够在毫秒级别识别厨房照片中的物体,精准分割街景中的每个元素,甚至生成现实中从未存在过的逼真室内图像。然而,当你要求它走进一个真实的房间,回答“哪个物品放在哪个架子上”、“桌子距离墙壁有多远”或“天花板与窗户的边界在何处”这类涉及空间关系的问题时,它的局限性便暴露无遗。 当前

时间:2026-05-16 22:42
苹果Siri虚假宣传和解案:用户最高可获647元赔偿指南

苹果Siri虚假宣传和解案:用户最高可获647元赔偿指南

5月初,科技界传来一则重磅消息:苹果公司就一起涉及Siri人工智能功能的集体诉讼达成和解,同意支付高达2 5亿美元(约合17亿软妹币)的赔偿金。这意味着,在2024年6月至2025年3月期间于美国购买了特定型号iPhone的用户,将有机会获得每台设备25至95美元(约合170至647元软妹币)的补偿

时间:2026-05-16 22:42
AI编程基准测试新作发布主流模型表现引热议

AI编程基准测试新作发布主流模型表现引热议

编辑|Sia SWE-Bench的缔造者们,最近又扔出了一枚重磅冲击波——一个堪称地狱级难度的新基准测试。 结果一出,整个圈子都安静了。 Claude Opus 4 7、GPT-5 4、GPT-5 mini、Gemini 3 1 Pro、Gemini 3 Flash……这一代所有站在金字塔尖的顶级模

时间:2026-05-16 22:36
热门专题
更多
刀塔传奇破解版无限钻石下载大全 刀塔传奇破解版无限钻石下载大全
洛克王国正式正版手游下载安装大全 洛克王国正式正版手游下载安装大全
思美人手游下载专区 思美人手游下载专区
好玩的阿拉德之怒游戏下载合集 好玩的阿拉德之怒游戏下载合集
不思议迷宫手游下载合集 不思议迷宫手游下载合集
百宝袋汉化组游戏最新合集 百宝袋汉化组游戏最新合集
jsk游戏合集30款游戏大全 jsk游戏合集30款游戏大全
宾果消消消原版下载大全 宾果消消消原版下载大全
  • 日榜
  • 周榜
  • 月榜
热门教程
更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程