当前位置: 首页
AI
零一万物是什么公司 它的AI模型与产品特点解析

零一万物是什么公司 它的AI模型与产品特点解析

热心网友 时间:2026-05-18
转载

2023年11月6日,零一万物重磅推出“Yi”系列开源预训练大语言模型,首期即发布Yi-6B与Yi-34B两款不同参数规模的版本。此次发布迅速在全球开源AI社区引发广泛关注,其核心原因在于模型展现出的卓越性能远超行业预期。

根据国际权威平台Hugging Face开源大模型排行榜及国内顶尖的C-Eval中文大模型评测基准最新数据显示,Yi-34B预训练模型一举斩获多项SOTA(业界最佳)性能指标,荣膺全球开源大模型领域的“双料冠军”。其综合表现成功超越了包括Meta的LLaMA2-70B、阿联酋的Falcon-180B在内的众多国际知名开源模型,实现了历史性突破。

零一万物

尤为值得关注的是,Yi-34B成为首个登顶Hugging Face全球开源模型综合性能排行榜榜首的中国原生大模型,这标志着中国在开源基础模型领域取得了里程碑式的重大成就。

零一万物

高效架构,问鼎全球中英文权威大模型评测双榜首

具体分析其性能表现,在Hugging Face的英文预训练开源模型综合排名中,Yi-34B以70.72的高分位居全球第一,上演了一场经典的“以少胜多”效率奇迹。其模型参数量显著低于LLaMA2-70B和Falcon-180B等竞争对手,却在多项核心评测任务中实现了性能的全面领先。

这背后体现的是极高的训练与架构效率。Yi-34B的参数量仅为LLaMA2-70B的一半左右,更是只有Falcon-180B的大约五分之一。正是在这种更为精炼高效的“轻量化”设计下,它在包括常识推理、知识问答在内的多项测试中超越了当时的全球领跑者,稳固跻身世界顶级开源基础模型之列。

零一万物

来源:https://huggingface.co/spaces/HuggingFaceH4/open_llm_leaderboard

作为源自中国的大模型,Yi-34B在中文语言理解与生成能力上的优势更为突出。它在C-Eval中文权威评测榜单上超越了所有同期的开源模型,展现出对中文文化、语境与表达习惯的深刻把握。相较于GPT-4,Yi-34B在CMMLU(中文多任务语言理解)、E-Eval及Gaokao(高考)等核心中文评测集上建立了显著优势,这使其能更精准地理解和服务于中文用户及本土市场的多样化需求。

零一万物

从大模型综合能力评估视角看,在衡量模型核心智能水平的“MMLU”(大规模多任务语言理解)以及BBH(BIG-Bench Hard)等具有挑战性的评测集上,Yi-34B的表现同样最为亮眼。无论是在通用知识、复杂推理还是深度阅读理解方面,它都展现出全面领先的实力,这一结论与Hugging Face的独立评测结果高度一致。

零一万物

当然,模型也存在可优化的空间。与LLaMA2类似,Yi系列模型在GSM8k(数学问题求解)和MBPP(代码生成)等特定领域的评测中,表现暂未超越GPT系列模型。针对这一情况,零一万物官方表示,后续计划推出专注于代码与数学能力持续训练的专项优化模型,以完善其全场景能力矩阵。

开创性支持200K超长上下文,模型完全开源

除了基础性能的卓越表现,此次发布的另一大核心亮点在于其开创性的上下文窗口长度。对于大语言模型的实际部署与应用而言,能够处理多长的连续文本(即上下文窗口)至关重要。此次开源的Yi-34B版本,原生支持高达200K tokens的超长上下文窗口,这在当时创下了全球开源大模型的纪录。

200K上下文窗口意味着什么?它大约可以一次性处理相当于40万汉字长度的超长文本输入,其容量堪比一部完整的《儒林外史》。作为对比,OpenAI的GPT-4 Turbo的上下文窗口为128K,而早期GPT-4的上下文窗口仅为32K。这种数量级的提升,为长文档摘要、跨章节知识问答、复杂多轮对话以及长程逻辑推理等高级应用场景,开辟了前所未有的可能性。

来源:https://www.ainav.cn/sites/1705.html

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章
更多
微信鸿蒙版8.0.17.38灰度测试:元宝聊天与视频号新功能上线

微信鸿蒙版8.0.17.38灰度测试:元宝聊天与视频号新功能上线

微信鸿蒙版App发布8 0 17 38尝鲜更新,测试期至6月16日。本次更新在官方“修复已知问题”的说明下,实则带来了多项功能升级,重点围绕视频号体验优化、AI音乐创作探索及社交工具完善。视频号新增资料修改、双击点赞、直播自定义选项;听一听功能灰度上线AI写歌与AI翻唱;同时灰度测试了“与元宝聊天

时间:2026-05-18 13:14
惠康制冰机快速出冰夏日特惠 多重补贴到手价171元

惠康制冰机快速出冰夏日特惠 多重补贴到手价171元

惠康HZB-16M制冰机在盛夏时节推出特惠活动。该机器主打快速制冰,仅需6-8分钟即可完成一批冰块,并配备一键自清洁功能,方便日常维护。原价259元起的产品,通过叠加政府及平台补贴、专属优惠券和晒单返现等多项优惠后,到手价低至171元。此外,购买还享有“买贵双倍赔”和以旧换新选项,产品提供2年质保,

时间:2026-05-18 13:14
中国技术标准助力中亚首条全自动无人驾驶轻轨通车

中国技术标准助力中亚首条全自动无人驾驶轻轨通车

哈萨克斯坦阿斯塔纳轻轨一期项目于5月16日正式通车,这是中亚地区首条全自动无人驾驶轻轨线路。该项目全长约22 4公里,设18站,连接机场与火车站等关键节点,采用中国技术、装备和标准建造。哈萨克斯坦总统托卡耶夫在通车仪式上试乘并用中文向中方致谢。线路配备19列车,最高时速80公里,发车间隔5-6分钟,

时间:2026-05-18 13:14
90岁石油工程师玩《深海迷航2》 真实经历与深海生存游戏惊人相似

90岁石油工程师玩《深海迷航2》 真实经历与深海生存游戏惊人相似

一位90岁高龄、曾为石油工程师的玩家体验了水下生存游戏《深海迷航2:异星水域》。他结合自身勘探经历,认为游戏对资源探索逻辑与未知危险的呈现相当真实考究。这一事件展现了游戏设计对专业领域的借鉴深度,也反映了游戏受众的多元化趋势,以及虚拟体验与真实世界知识体系之间可能产生的有趣共鸣。

时间:2026-05-18 13:14
AMD锐龙处理器包装芯片不符事件调查:9950X3D2惊现上代产品

AMD锐龙处理器包装芯片不符事件调查:9950X3D2惊现上代产品

一位海外消费者在亚马逊购买全新AMD锐龙99950X3D2处理器,开箱后发现内部芯片实为上一代9950X3D,但外包装防伪贴纸完好无损,引发广泛关注。硬件社区对此提出两种主要推测:一是AMD生产线包装出错;二是遭遇高技术退货诈骗。然而,由于两款芯片差价不大,诈骗动机存疑。目前买家已申请退货,事件原

时间:2026-05-18 13:14
热门专题
更多
刀塔传奇破解版无限钻石下载大全 刀塔传奇破解版无限钻石下载大全
洛克王国正式正版手游下载安装大全 洛克王国正式正版手游下载安装大全
思美人手游下载专区 思美人手游下载专区
好玩的阿拉德之怒游戏下载合集 好玩的阿拉德之怒游戏下载合集
不思议迷宫手游下载合集 不思议迷宫手游下载合集
百宝袋汉化组游戏最新合集 百宝袋汉化组游戏最新合集
jsk游戏合集30款游戏大全 jsk游戏合集30款游戏大全
宾果消消消原版下载大全 宾果消消消原版下载大全
  • 日榜
  • 周榜
  • 月榜
热门教程
更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程