零一万物是什么公司它的AI模型与产品特点解析

数码系统

相机 win10

测评 win11

手机智车

华为 Tesla

小米理想

苹果蔚来

游戏软件

LOL 抖音

原神微信

当前位置：首页

零一万物是什么公司它的AI模型与产品特点解析

热心网友时间：2026-05-18

转载

2023年11月6日，零一万物重磅推出“Yi”系列开源预训练大语言模型，首期即发布Yi-6B与Yi-34B两款不同参数规模的版本。此次发布迅速在全球开源AI社区引发广泛关注，其核心原因在于模型展现出的卓越性能远超行业预期。

根据国际权威平台Hugging Face开源大模型排行榜及国内顶尖的C-Eval中文大模型评测基准最新数据显示，Yi-34B预训练模型一举斩获多项SOTA（业界最佳）性能指标，荣膺全球开源大模型领域的“双料冠军”。其综合表现成功超越了包括Meta的LLaMA2-70B、阿联酋的Falcon-180B在内的众多国际知名开源模型，实现了历史性突破。

尤为值得关注的是，Yi-34B成为首个登顶Hugging Face全球开源模型综合性能排行榜榜首的中国原生大模型，这标志着中国在开源基础模型领域取得了里程碑式的重大成就。

高效架构，问鼎全球中英文权威大模型评测双榜首

具体分析其性能表现，在Hugging Face的英文预训练开源模型综合排名中，Yi-34B以70.72的高分位居全球第一，上演了一场经典的“以少胜多”效率奇迹。其模型参数量显著低于LLaMA2-70B和Falcon-180B等竞争对手，却在多项核心评测任务中实现了性能的全面领先。

这背后体现的是极高的训练与架构效率。Yi-34B的参数量仅为LLaMA2-70B的一半左右，更是只有Falcon-180B的大约五分之一。正是在这种更为精炼高效的“轻量化”设计下，它在包括常识推理、知识问答在内的多项测试中超越了当时的全球领跑者，稳固跻身世界顶级开源基础模型之列。

来源：https://huggingface.co/spaces/HuggingFaceH4/open_llm_leaderboard

作为源自中国的大模型，Yi-34B在中文语言理解与生成能力上的优势更为突出。它在C-Eval中文权威评测榜单上超越了所有同期的开源模型，展现出对中文文化、语境与表达习惯的深刻把握。相较于GPT-4，Yi-34B在CMMLU（中文多任务语言理解）、E-Eval及Gaokao（高考）等核心中文评测集上建立了显著优势，这使其能更精准地理解和服务于中文用户及本土市场的多样化需求。

从大模型综合能力评估视角看，在衡量模型核心智能水平的“MMLU”（大规模多任务语言理解）以及BBH（BIG-Bench Hard）等具有挑战性的评测集上，Yi-34B的表现同样最为亮眼。无论是在通用知识、复杂推理还是深度阅读理解方面，它都展现出全面领先的实力，这一结论与Hugging Face的独立评测结果高度一致。

当然，模型也存在可优化的空间。与LLaMA2类似，Yi系列模型在GSM8k（数学问题求解）和MBPP（代码生成）等特定领域的评测中，表现暂未超越GPT系列模型。针对这一情况，零一万物官方表示，后续计划推出专注于代码与数学能力持续训练的专项优化模型，以完善其全场景能力矩阵。

开创性支持200K超长上下文，模型完全开源

除了基础性能的卓越表现，此次发布的另一大核心亮点在于其开创性的上下文窗口长度。对于大语言模型的实际部署与应用而言，能够处理多长的连续文本（即上下文窗口）至关重要。此次开源的Yi-34B版本，原生支持高达200K tokens的超长上下文窗口，这在当时创下了全球开源大模型的纪录。

200K上下文窗口意味着什么？它大约可以一次性处理相当于40万汉字长度的超长文本输入，其容量堪比一部完整的《儒林外史》。作为对比，OpenAI的GPT-4 Turbo的上下文窗口为128K，而早期GPT-4的上下文窗口仅为32K。这种数量级的提升，为长文档摘要、跨章节知识问答、复杂多轮对话以及长程逻辑推理等高级应用场景，开辟了前所未有的可能性。

来源:https://www.ainav.cn/sites/1705.html

上一篇：无代码AI开发平台Trickle AI使用指南

下一篇：雷鸟Q5AD电竞显示器预售 24.5英寸300Hz高刷屏仅659元