李开复发布零一万物大模型AI20时代正式开启
11月初,AI领域传来一个重磅消息:由李开复博士领衔的零一万物公司,正式开源发布了其Yi系列大模型,包含34B和6B两个版本。
这次发布之所以引发广泛关注,关键在于其展现出的惊人效率。Yi-34B模型仅用了不及LLaMA2-70B一半、Falcon-180B五分之一的参数量,就在多项核心评测中超越了这些庞然大物。凭借这一表现,它迅速跻身全球顶级开源基础模型的行列。
根据Hugging Face英文开源社区和C-Eval中文评测的最新榜单,Yi-34B预训练模型拿下了多项SOTA性能指标,成为全球开源大模型的“双料冠军”。值得一提的是,这也是首个成功登顶Hugging Face全球开源模型排行榜的国产模型。
Hugging Face Open LLM Leaderboard (pretrained) 大模型排行榜(2023年11月5日)
“Yi”这个名字,源于中文“一”的拼音。其标志设计也别有深意:“Y”上下颠倒后形似汉字“人”,与AI中的“i”结合,寓意“Human + AI”,强调技术发展以人为本的核心精神。
零一万物创始人李开复博士在发布中表达了团队的雄心:“从写下第一行代码、设计第一个模型开始,我们的目标就是跻身全球第一梯队。” 从宣布进军AI 2.0到交出首份成绩单,零一万物的步伐清晰而迅速。
一、零一万物大模型 Yi 首次曝光
作为国产大模型,Yi-34B一个显而易见的优势是对中文语境更深的理解。对比GPT-4,在CMMLU、E-Eval、Gaokao等关键中文评测集上,Yi-34B展现出了相当的竞争力,这为其更好地服务本土市场奠定了基础。
当然,模型的实力更体现在综合能力上。在评估大模型通用能力的核心基准——如MMLU(大规模多任务语言理解)和BBH上,Yi-34B同样表现突出,在知识推理、阅读理解等多个维度评比中均取得领先,这与Hugging Face的评测结果相互印证。

各评测集得分:Yi 模型 v.s. 其他开源模型
在语言模型中,上下文窗口长度是衡量其综合处理能力的关键指标,直接决定了模型能理解和生成多长、多复杂的文本。更长的窗口意味着能消化更庞大的知识库,输出更连贯、精准的内容。
此次开源的Yi-34B模型,最引人瞩目的特性之一,便是其支持200K超长上下文窗口的版本。这意味着它能一次性处理约40万汉字的文本输入,足以理解超过1000页的PDF文档。在许多场景下,这种能力甚至可以替代需要额外构建的向量数据库。
对比来看,OpenAI的GPT-4上下文窗口为32K,约2.5万字。今年三月,Anthropic的Claude2将窗口扩展到了100K。而零一万物直接将这个数字翻倍,并且是首家在开源社区开放如此超长上下文窗口的大模型公司。
当然,扩展上下文窗口绝非易事,面临计算、内存和通信等多重挑战。受限于这些因素,此前多数大模型仅支持几千tokens的长度。为了突破限制,零一万物技术团队实施了一系列深度优化,包括计算通信重叠、序列并行、通信压缩等,最终在大规模训练中实现了近100倍的效率提升。
Yi系列模型亮眼成绩的背后,离不开其强大的AI基础设施(AI Infra)支撑。通过高精度系统、弹性训练和接力训练等全栈解决方案,团队确保了训练过程的高效与稳定。得益于此,Yi-34B模型的训练成本实测下降了40%,实际训练完成时间与预测时间的误差被控制在一小时以内。模拟推算,未来千亿规模模型的训练成本有望进一步降低50%。
截至目前,零一万物的Infra能力已实现故障预测准确率超90%,故障提前发现率达99.9%,无需人工干预的故障自愈率超过95%。
无论是台前的性能表现,还是幕后的技术攻坚,都源于零一万物数月来锤炼的一套“科学训模”方法论。大模型的效果极度依赖高质量数据,团队在数据处理管线上投入了巨大成本。通过将以往类似“炼丹”的玄学过程,转变为极度细致和科学化的管线与规模预测训练,不仅保障了当前模型的高性能,也为未来更大规模模型的训练压缩了时间和成本。
经过大量建模实验,团队自研出“规模化训练实验平台”,用于指导模型设计与优化。数据配比、超参搜索、模型结构等实验均可在此平台上进行小规模验证,其对34B模型每个节点的预测误差可控制在0.5%以内。
在开源首发日,李开复博士同时宣布,在完成Yi-34B预训练的同时,团队已旋即启动下一个千亿参数模型的训练。“我们的数据处理管线、算法研究、实验平台、算力资源和AI Infra都已就绪,接下来的动作会越来越快。”
二、从「AI 1.0」到「AI 2.0」
零一万物的首次成果亮相,不仅是一次技术展示,更揭示了其背后的商业逻辑与行业趋势。
今年3月,李开复博士阐述了AI从1.0迈向2.0时代的观点。随后,零一万物在此框架下成立,并吸引了前百度安全副总裁马杰、前微软副总裁祁瑞峰等众多技术精英加入,阵容堪称豪华。
回顾过去十年,深度学习催生了第一批AI明星公司,但随后行业经历了短暂低谷,甚至出现“AI泡沫”、“AI寒冬”的讨论。其根源在于,AI 1.0时代的技术公司在商业化落地上的步伐,比预想中要缓慢。
然而,自去年Stable Diffusion掀起AIGC热潮,特别是ChatGPT发布以来,全球AI行业看到了全新的机遇。这个新阶段,正是李开复所定义的“AI 2.0”。
ChatGPT之后,技术进步体现在通用人工智能(AGI)雏形初显,而商业应用则呈现出平台级爆发的趋势。这个“平台”的核心目标,是大幅降低开发AI应用的成本。可以类比电与电网:电是伟大发明,但只有建成了电网,微波炉、电动汽车等创新应用才得以涌现。AI 2.0之于1.0,正是将技术转化为平台,从定制走向通用,从单点突破扩展到全面赋能。
过去十年的实践验证了AI 1.0的瓶颈:数据越多效果越好,但依赖大量人工标注,成本高昂;且应用多是垂直领域的“孤岛”,难以互联互通形成生态。
AI 2.0的技术基石则是自监督学习,模型无需标注也能从海量跨领域数据中学习,形成一个具备世界知识的基础模型(即大模型)。在此基础上进行微调,就能快速适配不同任务。这带来了三大优势:减少人工标注、模型具备通用知识、微调成本极低。因此,AI 2.0时代,每个行业都有机会用大模型重构原有应用,以更短时间、更低成本生产高质量内容,实现精准化、个性化服务,催生更伟大的商业模式。
要实现这一愿景,两大关键挑战必须攻克:一是降低训练成本,这是催生海量应用的前提;二是突破长文本处理瓶颈,这是解锁高阶应用(如处理长篇合同、交叉分析论文、基于长剧本进行创作、研读多份财报等)的钥匙。
正因如此,“长文本处理”在下半年成为大模型赛道的必争之地。自Anthropic向OpenAI发起挑战后,国内厂商也纷纷取得突破:月之暗面的Kimi Chat支持20万字,百川智能的Baichuan2支持35万字,而零一万物的Yi-34B则将上限推至40万字。
此次开源的Yi-34B模型支持200K上下文窗口、处理40万字文本,正是李开复AI 2.0思想的直接实践。同时,依托底层计算设施与算法优化,其训练成本下降了40%。
模型上传至Hugging Face后,迅速获得社区关注,两天内下载量即突破千次,收获近150次点赞。

长文本技术的突破,不仅是Token数字的游戏,更深层的意义在于,它体现了整个行业对AI 2.0时代商业潜力的共识与信心。正是这种信心,吸引了大量顶尖人才涌入,才能在短时间内快速攻克一个又一个技术难关。
目前,攻克长文本的主流技术方法包括直接堆叠显存、滑动窗口、降采样,或在注意力机制中进行动态插值等。这些方法效果显著,但计算开销巨大。好在,随着各大云厂商的持续投入,算力壁垒正在被逐渐打破。
毫无疑问,AI正迈入一个全新的时代。AI 2.0描绘了一个广阔的商业愿景,道路虽长,参与者众,而作为后来者的零一万物,已然展现出成为其中重要一员的潜力。接下来的表现,值得期待。
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
AI行业动态:百图生科智子引擎获投Anthropic发布Claude3.5
过去一周,AI领域资本与创新活跃。百图生科获战略投资,智子引擎等初创公司获融资。国内方面,B站开源Index-1 9B模型,月之暗面优化长文本处理,蔚来整合团队探索智能驾驶。国际层面,Anthropic发布Claude3 5Sonnet并免费开放,MIT与哈佛推出病理诊断AI,斯坦福发布开源人形机器人。同时,OpenAI前科学家Ilya创立专注AI安全的公司
智源研究院1500天坚持原始创新与大模型深度对话
面对AI技术差距,智源研究院坚持原始创新,战略转向覆盖多领域的“大模型全家桶”。在主流赛道推出低碳万亿模型Tele-FLM-1T,并研发原生多模态Emu3;在具身智能等前沿“无人区”达到世界水平,同时以FlagOS开源体系支撑生态发展,致力于攻克关键痛点。
魔形智能创始人徐凌杰获国际GPU高管加盟
前壁仞科技总裁徐凌杰于2024年6月创立上海魔形智能,专注大模型基础设施领域。公司定位为提供软硬件一体优化平台,旨在降低大模型使用成本,注册资本达1000万美元。徐凌杰拥有深厚的技术与商业背景,曾任职于阿里云及多家国际芯片企业。此外,一位国际头部GPU厂商的中国区高管也已加盟。
五大AI语言学习工具推荐:高效掌握外语的未来趋势
人工智能正深度变革语言学习,提供个性化高效工具。Trancy通过双语字幕和沉浸翻译将视频网页转为学习材料;多邻国以游戏化课程让学习趣味化;Langua凭借高级对话练习和实时反馈提升口语听力;Memrise利用间隔重复法巩固词汇记忆;Busuu则连接全球社区满足定制化需求。这些工具共同助力用户跨越语言障。
五款实用AI知识搜索引擎推荐智能搜索新体验
AI知识搜索引擎借助前沿技术,提升查询准确性与用户体验,能深入理解意图并提供精准答案。文中介绍了五款领先产品:PerplexityAI以对话式答案见长;DevvAI专注开发者需求;秘塔科技推出大众搜索与法律专用工具;ThinkAny利用RAG技术生成专业回答;KomoAI强调交互探索。它们通过智能模型与友好界面,让信息获取更直接高效。
- 日榜
- 周榜
- 月榜
1
2
3
4
5
6
7
8
9
10
相关攻略
2015-03-10 11:25
2015-03-10 11:05
2021-08-04 13:30
2015-03-10 11:22
2015-03-10 12:39
2022-05-16 18:57
2025-05-23 13:43
2025-05-23 14:01
热门教程
- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程
热门话题

