Qwen百万上下文模型正式开源
就在今天,Qwen2 5-1M 正式开源——涵盖 7B 和 14B 两个尺寸,全部向社区开放。更重要的是,它已与 vllm 深度集成,内置稀疏注意力机制,推理速度直接提升 3 到 7 倍。可以说,这是长上下文模型领域一次至关重要的迭代升级。 技术报告与模型权重现已同步发布: 技术报告地址:https
就在今天,Qwen2.5-1M 正式开源——涵盖 7B 和 14B 两个尺寸,全部向社区开放。更重要的是,它已与 vllm 深度集成,内置稀疏注意力机制,推理速度直接提升 3 到 7 倍。可以说,这是长上下文模型领域一次至关重要的迭代升级。
技术报告与模型权重现已同步发布:
- 技术报告地址:https://qianwen-res.oss-cn-beijing.aliyuncs.com/Qwen2.5-1M/Qwen2_5_1M_Technical_Report.pdf
- Hugging Face 模型库:https://huggingface.co/collections/Qwen/qwen25-1m-679325716327ec07860530ba

先看性能表现:14B 模型在经典的“大海捞针”测试中取得了全绿成绩,7B 版本也仅有少量失误。更难得的是,在将上下文长度大幅提升的同时,短序列场景下的表现依然保持出色,兼顾了长与短的双重需求。

在训练策略上,团队采用了逐步变长训练的方式,先训练至 256K 上下文,再通过长度外推技术进一步扩展。外推部分使用了 DCA(Dynamic Chunk Attention)策略——其核心思想是将较大的相对位置按 chunk 分组,映射为较小的数值,从而有效缓解位置编码在极端长度下的压力。
最后谈谈硬件门槛。若要处理长达 1M 的序列:
- Qwen2.5-7B-Instruct-1M:至少需要 120GB 显存(多 GPU 总和)。
- Qwen2.5-14B-Instruct-1M:至少需要 320GB 显存(多 GPU 总和)。
如果当前 GPU 资源不足,依然可以使用 Qwen2.5-1M 来处理短任务,灵活性相当不错。
最后,祝大家新年快乐!
你是一名 AI 行业编辑,请围绕下面这条热点输出一份资讯解读:
热点:Qwen百万上下文模型正式开源要求:
1. 先用一句话解释这条热点在讲什么
2. 再总结它为什么重要
3. 说明会影响哪些 AI 产品或内容方向
4. 最后给出 3 个适合资讯站使用的标题
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
相关热点日常工作中,你是不是也经常需要快速查询资料、验证想法?一个小工具就能搞定——基于ChatGPT API的Chrome扩展,装好之后随问随答,连注册都不用折腾。 什么是 ChatGPT Chrome Extension ai chrome 扩展程序 插件? 这个Chrome扩展的本质,就是把ChatG
你是否厌倦了在搜索结果中翻页寻找答案?Candle AI 这款基于 GPT-3 的浏览器工具,能够直接为你呈现精准的文本答案——只需输入查询,它便快速生成基于网页内容的搜索结果摘要。简单来说,就是借助 AI 自动摘要与回答,省去手动筛选信息的繁琐过程。 什么是 Candle AI Chrome 扩展
在内容创作与社交媒体运营日益复杂的当下,各类工具层出不穷,但真正能将AI写作、图形设计、视频剪辑与多账号管理无缝整合的一站式平台并不多见。今天介绍的这款工具,恰好把这一点做到了极致——它是一个集成了AI能力的全流程营销解决方案,专为企业和内容创作者打通内容生产与社交发布的全链路。 什么是 Simpl
Shift-Ctrl-F 是一款集成 MobileBERT 模型的 Chrome 扩展,专注于网页内容的语义搜索与关键信息高亮,让用户在浏览时快速定位所需答案。 Shift-Ctrl-F AI Chrome 扩展程序 插件究竟是何物? 简单来说,Shift-Ctrl-F 作为一个 Chrome 扩展
- 日榜
- 周榜
- 月榜
热点快看
