当前位置: 首页
业界动态
腾讯混元推出0.3B端侧模型,国内首条2Bit量化产业路线获突破

腾讯混元推出0.3B端侧模型,国内首条2Bit量化产业路线获突破

热心网友 时间:2026-02-10
转载

2月10日,腾讯混元团队推出了面向消费级硬件场景的“极小”模型HY-1.8B-2Bit。这款模型基于1.8B参数的小尺寸架构,通过创新的2Bit量化技术,实现了仅约0.3B的等效参数量,实际存储占用更是低至约600MB,甚至比一些常见的手机应用还要小巧,为端侧部署带来了新的突破。

首个产业级2Bit量化新突破,腾讯混元推出0.3B端侧模型

该模型基于混元团队首创的产业级2Bit端侧量化方案,通过对HY-1.8B-Instruct模型进行2比特量化感知训练产出。模型体积被大幅压缩至原始精度模型的六分之一,同时在真实端侧设备上的生成速度提升了2-3倍,用户体验得到显著改善。在能力方面,模型完整保留了原版的思维链特性,能够为不同复杂度的任务提供相应深度的推理过程。这是业界首个实现2比特产业级量化的端侧模型实践。

首个产业级2Bit量化新突破,腾讯混元推出0.3B端侧模型首个产业级2Bit量化新突破,腾讯混元推出0.3B端侧模型

左图为HY-1.8B原始精度模型,右图为HY-1.8B-2Bit模型,量化后的模型速度明显更快。

随着大语言模型日益普及,如何将它们高效地部署到手机、耳机或者智能家居等设备中,成为行业面临的一大挑战。尤其在许多对模型的离线部署、私密性有更高要求的场景下,我们需要更多能够在端侧运行且兼顾小巧体积与强性能的模型。端侧部署的展开,本质上是一条追求“小而精,快而准”的艰难探索之路,我们既需要模型足够聪明以应对千变万化的真实需求,又必须将其约束在极其有限的硬件资源内并实现快速推理,这就好比为模型进行了一场“减脂增肌、减重提质”的改造。

比特是计算机存储的最小单位,1比特能表示2种状态(0或1),2比特能表示4种状态,依此类推。通常模型的精度有2比特、4比特、8比特、32比特等多种表示方法,数值越大意味着模型的精度越高,但所占用的内存也越大。

虽然2比特量化会带来较大的精度损失,但通过量化感知训练和先进的量化策略,现已能够让2比特模型接近全精度模型的性能。在模型能力方面,对比4比特PTQ模型版本,它在数学、代码、科学等指标上表现相当,真正实现了“小而强”的设计目标。

技术层面,量化作为大模型部署上线不可或缺的一环,肩负着降低部署成本与保精度的双重使命。大部分情况下,对于Int4、Int8、FP8的压缩精度要求,采用PTQ量化策略即可实现几乎无损的压缩。但随着原始模型体积的缩小、压缩比特数的进一步降低,PTQ带来的量化损失是巨大的。因此,对于原始模型大小仅为1.8B、量化比特数只有2比特的HY-1.8B-2Bit,混元团队采用了量化感知训练策略,显著提升了量化后模型的性能。

腾讯混元还通过数据优化、弹性拉伸量化以及训练策略创新三种方法,最大限度地提升HY-1.8B-2Bit的全科能力。

部署方面,腾讯混元提供了HY-1.8B-2Bit的GGUF-Int2格式模型权重与BF16伪量化权重。对比原始精度模型,HY-1.8B-2Bit能够灵活用于端侧设备上。该模型也已在Arm等计算平台上完成适配,可部署于启用Arm SME2技术的移动设备上,并实现高效运行。

在MacBook M4芯片上,通过固定线程数为2,测试了不同窗口大小下的首字时延和生成速度。模型选择FP16、Q4、HY-1.8B-2Bit三种GGUF格式作为对比。在1024输入长度内,首字时延能够保持3-8倍的加速;生成速度上,在常用窗口大小下对比原始模型精度,HY-1.8B-2Bit能够实现至少2倍的稳定加速。

首个产业级2Bit量化新突破,腾讯混元推出0.3B端侧模型

在天玑9500上同样进行了测试,对比HY-1.8B-Q4格式,首字时延能够加速1.5-2倍,生成速度加速约1.5倍。

首个产业级2Bit量化新突破,腾讯混元推出0.3B端侧模型

当前,HY-1.8B-2Bit的能力仍受限于监督微调的训练流程,以及基础模型本身的性能与抗压能力。针对这一问题,混元团队未来将重点转向强化学习与模型蒸馏等技术路径,以期进一步缩小低比特量化模型与全精度模型之间的能力差距,从而为边缘设备上的大语言模型部署开拓更广阔的应用前景。

项目页面已开源。

模型地址已公布。

技术报告已发布。


来源:https://www.leiphone.com/category/industrynews/l9jyZlcDsoDFMzjU.html

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章
更多
路虎揽胜SV ULTRA首发:搭载静电音响系统,限量邀约订购

路虎揽胜SV ULTRA首发:搭载静电音响系统,限量邀约订购

路虎近日正式发布全新揽胜SV ULTRA,将其定位为品牌史上最豪华、科技最先进、体验最尊贵的旗舰SUV。这款车型目前仅面向受邀客户开放订购,以极致专属性彰显其顶级身份。 新车最引人注目的革新在于全球首次搭载的车载静电音响系统。该技术采用21个厚度仅1毫米的超轻振膜传感器,相比传统扬声器,响应速度提升

时间:2026-05-18 11:51
F5助力企业AI推理服务:异构芯片部署下的高效省心解决方案

F5助力企业AI推理服务:异构芯片部署下的高效省心解决方案

随着大模型从概念验证迈向企业核心生产系统,一个关键趋势正在显现:产业竞争的焦点正从单纯的模型性能竞赛,转向推理服务的效率与稳定性之争。最新行业数据显示,截至2026年3月,中国市场的日均词元(Token)处理量已突破140万亿,相较两年前的千亿级别,实现了超千倍的爆发式增长。这标志着AI应用正经历从

时间:2026-05-18 11:51
千问AI推出119种语言图片翻译功能覆盖全球98%人口

千问AI推出119种语言图片翻译功能覆盖全球98%人口

4月29日,AI翻译技术迎来重大突破。千问APP全面升级其图片翻译功能,率先在行业内实现了对全球119种语言的“图片到图片”即时翻译。这一创新意味着,全球约98%人口所使用的语言,现在都能通过简单的拍照动作完成精准互译。 此次升级的语言覆盖范围之广,堪称行业里程碑。它不仅全面支持英语、日语、法语、德

时间:2026-05-18 11:51
跨境电商自动化营销工具盘点与智能体应用解析

跨境电商自动化营销工具盘点与智能体应用解析

步入2026年,跨境电商领域的营销自动化已彻底告别了早期仅能定时群发邮件的“单点工具”时代。整个生态已演进为一个由多个“智能体”协同运作的精密网络。其核心价值在于,能够自主完成从市场洞察到策略执行的全链路营销任务。以“实在Agent”为代表的先进技术,凭借其独特的ISS(智能屏幕语义理解)能力,已成

时间:2026-05-18 11:35
亚马逊是美国公司吗?跨境电商平台背景解析

亚马逊是美国公司吗?跨境电商平台背景解析

许多亚马逊卖家都曾疑惑:“亚马逊究竟是哪个国家的企业?” 这看似一个基础问题,但其答案却紧密关联着平台的规则基因、合规框架与市场逻辑。仅仅知道表面答案远远不够,深入理解其背后的商业本质,才能在日常运营中规避风险、把握先机。本文将为您透彻解析亚马逊的美国属性,阐明其对卖家策略的关键影响,并探讨如何在全

时间:2026-05-18 11:35
热门专题
更多
刀塔传奇破解版无限钻石下载大全 刀塔传奇破解版无限钻石下载大全
洛克王国正式正版手游下载安装大全 洛克王国正式正版手游下载安装大全
思美人手游下载专区 思美人手游下载专区
好玩的阿拉德之怒游戏下载合集 好玩的阿拉德之怒游戏下载合集
不思议迷宫手游下载合集 不思议迷宫手游下载合集
百宝袋汉化组游戏最新合集 百宝袋汉化组游戏最新合集
jsk游戏合集30款游戏大全 jsk游戏合集30款游戏大全
宾果消消消原版下载大全 宾果消消消原版下载大全
  • 日榜
  • 周榜
  • 月榜
热门教程
更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程