当前位置: 首页
AI
腾讯混元发布0.3B端侧模型,内存仅占600MB

腾讯混元发布0.3B端侧模型,内存仅占600MB

热心网友 时间:2026-02-10
转载

2月10日,IT之家发布消息,腾讯混元今日正式发布一款面向消费级硬件场景的“极小”模型HY-1.8B-2Bit。该模型基于首个产业级2Bit端侧量化方案打造,其等效参数量仅为0.3B,内存占用低至600MB,体积比许多常见的手机应用还要小巧。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

据介绍,该模型是通过对腾讯混元此前推出的小尺寸语言模型——HY-1.8B-Instruct进行2比特量化感知训练而产出的。相比原始精度模型,其等效参数量降低了6倍,并且在完全继承原模型全思考能力的同时,在真实端侧设备上的生成速度比原始精度模型提升了2到3倍,可大幅提升实际使用体验。

腾讯混元此次推出HY-1.8B-2Bit模型,可以在边缘设备上无压力部署。这也是首个实现2bit产业级量化的端侧模型实践。

比特是计算机存储的最小单位,1比特能表示2种状态,2比特能表示4种状态,依此类推。一般模型的精度可用2比特、4比特、8比特、32比特等方式表示,数值越大模型的精度越高,所占用的内存也越大。

虽然2比特量化的精度损失较大,但通过QAT(量化感知训练)和先进的量化策略,已经能让2比特模型接近全精度模型的性能。在模型能力方面,对比4比特PTQ(训练后量化)模型版本,HY-1.8B-2Bit在数学、代码、科学等指标上表现相当,实现了“小而强”的设计目标。

此外,HY-1.8B-2Bit模型还沿用了Hunyuan-1.8B-Instruct的全思考能力,用户可以灵活使用。模型为简单的查询提供了简洁的思维链,为复杂的任务则提供了详尽的长思维链,用户可以根据其应用的复杂性和资源限制,灵活地选择这两种推理模式。

技术上,量化作为大模型部署上线不可或缺的一环,肩负着降低部署成本与保精度的使命。大部分情况下,对于int4、int8、fp8的压缩精度要求,采用PTQ量化策略即可实现几乎无损。但随着原始模型大小的缩小、压缩bit数的进一步降低,PTQ带来的量化损失是巨大的。因此,对于原始模型大小只有1.8B,量化bit数只有2bit的HY-1.8B-2Bit,混元团队采用了量化感知训练策略,这显著提升了量化后模型的性能。

腾讯混元还通过数据优化、弹性拉伸量化以及训练策略创新三个方法,来最大限度的提升HY-1.8B-2Bit的全科能力。

部署方面,腾讯混元提供了HY-1.8B-2Bit的gguf-int2格式的模型权重与bf16伪量化权重。对比原始精度模型,HY-1.8B-2Bit实际模型大小直降6倍,仅有300MB,能够灵活用于端侧设备上。该模型也已针对Arm等计算平台完成适配,并可部署于启用Arm SME2技术的移动设备上,同时实现高效运行。

在MacBook M4芯片上,固定线程数为2的情况下测试了不同上下文窗口大小下的首字时延和生成速度。模型选定fp16、Q4、HY-1.8B-2Bit三种gguf格式作为对比。在1024输入长度内,HY-1.8B-2Bit的首字时延能够保持3至8倍的加速;在生成速度上,在常用上下文窗口下对比原始模型精度,HY-1.8B-2Bit能够实现至少2倍的稳定加速。

在天玑9500上也进行了同样测试,对比HY-1.8B-Q4格式,首字时延能够加速1.5至2倍,生成速度加速约1.5倍。

为了在边缘设备上实现大语言模型的灵活部署,HY-1.8B-2Bit采用了极低比特量化技术,在保持与INT4-PTQ方法相当模型性能的同时,实现了在端侧设备上的高效稳定推理。

当前,HY-1.8B-2Bit的能力仍受限于监督微调的训练流程,以及基础模型本身的性能与抗压缩能力。针对这一问题,混元团队未来将重点转向强化学习与模型蒸馏等技术路径,以期进一步缩小低比特量化模型与全精度模型之间的能力差距,从而为边缘设备上的大语言模型部署开拓更广阔的应用前景。

来源:https://tech.ifeng.com/c/8qczg6r9PJk

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章
更多
安卓万元机选购指南:突破高价的三大关键策略

安卓万元机选购指南:突破高价的三大关键策略

智东西作者 云鹏编辑 心缘智东西3月30日晚间消息,刚刚,vivo掏出了年度“超大杯”旗舰机vivo X300 Ultra,这场发布会在云南丽江召开,发布会地面直接“长草”。vivo对X300 Ul

时间:2026-03-31 09:43
DeepSeek宕机8小时,我看到的AI行业真相

DeepSeek宕机8小时,我看到的AI行业真相

DeepSeek又上热搜了。这次不是因为发布了什么新模型,而是因为——它崩了。整整8个小时,写论文的学生、玩角色扮演的网友、深夜找AI吐槽的打工人,全部集体失联。社交媒体上哀嚎一片,有人甚至开玩笑说

时间:2026-03-31 09:37
国行Apple智能更新解析:深夜上线实测体验

国行Apple智能更新解析:深夜上线实测体验

国行用户等待两年之后,终于正式亮相。作者|张勇毅过去两年,国行的 Apple 智能一直都是一个“只闻楼梯响,不见人影来”的事件:即使苹果正式已经有相关的标注,标明目前全系设备都已为 Apple 智能

时间:2026-03-31 09:31
玉柴首创混合动力飞轮增程系统赋能农业现代化绿色升级

玉柴首创混合动力飞轮增程系统赋能农业现代化绿色升级

在河南驻马店国际会展中心举办的全国农业机械展览会上,玉柴集团携两款全球首创的农机动力系统惊艳亮相,成为展会焦点。此次展出的混合动力电驱无级变速动力总成(IE-Power)和飞轮增程系统(FRS),标

时间:2026-03-31 09:25
东风汽车全球设计中心启用,24小时协同引领全球化新篇章

东风汽车全球设计中心启用,24小时协同引领全球化新篇章

在武汉,一场以“中国叙事·东风设计”为主题的盛会——东风汽车全球设计创新日活动拉开帷幕。活动现场,东风汽车正式发布“东方风韵”设计哲学,同时启用东风汽车全球设计中心造型新大楼,这一系列动作标志着东风

时间:2026-03-31 09:19
热门专题
更多
刀塔传奇破解版无限钻石下载大全 刀塔传奇破解版无限钻石下载大全
洛克王国正式正版手游下载安装大全 洛克王国正式正版手游下载安装大全
思美人手游下载专区 思美人手游下载专区
好玩的阿拉德之怒游戏下载合集 好玩的阿拉德之怒游戏下载合集
不思议迷宫手游下载合集 不思议迷宫手游下载合集
百宝袋汉化组游戏最新合集 百宝袋汉化组游戏最新合集
jsk游戏合集30款游戏大全 jsk游戏合集30款游戏大全
宾果消消消原版下载大全 宾果消消消原版下载大全
  • 日榜
  • 周榜
  • 月榜
热门教程
更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程