当前位置: 首页
科技数码
ICML26清华UDS智能筛选训练样本,大模型微调算力减半

ICML26清华UDS智能筛选训练样本,大模型微调算力减半

热心网友 时间:2026-07-05
转载

长期以来,大模型监督微调(SFT)被视为“数据越多效果越好”的常规操作。然而,一线训练实践表明这一直觉存在严重偏差。2026年产业数据显示,国内大模型训练的算力有效利用率不足50%。大量GPU算力被重复、低信息量甚至带有偏见的冗余样本所消耗。

从根源来看,全量样本训练不仅直接推高GPU采购与云算力租赁费用,更易导致模型过拟合,甚至放大认知偏差。在金融、医疗、工业等垂直领域,企业进行定制化微调往往需要数十万条标注数据,时间与资金成本极为高昂。算力浪费已成为制约中小AI企业模型迭代的核心瓶颈。

业内早已认识到智能筛选样本的价值,并涌现了MaxLoss、MaxGrad、GREATS等在线批次选择方案。但这些方法各有缺陷。大多数方案仅关注样本的“训练难度”,单纯选取损失值高的样本,完全忽略样本之间及样本内部的信息多样性。这导致筛选出的批量样本高度同质化,训练过程中偏差不断叠加。另有方案需要额外引入验证集、外部参考模型,甚至多次反向传播计算梯度,额外开销超过全量训练,难以在工业场景中落地。行业亟需一个兼顾效率、精度与轻量化的一体化筛选框架。

此次清华团队在ICML 2026上提出的UDS框架,思路突破了传统范式。核心创新在于直接复用前向传播时生成的logits矩阵,无需额外计算即可同步完成两个维度的评分。一方面,利用logits矩阵的核范数评估单条样本的内部重要性,量化其信息丰富度与训练增益;另一方面,通过低维投影压缩样本特征,结合缓存缓冲区,计算当前样本与历史训练数据的距离,确保批次内样本具备充分多样性。两个分数加权融合,选出最优样本。整套流程无需外部数据集或第三方模型,可无缝适配LoRA微调、全参数微调及长上下文推理。

工程实现面临的一大挑战是海量logits矩阵的存储。若直接完整保存原始logits向量,千级样本即可消耗数十GB显存,严重限制训练集群并发能力。UDS采用随机投影算法压缩特征维度,在几乎不损失样本距离判断精度的前提下,将内存开销降至极低,并配合FIFO内存缓存,设计十分精巧。

消融实验进一步证实,两大核心模块缺一不可。单独使用样本效用分数或多样性距离仅能小幅提升精度,而两者结合则带来模型综合能力的跨越式增长。团队选取Llama-3.1-8B和通义千问Qwen-2.5-7B两个主流开源基座,在MMLU通用知识、ScienceQA科学问答、GSM8K数学推理、HumanEval代码生成四个权威基准上进行了多轮对照实验。结果直观:以国产Qwen-2.5-7B为例,经UDS筛选样本训练后,MMLU准确率达到63.34%,较此前最优方案GREATS提升5.15个百分点,ScienceQA、数学、代码评测全面领先。训练吞吐量显著高于全量SFT模式,在相同硬件条件下单位时间内可处理更多有效样本,实现精度与速度的双向提升。

泛化能力与产业落地

该技术的泛化能力同样出色,不受训练参数规模、上下文长度或微调模式的限制。实验涵盖不同批次大小(8/16)、LoRA低秩微调、全参数微调、2048超长文本推理以及分布外(OOD)泛化测试等多种工况,UDS在所有条件下均稳定优于全量训练、随机采样、传统损失筛选等基线方案。与离线样本筛选算法FisherSFT相比,在同等样本选取比例下,四大基准指标全面领先,表明在线动态筛选比事前离线过滤更契合实时训练的实际需求。

从产业发展视角看,UDS的落地恰逢其时。2026年AI产业竞争逻辑已从比拼硬件算力规模转向单位算力产出的模型效能。IDC预测,未来推理与微调的算力需求将持续暴涨,HBM高端存储、GPU硬件成本长期维持高位,中小企业难以持续承受全量数据集训练带来的巨额开销。清华这套原生轻量化筛选框架无需改造底层算力硬件,仅靠算法优化即可削减半数算力消耗,切实降低了垂直行业定制模型的落地门槛。

对于国内开源产业,通义千问、Llama系列已成为企业微调的主流基座,UDS可直接无缝接入现有训练流水线,无需重构数据处理架构。政务、制造、金融等垂直领域的服务商,无需再囤积大规模高端算力集群,仅凭少量GPU即可完成高质量模型微调,大幅缩短产品迭代周期。算力资源有限的科研团队和初创AI公司,也能以更低的试错成本推动细分场景的专用小模型快速落地,进一步激活国内AI的长尾创新活力。

总体而言,清华团队在ICML 2026上提出的UDS方案,标志着大模型监督微调正式告别“数据堆砌”的粗放阶段。这套依托原生logits、兼顾样本效用与多样性、且额外开销极低的在线筛选框架,既解决了全量训练算力浪费、模型过拟合等行业共性痛点,又适配了国内外主流开源基座及各类工业微调场景。随着技术逐步开源落地,大模型训练将迈入“精准选样本、高效练模型”的精细化时代,全行业算力成本压力有望持续缓解,人工智能技术在千行百业的规模化落地更值得期待。

来源:https://www.163.com/dy/article/L0JJOG4405118HA4.html

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章
更多
最新消息称国行苹果iPhone 18 Pro Max电池容量达到了5391mAh增幅11.78%

最新消息称国行苹果iPhone 18 Pro Max电池容量达到了5391mAh增幅11.78%

国行iPhone18ProMax电池容量达5391mAh,较前代增幅11 78%,增量近568mAh;Pro机型仅小幅提升68mAh。爆料称最终数据待验证,若属实则续航将显著增强。

时间:2026-07-05 13:32
HMD发布四款诺基亚功能手机 配备AI按键与可拆卸电池

HMD发布四款诺基亚功能手机 配备AI按键与可拆卸电池

HMDGlobal推出4款诺基亚功能手机,均配1450mAh可拆卸电池及独立AI按键,支持语音控制,免费180天后付费。部分机型带摄像头,支持microSD卡扩展至32GB,具双SIM卡、3 5mm接口及蓝牙5 0。

时间:2026-07-05 13:32
云南以旧换新补贴扩围 新增智能影音与无人机

云南以旧换新补贴扩围 新增智能影音与无人机

云南省自2026年7月起扩大消费品以旧换新补贴范围,新增智能门锁、智能影音、无人机、数码相机等数码智能产品及吸油烟机、燃气灶、洗碗机、净水器等家电。按最终售价15%补贴,每类每件最高1500元,商户报名无限制。

时间:2026-07-05 13:31
小米Redmi 7英寸高性能手机传闻即将发布

小米Redmi 7英寸高性能手机传闻即将发布

最近圈内又有新动静了。据博主 @数码闲聊站 今天爆料,某家厂商的子系列下一代打算推出两款屏幕尺寸差异明显的机型:一块是 6 59 英寸的中屏 Pro,另一块则是 7 英寸的巨屏性能机。从该博主以往的爆料习惯来看,基本可以锁定是小米 REDMI 品牌的产品线布局。 有意思的是,早在今年 2 月,这位博

时间:2026-07-05 13:31
深光影像AF35mmF2.2CE全画幅镜头E/L卡口739元起售

深光影像AF35mmF2.2CE全画幅镜头E/L卡口739元起售

深光影像AF35mmF2 2CE全画幅镜头开售,提供E卡口和L卡口,标准版七百三十九元,套装版七百八十九元。全金属机身,重约一百七十五克,高三十六毫米,滤镜口径五十二毫米,光学结构五组七片,九片光圈叶片,最近对焦零点三五米,支持自动对焦。

时间:2026-07-05 13:30
热门专题
更多
刀塔传奇破解版无限钻石下载大全 刀塔传奇破解版无限钻石下载大全
洛克王国正式正版手游下载安装大全 洛克王国正式正版手游下载安装大全
思美人手游下载专区 思美人手游下载专区
好玩的阿拉德之怒游戏下载合集 好玩的阿拉德之怒游戏下载合集
不思议迷宫手游下载合集 不思议迷宫手游下载合集
百宝袋汉化组游戏最新合集 百宝袋汉化组游戏最新合集
jsk游戏合集30款游戏大全 jsk游戏合集30款游戏大全
宾果消消消原版下载大全 宾果消消消原版下载大全
  • 日榜
  • 周榜
  • 月榜