华为9月开源UCM技术:AI推理实现高吞吐低时延

8月12日最新消息,华为今日正式推出了一项AI推理领域的创新技术——UCM(推理记忆数据管理器)。这项技术将为AI推理性能带来显著提升。
作为一款以KV Cache为核心的推理加速套件,UCM创新性地整合了多种缓存加速算法工具。它采用分级管理机制,能够高效处理推理过程中产生的KV Cache记忆数据,从而显著扩展推理上下文窗口。在实际应用中,该技术可实现高吞吐、低延迟的推理体验,同时有效降低每个Token的推理成本。
目前,UCM技术已在中国银联的"客户之声"、"营销策划"和"办公助手"三大业务场景中率先开展试点应用,并成功验证了其在智慧金融领域的AI推理加速效果。
根据华为公布的计划,UCM技术将于2025年9月正式开源。届时,该技术将率先在魔擎社区发布,后续将逐步贡献给业界主流推理引擎社区。值得注意的是,华为还将把这项技术共享给所有采用Share Everything(共享架构)的存储厂商和生态合作伙伴,共同推动AI推理技术的发展。
免责声明
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
最新文章
iPhone 17最新爆料:Air版亮点十足,Pro性能强劲但设计争议
距离iPhone 17系列发布会仅剩不到一周,近期关于该系列的爆料层出不穷,但真假难辨。比如这两天刚曝光的“iPhone 17 Pro Max量产机”,其闪光灯质感与镜头设计更像是机模,却仍有不少人
空洞骑士丝之歌国区价格预测:75元引爆玩家热议
TeamCherry最新确认,空洞骑士:丝之歌的定价为19 99美元,相比2017年发售的初代作品仅上涨了5美元。目前游戏尚未开启预购,预计可能直接上线发售,因此国区具体售价也尚未公布。若仅以当前汇
马斯克首曝金色擎天柱机器人,真人般双手或威胁高薪岗位
就在刚刚,参观完特斯拉办公室的Salesforce创始人Marc Benioff,放出了全新Optimus的视频。 50秒视频中,Benioff让擎天柱带路去找可乐,接收指令后,它并没有立即行动。
AMD Zen5架构9000F系列无核显CPU即将发布
AMD首批基于Zen 5架构的9000F系列无核显处理器距离正式发布越来越近。此前,该系列处理器曾在美国零售商Shop BLT的列表中现身,但当时并未透露频率信息。如今,型号为Ryzen 7 970
三大车企利润总和不及宁德时代,新能源霸主强势崛起
车圈半年报尽数出炉,今年汽车行业最真实的现状,也就此展露无遗。 今年上半年,主流车企销量集体高歌猛进,营收也都跟着冲高,但整体利润却未见起色: 据统计,14家主流车企,上半年合计销售1102万辆
热门推荐
热门教程
更多- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程



















