华为昇腾助力KunLun AI Space实现DeepSeek V3.1 FP8推理,成本降低50%
10月28日消息,近期发布的DeepSeek V3.1大模型因搭载了FP8精度格式(UE8M0 FP8)引发业界广泛关注。据华为计算今日透露,河南昆仑技术有限公司(简称“昆仑技术”)基于昇腾AI的Ascend C算子编程语言,研发出一套软FP8解决方案。
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
据悉,FP8精度格式相比传统的FP16/BF16精度,能够将模型的显存需求直接减半,有效减轻服务器硬件压力;与常见的INT8量化精度相比,不仅推理精度更高,数据表示范围也更广,成功解决了“降成本”与“保效果”之间的核心矛盾。

该方案实现了“精度无损、成本减半”的双重技术突破:
通过将FP8权重模型输入昇腾硬件,利用精准的反量化算子,将其转换为BF16格式参与计算,既确保了计算过程的准确性,又为后续新FP8权重模型的快速适配预留了灵活空间,无需进行权重重度格式转换;
在模型精度几乎无损的前提下,单台KunLun G8600即可流畅运行满血版DeepSeek V3.1模型;即便在KunLun G5500V2、KunLun G5580等标卡机型上,也能实现模型参数规模翻番,同时大幅提升并发处理能力,让不同硬件配置的用户都能享受到FP8推理带来的技术红利。

昆仑技术的软FP8解决方案拥有三大核心技术亮点:自研FP8反量化算子,实现显存与内存带宽双减半;算子整图下发,推理效率提升32%;生态级兼容,支持主流模型无缝运行。
从华为计算获悉,KunLun AI Space软FP8解决方案已全面兼容DeepSeek V3.1、DeepSeek-V3 / R1、Qwen3等主流FP8量化模型。同时,该方案具备优异的扩展性,能够快速支持后续新发布的大模型。
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
北京推进智能网联新能源车险,支持L2-L4级别统一适配
3月29日,北京已在全国率先启动智能网联新能源汽车商业保险产品开发应用。新产品基本沿用现有的新能源商业车险体系,按照“总体稳定、部分优化”的原则,主要为消费者和汽车企业关心的特定智驾场景、软硬件损失
苹果今年将发布两款新iPhone应用,包含聊天机器人
预计苹果今年将发布两款新的 iPhone 应用,包括 Apple Business 应用和一款具备类似聊天机器人功能的 Siri 应用。借助 Apple Business 应用,使用全新 Apple
苹果聘请前谷歌副总裁分管AI产品营销
据 Axios 报道,苹果公司已聘请前谷歌副总裁 Lilian Rincon 担任人工智能产品营销副总裁。加入苹果之前, Rincon 曾任谷歌购物产品副总裁。在苹果, Rincon 将负责苹果所有
雷军销售心法:一句话卖出一辆车,金牌销售的秘诀
3月29日消息,谁能料到前段时间奥迪车主与雷军之间的那个打赌,竟然还有后续。这到底是咋回事?事情发生在3月25日,网友@单手开吉利 在雷军的微博评论区晒出了自己去年10月刚提的奥迪车,还当场立下一个
跨国工业巨头为何入局中国机器人市场?
近期,上百家来自全球跨国企业的CEO齐聚中国,参加中国发展高层论坛。第一财经记者了解到,不少全球高管利用此次访华之际,参观了中国先进制造企业,包括电动汽车、智能家电以及人形机器人厂商。芬兰电梯巨头通
- 日榜
- 周榜
- 月榜
相关攻略
2015-03-10 11:25
2015-03-10 11:05
2021-08-04 13:30
2015-03-10 11:22
2015-03-10 12:39
2022-05-16 18:57
2025-05-23 13:43
2025-05-23 14:01
热门教程
- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程

