首页
科技
阿里云AI计算方案降本82%:大模型GPU成本锐减!

阿里云AI计算方案降本82%:大模型GPU成本锐减!

热心网友
转载
2025-10-21
来源:https://m.mydrivers.com/newsview/1081344.html

10月21日,在首尔举行的顶级学术会议SOSP+2025(操作系统原理研讨会)上,阿里云发布了名为“Aegaeon”的计算池化解决方案。

Aegaeon方案的核心在于解决AI模型服务中普遍存在的GPU资源浪费问题,尤其针对需求突发或难以预测的大型语言模型。

它突破了传统“一个模型绑定一个GPU”的低效模式,创新性地实现了Token级别的GPU虚拟化访问技术,这意味着单个GPU能够被多个不同模型共享服务,实现精细化的资源调度。

作为推理时间调度器,阿里云Aegaeon系统在每次生成下一个token后,动态决定是否进行模型切换,从而将微小的工作片段灵活调度至共享资源池中。

通过组件复用、显存精细管理和KV缓存同步优化等全栈技术,Aegaeon将模型切换开销降低了惊人的97%,确保了token级调度的实时性,能够支持亚秒级的模型切换响应。

在阿里云模型市场为期三个多月的Beta测试中,Aegaeon系统在服务数十个参数量高达720亿的大型模型时,所需的NVIDIA H20 GPU数量从1192个大幅减少至213个,削减比例高达82%。

GPU用量的大幅削减,对硬件采购成本高昂的大型模型服务商而言,意味着运营成本将显著降低。

目前,这项核心技术已成功应用于阿里云百炼平台。

阿里云推出全新AI计算解决方案:大模型所需GPU狂降82%!

免责声明

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章

忍者龙剑传4获媒体83分盛赞,革新战斗铸就系列新巅峰

由Team Ninja与白金工作室联合打造的忍者龙剑传4已于今日正式推出。随着游戏解禁,各大媒体评分陆续公布,M站综合得分为83分,IGN与GameSpot均给出8分评价。国际知名游戏媒体Games

2025-10-21.

寒武纪募资39.85亿加码AI芯片,大模型计算平台落地加速

中科寒武纪科技股份有限公司近日发布公告,宣布2025年度向特定对象发行股票已完成股份登记。本次发行股份数量为333 49万股,已于10月16日在中国证券登记结算有限责任公司上海分公司完成登记。发行价

2025-10-21.

小米汽车逆势增长:SU7热销背后的用户共建技术生态

在新能源汽车市场硝烟弥漫的当下,小米汽车正以黑马之姿打破行业格局。尽管网络舆论场中争议不断,但SU7车型上市即售罄的市场表现,以及YU7车型未发先火的预售态势,让这家跨界造车企业成为行业焦点。其 "技

2025-10-21.

真我GT8 Pro影像首测:四年打磨GR系统有何突破?

10月21日消息,真我宣布真我携手理光GR从光学、交互、算法、影调进行全链路深度定制,首发理光GR影像系统,为年轻人打造表达个性的街拍神器。这次真我GT8 Pro首发理光GR防眩光主摄,通过理光GR

2025-10-21.

《宇宙机器人》新作公开:150位PlayStation角色全集结

在最近的PlayStation发布会上,《宇宙机器人》的一款全新作品意外亮相,引发玩家关注。据消息显示,这款游戏将汇集多达150个来自PlayStation的知名角色,它们将以小巧可爱的机器人形象作

2025-10-21.

热门教程

更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程

最新下载

更多
机甲战争游戏
机甲战争游戏 飞行射击 2025-10-21更新
查看
口袋梦幻屋
口袋梦幻屋 休闲益智 2025-10-21更新
查看
火车驾驶之旅
火车驾驶之旅 休闲益智 2025-10-21更新
查看
逃离城市乡村生活汉化
逃离城市乡村生活汉化 动作冒险 2025-10-21更新
查看
全民枪战2
全民枪战2 飞行射击 2025-10-21更新
查看
我们仨
我们仨 角色扮演 2025-10-21更新
查看
深夜烧烤游戏
深夜烧烤游戏 角色扮演 2025-10-21更新
查看
我一点都不可口
我一点都不可口 休闲益智 2025-10-21更新
查看
拳击大师游戏
拳击大师游戏 角色扮演 2025-10-21更新
查看
皇后成长计划2游戏
皇后成长计划2游戏 角色扮演 2025-10-21更新
查看