阿里云AI计算方案降本82%:大模型GPU成本锐减!

10月21日,在首尔举行的顶级学术会议SOSP+2025(操作系统原理研讨会)上,阿里云发布了名为“Aegaeon”的计算池化解决方案。
Aegaeon方案的核心在于解决AI模型服务中普遍存在的GPU资源浪费问题,尤其针对需求突发或难以预测的大型语言模型。
它突破了传统“一个模型绑定一个GPU”的低效模式,创新性地实现了Token级别的GPU虚拟化访问技术,这意味着单个GPU能够被多个不同模型共享服务,实现精细化的资源调度。
作为推理时间调度器,阿里云Aegaeon系统在每次生成下一个token后,动态决定是否进行模型切换,从而将微小的工作片段灵活调度至共享资源池中。
通过组件复用、显存精细管理和KV缓存同步优化等全栈技术,Aegaeon将模型切换开销降低了惊人的97%,确保了token级调度的实时性,能够支持亚秒级的模型切换响应。
在阿里云模型市场为期三个多月的Beta测试中,Aegaeon系统在服务数十个参数量高达720亿的大型模型时,所需的NVIDIA H20 GPU数量从1192个大幅减少至213个,削减比例高达82%。
GPU用量的大幅削减,对硬件采购成本高昂的大型模型服务商而言,意味着运营成本将显著降低。
目前,这项核心技术已成功应用于阿里云百炼平台。
免责声明
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
忍者龙剑传4获媒体83分盛赞,革新战斗铸就系列新巅峰
由Team Ninja与白金工作室联合打造的忍者龙剑传4已于今日正式推出。随着游戏解禁,各大媒体评分陆续公布,M站综合得分为83分,IGN与GameSpot均给出8分评价。国际知名游戏媒体Games
寒武纪募资39.85亿加码AI芯片,大模型计算平台落地加速
中科寒武纪科技股份有限公司近日发布公告,宣布2025年度向特定对象发行股票已完成股份登记。本次发行股份数量为333 49万股,已于10月16日在中国证券登记结算有限责任公司上海分公司完成登记。发行价
小米汽车逆势增长:SU7热销背后的用户共建技术生态
在新能源汽车市场硝烟弥漫的当下,小米汽车正以黑马之姿打破行业格局。尽管网络舆论场中争议不断,但SU7车型上市即售罄的市场表现,以及YU7车型未发先火的预售态势,让这家跨界造车企业成为行业焦点。其 "技
真我GT8 Pro影像首测:四年打磨GR系统有何突破?
10月21日消息,真我宣布真我携手理光GR从光学、交互、算法、影调进行全链路深度定制,首发理光GR影像系统,为年轻人打造表达个性的街拍神器。这次真我GT8 Pro首发理光GR防眩光主摄,通过理光GR
《宇宙机器人》新作公开:150位PlayStation角色全集结
在最近的PlayStation发布会上,《宇宙机器人》的一款全新作品意外亮相,引发玩家关注。据消息显示,这款游戏将汇集多达150个来自PlayStation的知名角色,它们将以小巧可爱的机器人形象作
相关攻略
热门教程
更多- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程



















