阿里云AI计算方案降本82%:大模型GPU成本锐减!
10月21日,在首尔举行的顶级学术会议SOSP+2025(操作系统原理研讨会)上,阿里云发布了名为“Aegaeon”的计算池化解决方案。
Aegaeon方案的核心在于解决AI模型服务中普遍存在的GPU资源浪费问题,尤其针对需求突发或难以预测的大型语言模型。
它突破了传统“一个模型绑定一个GPU”的低效模式,创新性地实现了Token级别的GPU虚拟化访问技术,这意味着单个GPU能够被多个不同模型共享服务,实现精细化的资源调度。
作为推理时间调度器,阿里云Aegaeon系统在每次生成下一个token后,动态决定是否进行模型切换,从而将微小的工作片段灵活调度至共享资源池中。
通过组件复用、显存精细管理和KV缓存同步优化等全栈技术,Aegaeon将模型切换开销降低了惊人的97%,确保了token级调度的实时性,能够支持亚秒级的模型切换响应。
在阿里云模型市场为期三个多月的Beta测试中,Aegaeon系统在服务数十个参数量高达720亿的大型模型时,所需的NVIDIA H20 GPU数量从1192个大幅减少至213个,削减比例高达82%。
GPU用量的大幅削减,对硬件采购成本高昂的大型模型服务商而言,意味着运营成本将显著降低。
目前,这项核心技术已成功应用于阿里云百炼平台。

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
小米SU7 GT试驾体验 蛟龙底盘与超强制动性能实测
小米YU7GT凭借“蛟龙底盘大师版”引发关注,搭载双阀CDC减振器、闭式双腔空气悬架及eLSD电子限滑差速器,提升操控精准性。前六活塞卡钳与碳陶瓷制动盘实现32 9米百公里刹停。新车起售价38 99万元,限时下定可享8 5万元权益包,预约试驾还可获限量车模。
温州鹿城文博会展示老手艺与黑科技融合新海丝篇章
温州鹿城展区以“海丝朔门世界温州”为主题,展示传统工艺与现代科技的融合。彩石镶嵌变身时尚首饰,瓯塑结合AI图案焕新,古瓷复刻精准还原釉色。AI互动、VR体验及数字伴游系统呈现科技赋能文化出海,彰显瓯越文化守正创新的活力。
科大讯飞AI眼镜技术革新 多场景适配入选AIGC关注榜
科大讯飞AI眼镜凭借全栈自研技术及星火大模型,以仅40克的轻量设计和多模态降噪技术实现精准拾音与122种语言实时翻译。它不仅能显示译文,还可自动生成会议纪要,覆盖完整商务流程。产品已在MWC和广交会获得关注,入选2026年度AIGC产品榜单,并将于同年5月正式发布,有望推动AIGC技术实用化。
2026上海科技节开幕 智境红毯致敬科学家精神
2026年上海科技节正式启幕,主题为“科技让生活更美好”。本届活动覆盖全市16个区,通过近2000场互动体验活动,让前沿科技融入日常生活。它强调实践与体验,推动人工智能、生物技术等从概念转化为可触达的实际应用,旨在激发社会创新活力,使科技真正服务于民生。
中国登月计划启动 2030年前航天员将登陆月球并开展人体研究
神舟二十三号载人飞行任务将实施为期一年的在轨驻留试验,开展我国首个系统的太空人体研究。飞船安全性升级,乘组将完成空间站轮换与多项科学实验。探月工程方面,嫦娥七号计划下半年发射,对月球南极进行勘察。后续任务持续推进,确保2030年前实现中国人首次登月。
- 日榜
- 周榜
- 月榜
1
2
3
4
5
6
7
8
9
10
相关攻略
2015-03-10 11:25
2015-03-10 11:05
2021-08-04 13:30
2015-03-10 11:22
2015-03-10 12:39
2022-05-16 18:57
2025-05-23 13:43
2025-05-23 14:01
热门教程
- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程
热门话题

