当前位置: 首页
科技数码
阿里平头哥镇岳510:AI基础设施新基石

阿里平头哥镇岳510:AI基础设施新基石

热心网友 时间:2025-09-28
转载
"存储系统是大模型运行的命脉所在。"平头哥半导体产品总监周冠锋在采访中强调道。 当前全球正经历一场空前的大模型算力建设热潮,"算力为王"的呼声不绝于耳,多数人将计算能力视为最关键的竞争要素。 然而很多人忽略了,从千亿参数模型训练到实时推理应用,EB级海量数据需要稳定输送存储平台,而数据的安全性保障、高效调用都依赖于存储系统的可靠运行。没有高性能存储的支撑,再强的算力也会陷入"数据短缺"的尴尬境地。 这揭示了大模型时代基础设施建设的本质:表面上看似是"算力竞赛"的技术革命,实际上需要"存储支撑"作为根基。 根据中国信通院发布的《2025先进存储技术研究报告》显示,我国数据产量持续攀升,但存储基础设施建设相对滞后,存在明显的"数据存储缺口"。 在数据生产能力与存储容量方面,2024年数据年产量从32.85ZB增长到41.06ZB,增长率达25%,而同期存储总量仅由1.73ZB增至2.09ZB,增速为20.81%,存储能力增长速度明显跟不上数据生产步伐。 "智算中心的算力消化主要服务于大模型训练、推理和微调开发,这反映的不仅是计算能力的价值,更是算力+存储+网络传输的综合能力体现。"某智算云领军企业负责人表示,智算中心的组网方案如果存在设计缺陷,在实际运营中就会遭遇各种瓶颈。 某算力集群就曾因计算存储比设计不当,导致工作负载率仅维持在10%。经过存储性能优化后,使用率提升至20%-30%,客户数量也随之激增。 面对存储短板制约算力效率的现状,如何系统性提升存储能力?如何在算力集群中实现存储优化?平头哥镇岳510正在为这些问题提供切实可行的解决方案。 从国家政策到企业布局,AI基础设施已成为全球科技竞争的战略高地。 阿里集团CEO吴泳铭在2025云栖大会上指出,未来五年全球AI领域总投资预计超过4万亿美元,这将是人类历史上最大规模的算力与研发投入。 2025年初,阿里宣布三年内投入超3800亿元建设云计算和AI基础设施,随后吴泳铭在云栖大会上重申这一规划并承诺追加投资。实际进展显示,过去一年阿里在AI基础设施上的投入已超1000亿元,2025年资本支出预计将达到1100-1200亿元。 随着阿里云在墨西哥、日本等地扩建数据中心,以及在巴西、法国等地新增云计算节点,其全球算力网络持续扩展。但同时也面临"算力-存储-网络"协同优化的挑战。 仅关注计算芯片性能很容易遭遇"内存墙"等存储限制。在大模型训练与推理过程中,频繁读取PB级数据集、存储TB级检查点文件,以及长对话场景下的KV缓存问题,都可能让昂贵的GPU资源处于闲置状态。 针对这些问题,国内厂商纷纷寻求突破。镇岳510的出现,补齐了阿里及其合作伙伴在先进存储能力上的需求,构建了从数据生成到存储再到调用的高效闭环。 这款由平头哥研发的高性能SSD主控芯片具备4μs超低时延,比行业平均水平低30%,配合340万IOPS的随机读取能力和14GB/s的顺序读取带宽,能够为GPU提供持续稳定的数据供给。 其创新之处在于"双模式适配"设计:向上支持pSLC模式降低随机读取延迟,适配数据预处理阶段的需求;向下兼容ZNS+QLC方案,通过顺序写入节省存储空间,兼顾大容量冷数据存储的经济性。 在阿里云的大规模计算实践中,存储与计算的协同效率直接影响整个集群的性能表现。 "算力集群的处理过程实质上是数据从存储到计算的搬运过程。"周冠锋解释道,"存储系统能否以更高带宽、更低延迟提供数据,将直接影响计算资源的利用率。" 特别是在计算集群出现故障时,检查点的保存效率尤为关键:保存时间越短,训练中断风险越低,业务连续性越好,整体计算效率也就越高。 这一原理在阿里云的实际运营中得到了充分验证。此前阿里云主要使用HDD作为基础存储介质,但在大模型数据预处理和频繁检查点写入等场景中,其有限的带宽和IOPS表现堪忧。 虽然曾采用傲腾产品作为缓存层解决方案,但随着该产品停产,急需替代方案。镇岳510通过适配pSLC NAND技术,不仅超越了傲腾的性能表现,随机读取带宽提升17%,随机写入IOPS提高4%,同时还大幅降低了整体成本。 目前该方案已在阿里云OSS等场景进行测试,即将进入规模化应用阶段。 为进一步优化存储方案,平头哥与阿里云合作开发ZNS+QLC解决方案。虽然QLC NAND具备成本优势,但传统主控芯片存在写入放大问题。镇岳510通过分区管理和智能磨损均衡算法,既保持了QLC的经济性,又延长了SSD使用寿命。 这些技术创新不只服务于AI场景,在阿里云EBS等核心产品中也展现出优势。面对多租户混合负载场景,镇岳510通过硬件级QoS保障机制,实现任务隔离和动态资源分配。测试数据显示,其在混合读写场景下的99%时延表现仅为竞品的56%和84%。 技术价值最终需要通过规模化落地来实现。镇岳510借助阿里云平台优势,采用"内部验证+生态合作"的双轨模式推进商业化。 在阿里云EBS服务中,镇岳510显著提升了系统性能和并发处理能力。同时,平头哥与忆恒创源、得瑞领新等行业领先企业展开合作。忆恒创源基于该主控推出的PBlaze7 7A40系列SSD,成为首款突破4K随机写入100万IOPS的企业级产品。 面向未来,周冠锋表示:"平头哥将持续研发下一代SSD主控芯片,以应对AI算力增长带来的存储性能挑战。" (本文为原创内容,未经许可禁止转载。)
来源:https://www.leiphone.com/category/chips/Fta1H7NvfMpcgT3W.html

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章
更多
AI能从单份血样检出多种神经疾病

AI能从单份血样检出多种神经疾病

来源:科技日报科技日报讯 (记者刘霞)由瑞典隆德大学领衔的国际研究团队,研发出一款新的人工智能(AI)模型。该模型仅需一份血液样本,便能精准识别多种神经退行性疾病。团队期望,该AI模型未来能实现“一

时间:2026-04-07 14:55
褪去虚火,脑机接口方能释放长远价值

褪去虚火,脑机接口方能释放长远价值

来源:科技日报2026年开年,马斯克宣称脑机接口产品将于年内启动量产,引爆全球市场情绪。国内资本随即扎堆追捧,脑机接口相关概念股大幅走高,行业短期炒作虚火蔓延。进入3月,脑机接口迎来多重利好:脑机接

时间:2026-04-07 14:55
黎万强、洪锋退出小米科技股东名单

黎万强、洪锋退出小米科技股东名单

人民财讯4月7日电,企查查APP显示,近日,小米科技有限责任公司发生工商变更,原股东小米联合创始人黎万强、洪锋退出,同时,注册资本由18 5亿元减至约14 8亿元。 企查查信息显示,该公司成立于20

时间:2026-04-07 14:55
新闻分析|“阿耳忒弥斯2号”任务为何只绕月不登月

新闻分析|“阿耳忒弥斯2号”任务为何只绕月不登月

  新华社北京4月7日电 新闻分析|“阿耳忒弥斯2号”任务为何只绕月不登月  新华社记者张晓茹  美国东部时间6日18时40分许(北京时间7日6时40分许),执行美国“阿耳忒弥斯2号”载人绕月飞行任

时间:2026-04-07 14:55
“链接未来·智汇静安”区块链创新应用优秀场景分享(四)| 信医基于区块链与隐私计算的真实世界研究数据产品

“链接未来·智汇静安”区块链创新应用优秀场景分享(四)| 信医基于区块链与隐私计算的真实世界研究数据产品

聚焦数字技术,释放创新动能。为集中展示静安区区块链技术从“实验室”走向“应用场”的丰硕成果,挖掘一批可复制、可推广的行业解决方案,加速构建区块链产业生态闭环,静安区数据局特推出“静安区区块链创新应用

时间:2026-04-07 14:55
热门专题
更多
刀塔传奇破解版无限钻石下载大全 刀塔传奇破解版无限钻石下载大全
洛克王国正式正版手游下载安装大全 洛克王国正式正版手游下载安装大全
思美人手游下载专区 思美人手游下载专区
好玩的阿拉德之怒游戏下载合集 好玩的阿拉德之怒游戏下载合集
不思议迷宫手游下载合集 不思议迷宫手游下载合集
百宝袋汉化组游戏最新合集 百宝袋汉化组游戏最新合集
jsk游戏合集30款游戏大全 jsk游戏合集30款游戏大全
宾果消消消原版下载大全 宾果消消消原版下载大全
热门教程
更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程