国产芯片转向系统协同,满足推理需求爆发新阶段

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
经过2025年的发展,大模型行业逐渐形成一个共识:推理需求将步入复合倍速增长阶段,市场需要更高性能和更优性价比的芯片来支撑发展。基于此,1月27日,汤商汤集团孵化的半导体公司曦望发布第三代推理GPU芯片启明S3,并设定了将百万token推理成本降至一分钱左右的清晰目标。
谈及为何选择此时专注于推理方向,曦望董事长徐冰指出,行业风向的转变是驱动这一决策的核心原因:应用需求正从“能训练”向“能用起来”延展;场景也变得更加多元,多模态应用迎来爆发增长,智能体(Agent)需要高频响应与实时交互,物理AI(Physical AI)的落地步伐也在不断加快;成本结构同样发生剧变,行业已开始将推理成本从“元级”压缩至“分级”。未来,人工智能将像水电一样,成为普惠性的数字基础设施。
截至目前,曦望共推出了三款芯片,分别为定位云边端视觉推理专用的S1、对标英伟达A100的训推一体芯片S2,以及此次发布的S3。对于未来在训练与推理两端的资源投入分配,徐冰在采访中对记者表示,这是公司战略定力的问题。他指出,若能先将推理做到极致,同样能够在商业层面建立牢固的优势。预计到2030年,推理芯片将占到公司资源分配的80%。
而训推一体芯片本身也存在一定的挑战,曦望联席CEO王勇将其归纳为三大困境:高昂的成本与不稳定的供应;惊人的能耗水平;以及复杂的部署运维流程。未来,合理的算力访存比将成为芯片竞争的关键指标。算力访存比是衡量芯片计算能力与内部数据传输效率匹配度的核心尺度,它直接决定了芯片实际性能的发挥程度。
过去,芯片行业竞争的核心是“堆算力”。然而,随着推理算力需求爆发,“内存墙”问题逐渐凸显,成为制约芯片性能的主要瓶颈。计算单元算力的提升速度,远快于访存带宽的升级步伐,导致许多芯片的理论算力在实际场景中难以充分释放,这一矛盾在推理芯片中尤为突出。为应对这一挑战,英伟达创始人黄仁勋提出了从单芯片优化升级转向系统级协同设计的方案,这也是其下一代Vera Rubin平台的核心设计逻辑。
王勇对此有类似观察。他对记者表示,当前以深度求索为代表的大模型公司,不仅会持续研发大模型,也会推动底层框架的演变。这将带动从模型架构、算子开发到推理系统的全链路技术创新,推动软件框架适配新的计算范式与跨硬件部署,试图摆脱对英伟达CUDA生态的深度依赖。此次曦望也发布了AI算力平台,以自研芯片为底座,与多家主流大模型进行深度适配,从软件和系统层面着手,全面提升芯片的利用效率。
燧曜智算董事长兼CEO周璟璟表示,国产芯片的定位正变得越来越清晰精准——从最初追求与国际高性能算力并驾齐驱,发展到如今在追求性能的同时,也追求极致的成本控制。国际经验表明,每当百万token的成本下降一半,市场上AI应用的数量就会出现显著增长,算力市场的繁荣度也将呈指数级提升。目前,国产算力正处于一个非常有利的战略位置。
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
领克GT概念跑车北京车展首发 百公里加速仅2秒
领克首款GT概念跑车亮相北京车展,由中欧团队联合打造。新车采用经典GT比例与低趴宽体设计,配备液态金属蓝涂装与2+2座舱,设有高性能模式按键可激活空气动力学套件。车辆采用后驱布局与AI智能运动控制系统,百公里加速约2秒,设计融合瑞典极简美学并参考全球用户反馈。
英伟达RTX 5070移动版GPU发布 12GB显存性能大幅提升
英伟达推出12GB显存版RTX5070移动GPU,与8GB版同步上市。两者均基于Blackwell架构,核心规格相同,仅显存容量不同。此举旨在缓解GDDR7芯片供应压力,为OEM提供灵活配置,加速笔记本产品布局,更大显存可更好满足游戏与AI应用需求。
微星新款雾面WOLED显示器MAG 276QRY28与276QRDY54正式发售
微星将于5月15日推出两款26 5英寸雾面WOLED显示器MAG276QRY28和276QRDY54,售价分别为2499元和6299元。均采用第四代WOLED面板,具备QHD分辨率、VESADisplayHDRTrueBlack500认证、1500尼特峰值亮度及99 5%DCI-P3色域覆盖。276QRY28刷新率为280Hz,高阶款276QRDY54支持4
中芯国际一季度净利润13.61亿元 同比增长0.4%
中芯国际2026年第一季度营收176 17亿元,同比增长8 1%;净利润13 61亿元,同比增长0 4%。公司预计第二季度收入环比增长14%至16%,毛利率指引上调至20%至22%。这反映出公司在行业复苏中展现出财务韧性,并通过运营优化增强了短期增长势头。
Google Cloud 持续优化 PostgreSQL 核心功能
谷歌云近期分享了其对PostgreSQL核心功能的贡献,重点涉及逻辑复制、升级流程与系统稳定性。更新包括逻辑复制的自动冲突检测、序列同步及订阅管理优化,提升了分布式架构可靠性。升级工具增强缩短了大型数据库升级时间,确保数据完整性。此外,修复了多项漏洞以增强系统稳健性,并预告了结构。
- 日榜
- 周榜
- 月榜
1
2
3
4
5
6
7
8
9
10
相关攻略
2015-03-10 11:25
2015-03-10 11:05
2021-08-04 13:30
2015-03-10 11:22
2015-03-10 12:39
2022-05-16 18:57
2025-05-23 13:43
2025-05-23 14:01
热门教程
- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程
热门话题

