当前位置: 首页
科技数码
国产芯片转向系统协同,满足推理需求爆发新阶段

国产芯片转向系统协同,满足推理需求爆发新阶段

热心网友 时间:2026-01-27
转载


免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

经过2025年的发展,大模型行业逐渐形成一个共识:推理需求将步入复合倍速增长阶段,市场需要更高性能和更优性价比的芯片来支撑发展。基于此,1月27日,汤商汤集团孵化的半导体公司曦望发布第三代推理GPU芯片启明S3,并设定了将百万token推理成本降至一分钱左右的清晰目标。

谈及为何选择此时专注于推理方向,曦望董事长徐冰指出,行业风向的转变是驱动这一决策的核心原因:应用需求正从“能训练”向“能用起来”延展;场景也变得更加多元,多模态应用迎来爆发增长,智能体(Agent)需要高频响应与实时交互,物理AI(Physical AI)的落地步伐也在不断加快;成本结构同样发生剧变,行业已开始将推理成本从“元级”压缩至“分级”。未来,人工智能将像水电一样,成为普惠性的数字基础设施。

截至目前,曦望共推出了三款芯片,分别为定位云边端视觉推理专用的S1、对标英伟达A100的训推一体芯片S2,以及此次发布的S3。对于未来在训练与推理两端的资源投入分配,徐冰在采访中对记者表示,这是公司战略定力的问题。他指出,若能先将推理做到极致,同样能够在商业层面建立牢固的优势。预计到2030年,推理芯片将占到公司资源分配的80%。

而训推一体芯片本身也存在一定的挑战,曦望联席CEO王勇将其归纳为三大困境:高昂的成本与不稳定的供应;惊人的能耗水平;以及复杂的部署运维流程。未来,合理的算力访存比将成为芯片竞争的关键指标。算力访存比是衡量芯片计算能力与内部数据传输效率匹配度的核心尺度,它直接决定了芯片实际性能的发挥程度。

过去,芯片行业竞争的核心是“堆算力”。然而,随着推理算力需求爆发,“内存墙”问题逐渐凸显,成为制约芯片性能的主要瓶颈。计算单元算力的提升速度,远快于访存带宽的升级步伐,导致许多芯片的理论算力在实际场景中难以充分释放,这一矛盾在推理芯片中尤为突出。为应对这一挑战,英伟达创始人黄仁勋提出了从单芯片优化升级转向系统级协同设计的方案,这也是其下一代Vera Rubin平台的核心设计逻辑。

王勇对此有类似观察。他对记者表示,当前以深度求索为代表的大模型公司,不仅会持续研发大模型,也会推动底层框架的演变。这将带动从模型架构、算子开发到推理系统的全链路技术创新,推动软件框架适配新的计算范式与跨硬件部署,试图摆脱对英伟达CUDA生态的深度依赖。此次曦望也发布了AI算力平台,以自研芯片为底座,与多家主流大模型进行深度适配,从软件和系统层面着手,全面提升芯片的利用效率。

燧曜智算董事长兼CEO周璟璟表示,国产芯片的定位正变得越来越清晰精准——从最初追求与国际高性能算力并驾齐驱,发展到如今在追求性能的同时,也追求极致的成本控制。国际经验表明,每当百万token的成本下降一半,市场上AI应用的数量就会出现显著增长,算力市场的繁荣度也将呈指数级提升。目前,国产算力正处于一个非常有利的战略位置。

来源:https://www.163.com/dy/article/KKA9MPV50519DDQ2.html

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章
更多
提升产品力与稳定价格,纯电车型市场份额重获增长

提升产品力与稳定价格,纯电车型市场份额重获增长

新京报贝壳财经讯(记者王琳琳)3月28日,新京报贝壳财经记者从J D Power君迪发布的2026中国新能源汽车产品魅力指数研究获悉,在市场竞争持续加剧的背景下,新能源汽车产品正加速将竞争重心从价

时间:2026-03-28 21:04
拼多多业绩承压,豪掷千亿再造新增长曲线

拼多多业绩承压,豪掷千亿再造新增长曲线

雷达财经出品 文|丁禹 编|孟帅营收放缓、利润负增长,面临业绩挑战的拼多多,选择再造一个“自己”破局。3月25日,拼多多发布2025年第四季度及全年财报。财报显示,2025年,公司实现营收4318

时间:2026-03-28 21:04
谷歌龙虾“史密斯工”揭秘:黑客帝国降临现实始末

谷歌龙虾“史密斯工”揭秘:黑客帝国降临现实始末

过去两个月,OpenClaw火得一塌糊涂。它让AI开始像一个真正能替人跑流程、调工具、接任务的数字执行者。现如今,谷歌也准备分一杯羹,外媒爆料称,谷歌正在开发一款叫做Smith的agent,不仅比O

时间:2026-03-28 21:04
龙虾养殖为何越养越贵,成本效益如何优化?

龙虾养殖为何越养越贵,成本效益如何优化?

前阵子被捧上神坛的OpenClaw,现在已经成了人人喊打的吞金兽。很多人把问题归咎于大模型不够聪明,或者开源项目 Bug 太多。但我们体验一周后,可以明确告诉大家:都不是。核心原因就俩字:错配。龙虾

时间:2026-03-28 20:58
腾讯云龙蜥开源课堂重庆站:助力AI应用从实验室走向智尖

腾讯云龙蜥开源课堂重庆站:助力AI应用从实验室走向智尖

3月28日,腾讯最新“龙虾”智能体全国巡装“龙虾公开课·重庆站”活动,在重庆两江新区太阳座大厦举行。作为继成都站之后的又一重要站点,本次活动延续了成都站的火爆态势,吸引了来自重庆及周边地区数千名人工

时间:2026-03-28 20:58
热门专题
更多
刀塔传奇破解版无限钻石下载大全 刀塔传奇破解版无限钻石下载大全
洛克王国正式正版手游下载安装大全 洛克王国正式正版手游下载安装大全
思美人手游下载专区 思美人手游下载专区
好玩的阿拉德之怒游戏下载合集 好玩的阿拉德之怒游戏下载合集
不思议迷宫手游下载合集 不思议迷宫手游下载合集
百宝袋汉化组游戏最新合集 百宝袋汉化组游戏最新合集
jsk游戏合集30款游戏大全 jsk游戏合集30款游戏大全
宾果消消消原版下载大全 宾果消消消原版下载大全
  • 日榜
  • 周榜
  • 月榜
热门教程
更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程