首页
AI
对话云天励飞董事长陈宁:预计到2030年,每台设备都将内置AI推理芯片

对话云天励飞董事长陈宁:预计到2030年,每台设备都将内置AI推理芯片

热心网友
127
转载
2025-07-31
来源:https://www.tmtpost.com/7637113.html

AI 分为训练与推理两大环节。

训练如同“学生学习知识”,需海量数据和超强算力;推理则像“学生考试答题”,要求快速响应现实问题。随着AI应用场景的普及,推理算力需求不断提升,据IDC数据显示,2024年云端推理算力占比已达58.5%,预计2026年将升至62.2%。

如今,一家上市公司在11年间研发端侧AI芯片之后,选择发力大模型推理算力。

7月25日消息,2025年世界人工智能大会(WAIC)前夕,AI上市公司云天励飞(688343.SH)对外发布深穹Edge200芯片,以及全新深穹X6000 Mesh推理计算卡等产品。

据悉,深穹X6000 Mesh推理加速卡的算力达256Tops,主要定位于AI推理计算,支持30fps的1080p 256路的视频解码,可实现千亿参数大模型推理应用。

同时,基于深穹X6000 Mesh加速卡,云天励飞提供深目6203视频高密2U推理一体机、天舟6408大模型4U推理一体机,以及天舟680G大模型满血版8U推理一体机等产品,最高可达4PFlops(每秒执行4千万亿次浮点运算)推理算力,助力AI模型商业落地。

云天励飞董事长兼CEO陈宁对笔者表示,公司全面聚焦AI推理芯片。2025年是AI发展的重要转折点,大模型技术不断成熟,模型调用成本显著降低。同时,当前AI推理芯片市场仍处于蓝海阶段,其市场规模相较于数千亿美元的训练芯片市场尚显微小,但预计未来三至五年内,AI推理芯片的增长速度将大幅超越训练芯片。这不仅意味着AI从训练时代迈入推理时代,也预示推理算力需求将迎来爆发式增长。

陈宁称,未来五年(2030年),AI将重塑所有机器人、AI眼镜等终端硬件产品,推理算力网络将无处不在。而作为底层算力设施,AI推理芯片将贯穿端、边、云,形成无处不在算力网络,从而让各类Agent能够服务人类的工作和生活。

陈宁强调,未来云端推理算力会率先迎来爆发,并不断探索新的应用场景。一旦新场景通过云服务形成价值闭环,实现从1到100的大规模复制,同时在性价比提升、成本降低上取得突破,市场就有望向更大规模的边缘推理计算拓展。最终,必然会形成终端、边缘、云端全栈式的协同分工模式,推动AI大规模落地并具备最优的性价比。

研发11年NPU之后,这次为何要发力模型推理算力卡?

云天励飞成立于2014年,拥有大模型和AI芯片两大技术平台,打造了面向消费级、企业级、行业级三大类场景的业务。

2024年,云天励飞成功在上交所科创板上市,曾一度被称为“深圳AI第一股”。

技术方面,云天励飞自研“算力积木”架构,以及神经网络处理器核心IP和芯片,聚焦大模型高效推理,为AI的普惠应用提供算力支撑,满足多样化应用场景对AI算力的需求。

早在2020年,云天励飞全面转向国产工艺,成为首家采用国产Chiplet工艺的AI芯片公司。

2024年,云天励飞正式发布基于“算力积木”架构打造的DeepEdge10芯片平台,并推出DeepEdge10C、DeepEdge10标准版、DeepEdge10Max和DeepEdge200四款芯片,提供算力范围覆盖8T至256T,可满足从小型边缘设备到智算中心高性能计算的需求。

2025年初,云天励飞提供部署DeepSeek-R1全尺寸模型的大模型训推一体机。

经过11年发展,云天励飞已经推出五代NPU(神经网络芯片),并推出产品矩阵。

其中,DeepEdge10芯片平台已成功适配DeepSeek系列模型、QwQ-32B模型及国产鸿蒙操作系统,可为客户提供全国产的软硬一体化产品和解决方案。基于自研 AI 推理芯片,云天励飞联合生态合作伙伴推出面向云、边、端的 AI 推理产品系列,包括模组、边缘智能盒子、AI 推理加速卡、大模型推理一体机,以及智算服务器等。

组件:天星、天书、天栈、天芯;SoC:深界(芯片)、深穹(计算卡)、深擎(一体机)设备和集群:深界D、深穹R、深穹Cube其他AI产品:噜咔博士、岍丞等。

随着AI热潮兴起,云天励飞业绩持续向好。财报显示,2024年,云天励飞营业收入超9亿元,同比增长81.3%。截至2025年第一季度,公司营收2.64亿元,同比大增168.23%,创历史同期新高。

今年上半年,云天励飞公司与德元方惠签署的约4000PFLOPS的AI训练及推理异构算力服务协议(预计未来3年贡献约16亿营收)已于2025年4月完成全部验收工作并开始回款,预计上半年将贡献约2亿元营收;天府智算中心项目收益层面,公司已完成天府智算中心的交付,并于2024年第四季度确认相关收入。

消费级业务方面,2024年,云天励飞消费级场景业务通过岍丞技术的智能穿戴设备(已进入华为、荣耀、OPPO等供应链)和噜咔博士的AI硬件产品线,预计2025年上半年消费级业务将保持50%以上增速。

如今,研发11年NPU之后,云天励飞再进一步,全面发力大模型推理算力,发布针对于推理算力的AI芯片以及算力卡,布局一体机、智算中心等方案,产品将广泛应用于智算中心、智慧城市和具身智能等领域。

对于为何从边缘AI计算战略,转变为AI模型推理算力,陈宁表示,美国绝大部分90%以上的科技发明停留在实验室里面,但对于中国,AI推理芯片则是推动AI产业大规模落地的关键领域和关键技术,中国一定要把握新机遇。

他提到,未来五年,大模型、算法和推理芯片为核心的AI技术将重新定义人类所有的电子产品;未来五到十年,以推理芯片为核心的AI算力网络会无处不在。

具体来说,相比其他算力卡,云天励飞深穹X6000 Mesh加速卡有以下核心技术特点:

一、其采用自研第四代神经网络处理器(NPU),高效支持Transformer架构,主要应用于模型推理环境;二、Edge芯片采用国产工艺制造,Edge10C、Edge10、Edge10Max已通过自主可控国产化C级认证,板级方案通过100%国产化率验证;三、这是国内首颗量产的基于国产先进工艺的“算力积木”架构(D2D Chiplet和C2C Mesh)的AI芯片。所谓D2D Chiplet是指Die裸片之间的互联,而C2C Mesh互联是两个Chip芯片之间的通讯互联,从而实现片间算力扩展,满足千亿级大模型部署需求。

陈宁对笔者表示,目前基于深穹X6000 Mesh推理加速卡的推理一体机正逐步量产落地。另外,云天励飞在智算中心中也有布局。“智算中心会有四类客户:城市级参与的智算中心建设,科研院所对国产芯片需求,运营商以及互联网大厂,他们都在各地建设智算中心,这里面我们都有布局。”

陈宁强调,DeepSeek一体机的本质在于,打破各个行业最后一公里的AI应用闭环。如今热潮消退,并不一定代表一体机的“退场”,而是大家理性思考如何把一体机真正做到应用闭环。他认为,未来很长一段时间,一体机和云端推理集群将并行发展。

AI算力需求每年增超80%,云天下一代AI芯片2026年推出

2025年,随着DeepSeek等开源模型大幅降低企业使用门槛,推理算力成本不断降低,以及从智能客服到自动驾驶的AI应用快速扩展,推理算力需求也不断增长。

今年6月,AMD CEO苏姿丰(Lisa Su)表示,去年AMD预测,到2028年,全球数据中心 AI 加速芯片规模达到5000亿美元,年增长速度超过60%。而如今随着推理模型的兴起,这个数字甚至更高。

苏姿丰称,未来几年,AI 推理算力需求预计将每年增长超过80%,有望超过训练成为数据中心计算的主要驱动力。

显然,AI推理算力需求正加速增长。

陈宁也同意这一观点。他认为,AI训练是一个确定性市场,英伟达已经定义这一市场,但推理方面,云天励飞从创业之初坚定不移定义AI推理,最近两年很多企业正在从训练市场逐步转型到训推一体的市场,探索未来推理成长空间,但这一过程中,“我们认为云天励飞有些差异化竞争力”。

针对于下一代“算力积木”架构和AI推理芯片进展,云天励飞CTO李爱军透露有五个方面的重要升级:

1、采用新型计算。第五代NPU Nova500,支持原生态FP8/FP4,专用大模型算子,计算效率提升5倍,能效比提升3倍以上。2、近存计算。采用3D Memory Hybrid Bonding(内存混合键合技术),带来10倍内存带宽提升、10倍访存能效比提升。3、采用NB-Mesh新型互联。支持超节点内纵向算力扩展(scale up),支持多维Full Mesh互联,直接内存语义访问,以及数据传输all reduce(全局归约)。4、新型封装。包括采用异质多Die封装、UCIE D2D Chiplet等技术。5、NB-Link通用扩展性。支持PCIe通用接口界面,CPU/NPU大互联带宽,支持CPU/NPU直接内存访问,可以加速AI Agent智能体响应速度。

李爱军表示,第二代“算力积木”通过上述五个创新,打造新型大模型推理计算平台,满足嵌入式物联网、边缘端、云推理对边缘大模型、MoE大模型的极致推理效率、能效比、性价比需求。

据悉,基于第二代“算力积木”架构的云天励飞下一代AI推理芯片,预计将于2026年底陆续推出,包括深界、深擎、深穹三个系列将分别推出相应的产品;到2028年,云天励飞会推出第三代“算力积木”。

对于下半年业绩预期和国产芯片发展,陈宁表示,基于AI推理算法、算力和AI应用需求增长,公司相信会继续保持一个高速增长趋势。同时,云天励飞用五年的时间迎接机遇和挑战,如今已实现全面国产芯片的商用量产。

陈宁表示,作为一家国产AI芯片公司,确实是面临着巨大的挑战,主要是起步晚、生态不完善、国际复杂环境等一系列挑战,但很多机遇其实都是在挑战之下的。云天励飞一直在做基于矩阵类的并行计算芯片,团队有这样一个基因、决心和信念,可以克服各种挑战。同时,云天励飞持续拥抱国产工艺,拥有市场差异化竞争优势。

“国产芯片公司最核心的‘财富’,其实就是你的团队,只要有了这个团队,这些问题我相信都可以解决。”陈宁称。

免责声明

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

最新文章

华为Mate XTs重磅发布:三折叠+麒麟9020,17999元起享鸿蒙5.1 PC级体验

9 月 4 日消息,华为与今天下午举办的Mate XTs非凡大师及全场景新品发布会上,正式推出全球首款三折叠手机——华为Mate X

2025-09-05.
3657

OPPO Find X9标准版曝光:7.99mm超薄机身+大容量电池

9月4日消息,OPPO Find系列产品负责人周意保在微博发布了Find X9标准版的厚度卡尺图,引发了外界的高度关注。结合此前曝光

2025-09-05.
5097

亚马逊AI购物神器Lens Live上线:手机扫描实物秒找同款

9 月 3 日消息,亚马逊于周二推出了“Lens Live”,进一步加大对人工智能驱动的购物体验的投入。这是其 Amazon Lens 购物功能的全新人工智能升级版本,能让消费者通过视觉搜索发现新

2025-09-04.
9377

OpenAI将推ChatGPT家长控制功能:自动拦截高风险对话

9 月 3 日消息,OpenAI 昨天发布新闻稿,宣布将在下月为 ChatGPT 助手添加家长控制功能,可自动监测孩子的敏感性提问并让家长及时获悉相关状态。OpenAI 表示,他们正与专精进食障碍

2025-09-04.
4499

火山引擎上线即梦AI服务,正式开放企业API接口

9 月 3 日消息,火山引擎、即梦 AI 今日宣布,即梦 AI 正式上线火山引擎,面向企业开放 API 服务,涵盖图片生成、视频生成、数字人生成三大类多款即梦 AI 同源前沿模型。据了解,即梦 A

2025-09-04.
3301

热门教程

更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程

最新下载

更多
云上城之歌互通服
云上城之歌互通服 角色扮演 2025-09-05更新
查看
诸王黎明
诸王黎明 棋牌策略 2025-09-05更新
查看
苍翼混沌效应手游正
苍翼混沌效应手游正 飞行射击 2025-09-05更新
查看
三国战争vivo渠道服
三国战争vivo渠道服 棋牌策略 2025-09-05更新
查看
诸王黎明华为渠道服
诸王黎明华为渠道服 棋牌策略 2025-09-05更新
查看
三国战争百度
三国战争百度 棋牌策略 2025-09-05更新
查看
三国战争九游
三国战争九游 棋牌策略 2025-09-05更新
查看
三国战争腾讯
三国战争腾讯 棋牌策略 2025-09-05更新
查看
三国战争华为
三国战争华为 棋牌策略 2025-09-05更新
查看
道友请留步国际
道友请留步国际 角色扮演 2025-09-05更新
查看