墨芯C轮融资近十亿元为AI降本注入强大动能
AI算力领域的格局正在发生微妙而深刻的转变。当前,大模型的参数规模已从千亿级别向万亿级迈进,单次推理所消耗的token数量也呈现出指数级增长态势。当整个行业加速迈向商业化落地阶段,一个棘手的难题逐渐浮出水面:推理成本正成为制约AI规模化应用的核心瓶颈。谁能真正将每个token的生成成本大幅压低,谁就更有可能拿到下一轮激烈竞争的关键“入场券”。

“凭借稀疏计算的独特优势,墨芯产品的单token成本能够做到远低于主流竞品。”墨芯人工智能董秘兼企业发展及资本市场部总经理王率宇给出了直截了当的回答。
稀疏计算,这个概念究竟如何理解?
传统AI芯片通常采用“稠密计算”模式——对矩阵中的所有参数一视同仁,全部进行运算。然而,其中大量计算实际上是在处理无效或冗余的数据,属于不必要的“无用功”。稀疏计算的思路则十分清晰:通过算法预先识别并跳过这些冗余计算,只对真正有效的参数进行运算。这样一来,在同等硬件条件下,有效算力大幅提升,而能耗和成本却显著降低。简而言之,就是用更少的资源,完成更多的工作。
近日,投中网了解到,专注于为云端和终端设备提供AI算力平台的墨芯,完成了C轮近十亿元融资。深创投、大湾区共同家园、力鼎资本、蕴盛资本等机构纷纷入局,老股东凯旋创投、盛景嘉成、岩山科技等也持续加注。
“当前行业仍处于快速扩张、资本持续加码的阶段,整体市场机遇十分巨大。但推理成本,是决定一家企业能否穿越行业周期、活到下一轮竞争的那张核心生死牌。”王率宇如此形容当下的AI算力市场。
在整个国产AI芯片赛道中,墨芯走出了一条差异化明显的路径:依托自研的稀疏算法为芯片计算“做减法”。通过算法、软件与硬件的协同设计,它提供了一种真正创新的算力解决方案,核心目标就是要把每个token的生成成本优化到更高的量级。
“做减法”的人
故事要从2018年讲起。两位卡内基梅隆大学的校友在硅谷相遇,一拍即合,携手创办了墨芯人工智能。
创始人兼CEO王维,卡内基梅隆大学ECE硕士,拥有超过15年的硅谷芯片研发经验。他曾是英特尔五代到十代CPU处理器的核心架构师,先后在高通和英特尔任职,参与主导的芯片累计量产超过50亿片。
联合创始人兼首席科学家严恩勖博士,同样毕业于卡内基梅隆大学,在机器学习领域深耕十余年。他是神经网络动态稀疏算法的发明人,独创了“双稀疏算法”。这一思路是通过神经网络的“权重稀疏化+激活稀疏化”来进一步提升AI计算效率,严恩勖博士已围绕相关领域在国际顶级AI期刊发表论文40余篇。
另一位联合创始人芦勇,毕业于浙江大学电子工程专业,曾在SK Hynix和Marvell等知名半导体公司任职,主导开发了多款全球量产的SSD控制器芯片。
这三位创始人的背景形成了完美的互补:一位擅长产品架构,一位精于算法创新与系统优化,还有一位精通硬件工程和产品落地。他们一致认定:稀疏化是AI计算的未来。从那一刻起,他们开始将前沿学术层面的稀疏化理论,一步步落地、迭代为可商用的算力方案。
墨芯独创的双稀疏算法,核心逻辑是通过软件前置优化,先把模型中无效、非核心的计算元素剔除掉,再把计算任务转化为高效、精准的稀疏计算任务。
“AI模型的大量参数实际上处于归零状态,并不参与计算。稀疏化技术的核心,就是让AI模型实现真正的按需计算。”王率宇解释道。
这一思路在业界并非全新概念,但真正将“权重稀疏化+激活稀疏化”双稀疏路线做成量产产品,并且实现软硬协同方案率先商业化的,墨芯确实是第一家。目前,墨芯已累计申请全球相关专利100余项。
更有力的验证来自国际权威AI基准测试MLPerf™。墨芯的S30计算卡连续三次登顶MLPerf™推理榜首,硬核技术实力得到了国际权威机构的认可。
资本入局的节奏,往往是最诚实的投票。早在墨芯第一代芯片流片前后,深圳天使母基金、凯旋创投、将门投资、真格基金、基石资本等知名财务机构就已相继投入。但真正的转折发生在2024年——当大模型从技术竞赛转向商业落地时,资本开始密集押注那些具备落地能力的算力企业。
加速融资的背后,还是产品的突破性进展。基于稀疏化优化的AI推理方案,墨芯已在多个真实场景中验证了商业价值。经实测,搭载墨芯计算卡的AI推理业务,不仅整体推理成本大幅下降,推理速度也实现了数倍提升。
据IDC预测,到2028年,推理工作负载占比将达到73%。中国AI算力市场正在从“训练为王”转向“推理为王”的产业拐点上。在此背景下,极致降本增效的核心能力,成为墨芯在商业化落地阶段最坚实的竞争壁垒。
“护城河”与“加速度”
那么,稀疏计算这条技术路线,其他竞争对手能否快速复制或绕过?
在王率宇看来,墨芯的核心壁垒主要有三层:
第一层是专利壁垒。从硅谷创业之初,墨芯就开始了全球PCT专利布局,覆盖硬件、算法、软件各个维度。第二层是工程积累。稀疏化理论虽然是公开知识,但真正把算法落地到软硬协同的量产芯片,需要多年的系统化投入。墨芯从2021年第一代芯片流片至今,已经与互联网、行业垂类、智算中心三类标杆客户完成了长达三到四年的场景适配。第三层是生态先发。稀疏计算不是单一的芯片技术,它涵盖芯片、编译器、工具链、客户模型的整套协同体系。墨芯深耕行业多年,已与众多大客户形成了深入合作,这种时间成本和信任壁垒,并非一朝一夕能打破的。
正是这道壁垒,让墨芯的商业化落子有了独特的底气。截至目前,墨芯已在西北、西南、华东、华北四大片区实现了智算中心集群的战略性布局。西北片区部署的千卡级推理集群,已在电子制造、消费品生产等场景落地多个工厂安防项目,在边缘侧实现实时AI分析;西南片区结合当地绿电资源,构建低功耗绿色算力池;华东片区面向生信分析、医疗健康等高端服务业,与行业头部企业合作加速基因测序数据分析流程;华北片区则赋能城市治理与社区智能化升级。
要穿越周期,只靠单一市场当然不够。被问到想成为什么样的公司时,王率宇转述了创始人王维的愿景:让墨芯成为稀疏计算的引领者,依托技术创新降低AI推理成本,用稀疏计算赋能AI全民普惠。
据悉,本轮融资资金将重点投向全新一代计算卡SparsePrime®的量产与商业化,以及全国算力网络版图的进一步扩张。
“推理成本是AI普及的关键瓶颈,稀疏计算正在给出根本性的解答。从投资视角来看,评判一家AI芯片公司的价值,不应只看单卡理论算力,更要看它在真实集群环境中完成同等AI任务的有效算力和能效比。墨芯的多地部署与客户持续扩容,正是产品力和商业价值的硬核验证。”王率宇总结道。
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
DeepSeek服务器爆单算力告急 捷智算即开即用免排队
AI应用DeepSeek上线仅20天,日活跃用户突破2000万,登顶美区AppStore免费榜首位,成为全球瞩目的现象级产品。然而用户激增导致服务器算力紧张,用户排队时间极长,严重影响体验,技术团队正紧急扩容以应对挑战,当前已引发业界对算力瓶颈的广泛关注。
Vidu视频片头文字特效制作教程 标题动画生成步骤详解
想要为你的视频制作一个引人注目的动态片头,让标题文字活起来?现在,借助Vidu的强大AI能力,无需打开复杂的专业剪辑软件,你也能轻松实现。无论是模拟手写的逐字浮现效果,还是带有光效的炫酷入场动画,都能快速生成。以下介绍的几种实用方法,将帮助你找到最适合自己需求的解决方案。 利用文生视频功能,一键生成
港中深数据科学学院上海硕士宣讲会圆满落幕
在“十五五”规划(2026-2030年)的蓝图下,数据要素已被明确定义为新质生产力的核心驱动力。规划突出强调加强数据科学与工程、数字经济与管理等学科建设,目标直指培养具备交叉背景与创新能力的高层次数字人才。据测算,未来五年内,大数据核心人才缺口将高达230万——这一数字令人警醒,凸显出专业人才培养的
如何用夸克AI做社交媒体竞品账号分析与运营策略
社交媒体竞品分析,如果只靠人工一条条刷内容,很容易陷入“看热闹”的节奏——铺了多少篇笔记、点赞多少、评论区都在问什么……但真正的运营逻辑、人设一致性、内容节奏,往往藏在视觉和数据的交叠信号里。夸克AI在这方面的能力,其实可以把一套“拆解-建模-出策略”的流程走得非常结构化。下面直接讲干货,五个具体操
ClawBot AI客服训练技巧,提升回答准确率
好的,作为一位深耕AI应用落地多年的博主,我们来聊聊怎么把一个通用的AI客服,调教成真正懂你业务的“行业老手”。最近很多朋友在捣鼓ClawBot,想让它在企业微信里回答得更准、更贴切,下面这五个方向,算是经过市场验证的“驯化”路径,可以直接参考。 想让ClawBot在企业微信里给出精准回复,核心在于
- 日榜
- 周榜
- 月榜
1
2
3
4
5
6
7
8
9
10
1
2
3
4
5
6
7
8
9
10
相关攻略
2015-03-10 11:25
2015-03-10 11:05
2021-08-04 13:30
2015-03-10 11:22
2015-03-10 12:39
2022-05-16 18:57
2025-05-23 13:43
2025-05-23 14:01
热门教程
- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程
热门话题

