思必驰即将上市AI语音行业护城河已消失
思必驰递交科创板IPO申请,成立近二十年营收增长缓慢,车载业务为基本盘但毛利率高却持续亏损。大模型将语音能力变为基础服务,传统语音公司面临价值被替代的危机。
5月25日,思必驰正式向科创板递交了IPO申请。

作为国内最早一批AI公司,思必驰已经跑了近二十年。但从业绩上看,这家老牌AI公司的增长节奏并不算快。2023年到2025年,营收分别是5.39亿、6.01亿和6.88亿,两年复合增长率只有12.98%。
某种程度上,思必驰正处在一个有些尴尬的时间节点上。
过去十几年,语音技术一直是人工智能领域里最典型的技术壁垒型赛道。Cerence、SoundHound、思必驰这些公司,都吃到了这一轮产业红利。
但大模型出来后,行业底层逻辑正在被改写。OpenAI、谷歌、阿里、字节等巨头,正在把语音能力变成一种基础能力。
于是,一个核心问题摆在了所有传统语音公司面前:当语音成为大模型的标配之后,它们还剩下什么价值?
今天咱们就来聊聊思必驰,以及传统语音AI公司的未来。
毛利率虽高,但仍然很难赚钱
从收入结构来看,思必驰主要有三大块业务:车载业务、智慧办公和智慧物联。
其中,车载业务是基本盘。2025年,这块收入达到了2.76亿元,占整个营收的40.08%。
所谓车载业务,本质上是为汽车厂商提供语音交互解决方案。目前思必驰已经进入了比亚迪、奔驰、大众等多家车企的供应链,车载语音装机量的市占率达到22%。
第二块是智慧办公,包括语音转写、会议记录、自由对话这类软件服务,还有智能吸顶麦、AI办公本等硬件产品。2023到2025年,这块收入从1.8亿元增长到了2.43亿元,是近几年增长最快的板块之一。
相比之下,智慧物联业务则在收索。三年间收入从1.97亿元下降到了1.69亿元,占总营收的比例也从36.63%滑到了24.51%。
从盈利能力看,思必驰的毛利率并不低。
随着软件收入占比提升,公司毛利率从2023年的53.69%升到了2025年的63.24%。
但高毛利并没有转化为利润。
过去三年,公司分别亏损了1.36亿、1.58亿和0.8亿。同期,期间费用率高达76.3%、79.5%和68.7%。
这背后,其实是国内软件服务行业长期面临的商业化困境。
思必驰的大部分业务仍然带有较强的项目制属性。无论是车载语音、智慧办公还是物联网方案,每新增一个客户,往往都要额外投入研发、适配、测试、部署和维护成本。
尤其是在车载场景,不同车企、不同车型甚至不同操作系统之间都有明显差异,很难像标准化软件那样实现大规模复制。
但这还不是思必驰最大的问题。真正的问题在于,当通用模型的多模态能力足够强时,语音供应商的价值又在哪里?
大模型,正在吃掉AI语音公司
从去年开始,美股软件股经历了一轮暴跌。
其中,受到冲击最大的板块之一,就是传统语音服务商。
2025年以来,SoundHound AI从年内高点22.17美元一路回落到了约8.56美元,跌幅61.39%;Cerence从27.5美元跌到11.87美元,跌幅约56.84%;声网从6.99美元跌到4.25美元,跌幅接近39.20%。
股价下跌背后,一个越来越清晰的共识正在形成:语音技术本身,正在失去独立价值。
过去二十年,语音行业一直建立在一条相对清晰的产业链上。
传统语音AI的标准链路是典型的模块化流水线:ASR(语音转文字)、NLU(意图识别)、Dialog Manager(对话管理)、TTS(语音合成),再加上不同场景的需求。
过去很多语音AI公司有价值,是因为每一层都不容易。比如识别口音、抗噪声、低延迟、唤醒词、车内声场、电话线路压缩音质、多人打断、语音合成自然度,这些都需要长期的工程积累。
思必驰、云知声、SoundHound、Cerence,都是这个时代的受益者。
但大模型出现之后,这套逻辑开始变了。一方面,模型智能的提升带来了更强的多模态能力;另一方面,大模型也把这些原本分散的模块重新整合成了一个统一的系统。
从目前来看,大模型的语音能力正在快速追赶甚至超越传统语音厂商。
过去,语音行业最核心的指标是WER(词错误率),也就是每100个词里识别错多少个词。WER越低,识别准确率越高。
传统语音系统在理想环境下通常能把WER控制在5%以内,但一旦进入车载噪音、电话线路、多人对话这些复杂场景,错误率往往会明显上升。
举个例子,2025年思必驰方案在新闻播报这类干净场景下,WER大约是4.8%;而在车载噪音环境下,则上升到了12.3%。
相比之下,OpenAI开源的Whisper Large-v3不仅在标准测试集上实现了更低的错误率,在会议、电话、多人讨论等真实场景中,也表现出了更强的稳定性。
背后的原因并不复杂。
传统语音公司长期依赖高质量标注数据。这类数据虽然精准,但获取成本高、规模有限,很多企业积累十几年的行业语料,总规模也不过几千到几万小时。
而大模型可以利用公开视频、播客、电话录音、会议记录、字幕数据以及用户反馈进行训练。以Whisper为例,它的训练数据规模达到了约68万小时,远远超过传统语音系统。
更大的数据规模,不仅让模型接触到了更多真实世界的复杂场景,也让其具备了更强的上下文理解能力。
过去的语音系统更像是识别关键词,而大模型能够结合前后语境,理解用户真正想表达的内容。即便出现停顿、口误或表达不完整,也能通过上下文完成纠错和补全。
换句话说,传统语音模型是在实验室里成长起来的,而大模型是在真实世界里成长起来的。
这种变化正在快速传导到产业层面,也带来了一个关键问题:如果OpenAI、Google、Amazon、字节跳动和阿里都能提供低延迟、高准确率的语音交互能力,那么客户自然会问:为什么还需要单独采购一家语音供应商?
某种程度上说,语音能力本身就越来越像一种基础设施,而不是独立产品。
这样的趋势已经开始显现。
2023年,OpenAI与梅赛德斯-奔驰达成合作,把ChatGPT接入其MBUX车载语音系统。谷歌也已经开始用Gemini全面替代原有的Google助手,并逐步将其内置到Android手机、Google TV、智能手表等终端中。
国内同样如此。豆包进入了特斯拉中国区车载系统,通义千问则逐步接管天猫精灵背后的语音能力,并向智能家居终端延伸。
这些变化也给思必驰带来了一个更严峻的问题:当语音逐渐从独立产品变成基础能力,传统语音AI公司还剩下什么价值?
你是一名 AI 行业编辑,请围绕下面这条热点输出一份资讯解读:
热点:思必驰即将上市AI语音行业护城河已消失要求:
1. 先用一句话解释这条热点在讲什么
2. 再总结它为什么重要
3. 说明会影响哪些 AI 产品或内容方向
4. 最后给出 3 个适合资讯站使用的标题
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
相关热点5月29日,世纪天鸿跌了3 44%,成交额8315 52万元,换手率2 50%,总市值33 94亿元。单看这组数字,市场情绪确实有点低迷。 异动分析 世纪天鸿身上贴着好几个热门的标签:AI语料、ChatGPT概念、AIGC概念、文化传媒概念、在线教育。但这些概念到底能不能撑起股价?得拆开看。 1
广州市政府最新发布的“十五五”规划纲要,将人工智能产业提升至战略核心位置,明确提出“跻身全国第一方阵”的宏伟目标。这绝非空洞口号,整份文件详细布局了从技术研发到场景落地、从终端产品到生态构建的系统性方案。 “人工智能+”行动被列为重中之重,要求与经济社会各领域实现深度融合。简言之,广州旨在成为国家A
搜极星是中立第三方AI品牌洞察服务平台,专注监测与分析而非优化。提供星盾验真(个人免费识别AI幻觉与投毒)及企业GEO监测(20余项指标)。数据同步准确率99 9%,覆盖12个以上主流大模型,助力用户验证AI内容真实性或评估品牌AI影响力。
私募巨头阿波罗全球管理与黑石集团正联手推进一项重磅计划——为AI企业Anthropic筹集约360亿美元的债务资金,专门用于采购谷歌定制的TPU芯片。简而言之,这笔资金并不会直接注入Anthropic,而是先购入芯片,再通过租赁方式提供给Anthropic使用。而为谷歌代工TPU的博通公司,则为此交
- 日榜
- 周榜
- 月榜
热点快看
