出行平台如何用出行数据破解AI训练数据荒难题
5月18日,出行服务平台如祺出行旗下数据业务板块,首次完整对外展示了其AI数据资产的全局布局。此次披露,正式亮出了公司在通用人工智能(AGI)、具身智能以及世界模型等前沿赛道上的核心数据能力。最新信息显示,如祺数据已构建起覆盖标注数据、行为数据、合成数据及多模态训练数据集的完整体系,形成了能够适配前沿AI模型训练需求的高价值数据资源矩阵。
近年来,如祺出行的AI数据业务实现爆发式增长。数据显示,2025年,该公司以AI数据服务为核心的技术服务板块营收达1.60亿元,同比大幅增长487.4%。截至今年5月,如祺出行已在广州、上海、重庆、沈阳等多个核心城市部署超过300辆智能驾驶数据采集车。这些车辆日均产出1600小时、130TB的高质量合规数据,为AI大模型的持续迭代提供了稳定、规模化的数据供给。

如祺出行表示,依托于在真实出行场景中长期积累的海量数据,公司目前正全力支持自动驾驶及多行业AI模型训练,并为具身智能、世界模型等前沿领域提供可延展的数据支撑。
当前,AI产业正迈入空间智能新阶段,能够还原物理世界规则与场景交互的高质量数据已成为稀缺战略资源。行业分析指出,如祺出行这类平台所积累的多模态数据,涵盖驾驶员决策、道路交互、空间位置及时序变化等丰富信息,完全有潜力成为训练世界模型与具身智能体的关键数据源头。
锁定真实出行场景,坐拥具身智能训练“黄金数据矿”
当前,具身智能和世界模型的训练面临核心瓶颈:适配物理交互、真实场景推理的高质量训练数据极度匮乏。这已成为制约具身智能规模化落地与世界模型精准迭代的关键挑战。
与传统数据服务商不同,如祺出行的核心优势在于其真实的场景数据。每年数亿级的出行订单及车辆运行数据,沉淀了高频、复杂交通场景下的多模态信息,完整记录了“感知-决策-响应-反馈”的闭环过程。自2024年起,公司开始投放搭载激光雷达、高清摄像头等传感器的智能驾驶数据采集车。这些车辆在提供出行服务的同时,能够合规采集包括驾驶行为、人车互动、交通交互在内的真实场景数据,从而大幅降低了高质量数据获取的边际成本。

以自动泊车这一具体场景为例,如祺能够同步采集3D障碍物坐标、CAN总线信号、毫米波雷达回波、激光点云以及全景视频流,构建起覆盖“车辆行为、运行状态、环境感知”的多模态联合数据集。业内大模型训练专家指出,此类数据具备完整的决策、推理与反馈闭环,能有效帮助具身智能体或世界模型理解真实的空间关系、动态交互逻辑以及长尾复杂场景。其数据价值远超传统静态数据与模拟合成数据,堪称空间智能模型训练的优质“黄金数据矿”。

有消息透露,如祺出行正探索将平台积累的数据应用于车后服务机器人的训练,覆盖智能洗车、换电、维修保养等多个实用场景。
从单一数据服务到全栈能力,完成“数据集+标准化服务”进化
与国内多数传统数据服务商局限于基础数据标注环节不同,如祺出行已完成从单一标注服务商,向“高质量数据集+全栈技术能力”综合AI数据服务商的战略升级。公司已具备数据采集、清洗、智能标注、合成数据生成、多模态处理等全链路技术能力。同时,公司拥有全套AI数据服务的标准化封装能力,能为客户提供开箱即用的数据产品与服务,显著降低了真实场景数据的使用门槛与落地成本。
这套完整的能力体系,使其能同时满足智能驾驶等行业的基础数据需求,以及具身智能、通用大模型等前沿AI赛道的训练要求,从而让如祺出行积累的场景数据价值实现跨行业赋能与落地。
公司在国内布局了3大交付基地,拥有超过1500人的专业团队、超1000家BPO合作伙伴以及百万级众包资源,月均标注交付能力可达千万级别。其自研的OCC自动化标注算法,可替代90%以上的人工标注工作,交付准确率超过98%。此外,如祺自研的合成数据能覆盖多时段、多天气、多光照等复杂场景,其多模态数据集涵盖图像、文本、音频、视频全品类,可直接适配各类大模型的垂直领域微调与迭代优化。

目前,如祺的AI数据服务已成功落地于智能驾驶、具身智能、大模型、消费电子、智慧医疗等多个领域,客户包括腾讯、小马智行、理想汽车、火山引擎、百度智能云、广汽集团等知名企业。其商业模式与落地路径,已获得市场的充分验证与认可。
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
HermesAgent数据聚类算法实战:层次集成与优化指南
当你在使用 Hermes Agent 处理大规模数据时,如果发现聚类结果时好时坏、类别边界不清,或者算法难以适应数据本身的多尺度特性,问题很可能出在一个关键环节:底层的聚类算法与 Hermes 自身的数据层次结构没有对齐。这就像用一把尺子去丈量一片森林,忽略了树木、树丛和整个生态圈之间的层级关系。
身份证发票识别快速录入Excel表格方法
手动将身份证或发票信息录入Excel表格,不仅效率低下,还极易出错。幸运的是,借助智能化工具,我们可以轻松实现从图片到结构化表格的自动化处理。本文将详细介绍几种主流方法,您可以根据自身的技术条件和具体需求,选择最适合的方案。 一、利用千问表格Agent内置OCR功能快速识别 对于大多数用户来说,最便
Facebook广告视频批量制作指南 Seedance2.0独立站素材高效生产
Seedance 2 0 提供了五种高效的 Facebook 广告视频批量制作解决方案:一、分镜脚本结合豆包 AI 批量文案生成;二、全能参考模式与种子图素材复用;三、九宫格分镜接力智能生成;四、音频驱动与精准口型同步技术;五、剪映 AI 模板与成品视频智能注入。这些方法能系统化提升独立站广告素材的
自动化工作流设计实战从事件触发到任务编排详解
自动化工作流设计得好,能省下大量人力;但要是设计时考虑不周,流程跑起来就难免磕磕绊绊。最常见的问题就是:流程明明触发了,却卡在某个环节,或者干脆没按预想的路径执行下去。这背后,往往逃不开几个关键环节的疏漏。 如果你也遇到了类似情况——工作流触发后无法顺畅执行多步骤任务,别急着怀疑系统问题。不妨先顺着
微信群接龙数据自动整理工具OpenClaw一键生成表格
微信群里的接龙,方便是真方便,但整理起来,那叫一个头疼。手动复制粘贴,不仅耗时费力,还容易出错、遗漏,最后导出的表格格式五花八门,看着就心累。 有没有一种方法,能让这个过程自动化,让数据自己“跑”进表格里?答案是肯定的。借助一些工具,我们可以实现群内接龙数据的自动识别、解析和归档。下面,就来拆解一下
- 日榜
- 周榜
- 月榜
1
2
3
4
5
6
7
8
9
10
相关攻略
2015-03-10 11:25
2015-03-10 11:05
2021-08-04 13:30
2015-03-10 11:22
2015-03-10 12:39
2022-05-16 18:57
2025-05-23 13:43
2025-05-23 14:01
热门教程
- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程
热门话题

