当前位置: 首页
AI
任少卿详解Faster R-CNN:从学术突破到蔚来智驾创新实践

任少卿详解Faster R-CNN:从学术突破到蔚来智驾创新实践

热心网友 时间:2025-12-06
转载

在人工智能研究领域,神经信息处理系统大会(NeurIPS)始终被誉为全球最具影响力的顶级学术会议,其重要地位如同奥斯卡之于电影界,是引领全球AI发展的年度风向标。近日,任少卿、何恺明、罗斯·吉什克(Ross Girshick)与孙剑凭借"Faster R-CNN"(快速区域卷积神经网络架构)荣膺2025年NeurIPS时间检验奖,这一消息迅速引发了行业广泛关注。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

NeurIPS时间检验奖旨在表彰那些经受住十年时间考验、对学科发展产生深远影响的奠基性研究成果。过去三年间,该奖项得主中不乏诺贝尔奖得主杰弗里·辛顿(Geoffrey Hinton)、图灵奖得主约书亚·本吉奥(Yoshua Bengio),以及OpenAI联合创始人兼首席科学家伊利亚·苏茨克维(Ilya Sutskever)等国际顶尖学者。

"Faster R-CNN"诞生于2015年,由中国学者任少卿、何恺明、孙剑主导,联合美国人工智能科学家罗斯·吉什克共同发表。这一创新网络架构显著提升了物体检测效率,增幅超过10倍,开创了端到端实时精准目标检测的全新模式。截至目前,相关论文已被学术引用超过9.8万次,作为第一作者的任少卿,其论文不仅是华人在该会议上发表的学术引用量最高之作,更是全球AI检测领域被引次数最多的里程碑式研究。

十余年来,"Faster R-CNN"的核心思想已深度融入人工智能基础设施,成为驱动自动驾驶、医疗影像、安防监控、工业检测、卫星遥感等关键领域发展的核心力量。任少卿与合作伙伴何恺明(现任MIT副教授)、孙剑(前旷视科技首席科学家)此前还共同发表过深度残差网络框架ResNet,该论文已成为21世纪全球被引次数最高的学术文献。

任少卿在回忆与导师孙剑的合作时表示,孙剑始终秉持"简约有效"的科研理念,这一理念在日常交流和论文评审中逐渐深入人心。他坦言自己撰写的第一篇论文,曾因不够简洁而最终放弃投稿。如今看来,那篇论文更多是在他人工作基础上的简单叠加,缺乏实质性创新突破。他强调,追求"简约有效"需要远见、品味和坚持,三者缺一不可。

谈及与何恺明的长期合作,任少卿表示二人共事时间最长,工作节奏紧凑而高效。每天早晨到公司后,他们会先查看实验结果,随后展开深入交流,从上午11点到12点用餐期间持续讨论,下午2点各自投入工作,5点再次会晤并共进晚餐。何恺明对研究问题的专注态度和创新精神给他留下了深刻印象,他认为何恺明善于把握研究方向与突破点,并投入大量时间构建思维框架。

在深度学习研究方向的选择上,任少卿透露团队会先进行可行性探索,在看到潜在价值后才会持续投入。选择这一方向的考量因素包括方法创新性、已有成果进展以及成果的泛化能力。他们认为,新研究方向的上限要高,且已取得的成果需真实可靠,而非仅在特定场景下有效。

"Faster R-CNN"成功解决了物体检测任务的端到端难题。传统物体检测分为两个步骤:先在图像上寻找可能的目标候选区域,再对这些区域进行分类识别。这一过程计算量巨大,效率较为低下。而"Faster R-CNN"通过单一网络直接输出结果,实现了实时检测,频率可达10Hz、20Hz乃至30Hz,显著提升了系统效率并降低了延迟,为产业应用带来了突破性进展。

2020年8月,任少卿加入蔚来,负责组建团队并推进自研芯片项目。当时,蔚来正面临L2与L4技术路径的争议,以及是否全面自研的战略抉择。最终,公司决定全力研发L2级自研芯片产品,同时支持L3和L4技术发展。在组建专业团队的同时,蔚来还与英伟达达成战略合作,率先量产了Orin芯片,成为全球首个量产该芯片的车企,并推出了全球最复杂的ADC(自动驾驶域控制器)系统架构。

作为新一代产品,Orin芯片需要应对散热、功耗、热稳定性等诸多工程挑战。蔚来团队在短时间内攻克了这些技术难题,并重构了AI、CPU及调度相关的工具链。任少卿表示,团队在定义芯片需求时,预见到Transformer技术的兴起,并在芯片设计中预留了高带宽和热备余能力,以支持更高级别的自动驾驶功能。

在自研芯片量产进程中,蔚来还构建了完整的工具链和软件体系,其中数据闭环系统是核心组成部分。任少卿认为,数据价值在于其针对特定模型的精准筛选能力,而这一过程需要消耗大量算力。为此,蔚来建立了灵活调用云端和车端算力的分布式系统,并在此基础上构建了大规模数据训练体系。公司还借鉴互联网行业的"A/B测试"方法,建立了智能调度计算资源的平台,实现了模型的高效迭代优化。

针对主动安全领域的技术挑战,蔚来通过"A/B测试"系统实现了每三天迭代一次的更新频率,显著降低了系统误报率。同时,蔚来还建立了面向量产车智能系统的自动化分析平台,通过大模型过滤无效信息,显著提升研发效率。

在自动驾驶技术演进过程中,端到端方案成为行业热议话题。任少卿指出,端到端是技术发展的必经阶段,但并未解决所有问题。他强调,语言模型以语言理解为核心,难以处理时空认知问题,而自动驾驶作为真实世界中的智能体,需要同时具备概念认知和时空感知能力。因此,蔚来从2024年开始投入研发世界模型,旨在构建系统的时空认知能力,解决长时序决策难题。

世界模型通过学习空间和时间信息,支持长时序场景推演,使自动驾驶系统能够一体化地处理复杂道路场景。任少卿表示,蔚来在小路场景处理能力的提升,正是世界模型应用的典型案例。在狭窄路段会车时,世界模型能够综合考虑空间和时间因素,做出更合理的决策判断。

来源:https://www.itbear.com.cn/html/2025-12/1041602.html

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章
更多
逼AI当山顶洞人!Claude防话痨插件爆火,网友:受够了AI废话

逼AI当山顶洞人!Claude防话痨插件爆火,网友:受够了AI废话

新智元报道编辑:元宇【新智元导读】一个让AI像原始人一样说话的插件,在HN上一夜爆火,冲破2w星。它的核心只是一条简单粗暴的prompt:删掉冠词、客套和一切废话,号称能省下75%的输出token。

时间:2026-04-07 14:55
季度利润翻 8 倍,最赚钱的「卖铲人」财报背后,内存涨价狂潮如何收场?

季度利润翻 8 倍,最赚钱的「卖铲人」财报背后,内存涨价狂潮如何收场?

AI 时代最赚钱的公司,可能从来不是做 AI 的那个。作者|张勇毅编辑|靖宇淘金热里最稳赚的人,从来不是淘金的,是卖铲子的。这句老话在 2026 年的科技行业又应验了一次。只不过这次卖铲子的不是英伟

时间:2026-04-07 14:49
Claude Code Harness+龙虾科研团来了!金字塔分层架构+多智能体

Claude Code Harness+龙虾科研团来了!金字塔分层架构+多智能体

Claw AI Lab团队量子位 | 公众号 QbitAI你还在一个人做科研吗?科研最难的,从来不是问题本身,而是一个想法从文献到实验再到写作,只能靠自己一点点往前推。一个人方向偏了没人提醒,遇到歧

时间:2026-04-07 14:43
让离线强化学习从「局部描摹」变「全局布局」丨ICLR'26

让离线强化学习从「局部描摹」变「全局布局」丨ICLR'26

面对复杂连续任务的长程规划,现有的生成式离线强化学习方法往往会暴露短板。它们生成的轨迹经常陷入局部合理但全局偏航的窘境。它们太关注眼前的每一步,却忘了最终的目的地。针对这一痛点,厦门大学和香港科技大

时间:2026-04-07 14:37
美国犹他州启动新试点项目:AI为患者开具精神类药物处方

美国犹他州启动新试点项目:AI为患者开具精神类药物处方

IT之家 4 月 5 日消息,据外媒 PC Mag 当地时间 4 月 4 日报道,美国医疗机构 Legion Health 在犹他州获得监管批准,启动一项试点项目,允许 AI 系统为患者开具精神类药

时间:2026-04-07 14:30
热门专题
更多
刀塔传奇破解版无限钻石下载大全 刀塔传奇破解版无限钻石下载大全
洛克王国正式正版手游下载安装大全 洛克王国正式正版手游下载安装大全
思美人手游下载专区 思美人手游下载专区
好玩的阿拉德之怒游戏下载合集 好玩的阿拉德之怒游戏下载合集
不思议迷宫手游下载合集 不思议迷宫手游下载合集
百宝袋汉化组游戏最新合集 百宝袋汉化组游戏最新合集
jsk游戏合集30款游戏大全 jsk游戏合集30款游戏大全
宾果消消消原版下载大全 宾果消消消原版下载大全
热门教程
更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程