Imagination推出多核IMG Series4 NNA助力ADAS自动驾驶
汽车智能化这趟列车,正在越开越快。尤其是ADAS(高级驾驶辅助系统)和自动驾驶这两个赛道,对AI算力的要求几乎是无止境的。想在这个领域站稳脚跟,手里没几张硬牌可不行。 最近,Imagination Technologies放了个大招——正式推出了面向ADAS和自动驾驶的新一代神经网络翻跟斗(NNA)
汽车智能化这趟列车,正在越开越快。尤其是ADAS(高级驾驶辅助系统)和自动驾驶这两个赛道,对AI算力的要求几乎是无止境的。想在这个领域站稳脚跟,手里没几张硬牌可不行。
最近,Imagination Technologies放了个大招——正式推出了面向ADAS和自动驾驶的新一代神经网络翻跟斗(NNA),也就是IMG Series4。这个系列,摆明了就是冲着“为下一代汽车应用,提供响应最快、能效最高的神经网络加速”这个目标去的。

坦白说,现在整个汽车行业都站在变革的风口上。自动驾驶汽车、RoboTaxi(自动驾驶出租车)这些全新的应用场景,对AI性能的要求已经不是“高一点”,而是“指数级”的提升。Series4正是为此而来。它采用的是全新的多核架构,可以轻松提供600 TOPS(每秒万亿次操作)甚至更高的算力,而且关键是,它在处理大型神经网络负载时,能保持超低带宽占用和极低延迟。
这款产品现在已经可以授权了,预计到2020年12月就能在市场上全面供应。对于那些正在与时间赛跑的汽车行业碘伏者、Tier 1供应商、OEM整车厂,以及汽车SoC设计厂商来说,这无疑是一颗重磅棋子。
说到底,Imagination在低功耗NNA架构上一直有自己的独到见解。Series4能在执行完整的网络推理时,同时满足严苛的功能安全要求。而且它能够一次执行多个操作,从而最大化每瓦性能,实现行业领先的能效。这才是真正意义上的“既要马儿跑,又要马儿少吃草”。
Series4的核心看点在哪里?
这次升级,可以说把几个关键痛点都给安排明白了:
- 多核扩展性与灵活性: 多核架构不再是个噱头。它支持在多个内核之间灵活分配和同步工作负载。每个集群可以配置2个、4个、6个甚至8个内核。配套的软件工具也提供了精细的控制力,可以通过批处理、拆分和调度,让灵活性真正落地。
- 超高性能: 这是实打实的数据。Series4每个单核的功耗不到1瓦,却能提供12.5 TOPS的性能。算一笔账:一个8核集群就有100 TOPS的算力;如果一个SoC里配了6个这样的8核集群,那就是600 TOPS。作为对比,在AI推理方面,这块NNA的性能比嵌入式GPU快了20倍以上,比嵌入式CPU快了整整1000倍。
- 超低延迟: 这是自动驾驶的生命线。想象一下,多个单核组成2核、4核或8核的多核集群后,它们可以并行处理同一个任务。一个8核集群,理想状态下,处理一个任务的延时可以降到单核独立运行时的八分之一。对于需要毫秒级响应的场景来说,这太关键了。
- 带宽杀手锏——Tensor Tiling技术: 这是Series4新增的一项专利技术(Imagination‘s Tensor Tiling,ITT)。它的核心思路很直接:通过tiling计算任务,充分利用芯片上的存储空间,减少对片外存储器的数据访问。说白了,就是把中间数据尽量留在“家门口”,省得来回跑。实测下来,这个技术最多能把带宽需求降低90%。尤其是在输入数据量巨大的网络上,优势非常明显。
- 车规级的安全保障: 汽车芯片,安全是第一位的。Series4在IP层面就内置了安全功能,整个设计流程也严格遵循ISO 26262标准。这意味着,它可以帮客户大大降低获得ISO 26262认证的难度。在推理过程中,即便有安全要求,也完全不影响性能。硬件安全机制会把编译后的网络、网络执行和整个数据处理管道保护得滴水不漏。
ABI Research的智慧出行和汽车首席分析师James Hodgson评论说:“虽然我们预计到2027年左右,ADAS需求会增长两倍,但行业的目光早已投向了更远的L4、L5全自动驾驶。从L2、L3演进到L4、L5,神经网络的应用是关键中的关键。未来系统要处理数以百计的复杂场景,从多个摄像头、激光雷达等传感器中提取数据,实现自动代客泊车、十字路口管理、复杂城市环境的导航……这背后,高性能、低延迟和高能效的结合,缺一不可。”
Imagination的人工智能业务高级总监Andrew Grant则显得信心十足:“我们相信Series4 NNA会成为开发ADAS和自动驾驶汽车的行业标准平台。一些先行者已经开始着手打造支持下一代ADAS和自动驾驶的芯片了。任何想在汽车领域扮演重要角色的团队,现在正是把这项技术集成到平台中的最好时机。”
关于Series4 NNA的更多技术细节和架构分析,可以观看相关的主题会议内容。

