首款商用图神经网络加速IP核正式发布上市
最近国内芯片圈出了件新鲜事——中科睿芯正式发布了一款图神经网络加速芯片的IP核,代号很有意思,叫“GCU Zero”。听上去像是科幻作品里的装备,但实际上它是实打实的“首款商用图神经网络加速IP核”,而且团队表态了:这不是预备跑,是已经跑起来了,全球范围内面向商用授权。 这款IP核是在中科院计算所及
最近国内芯片圈出了件新鲜事——中科睿芯正式发布了一款图神经网络加速芯片的IP核,代号很有意思,叫“GCU Zero”。听上去像是科幻作品里的装备,但实际上它是实打实的“首款商用图神经网络加速IP核”,而且团队表态了:这不是预备跑,是已经跑起来了,全球范围内面向商用授权。

这款IP核是在中科院计算所及其中科院计算所南研院的通力协作下研发的,1月8日正式对外发布。团队强调,在目前的市场上,还没有其他可供授权的同类IP核。换句话说,这是一片全新领地,他们拔得头筹。
适合图神经网络的算力
GCU Zero专注于高效加速图神经网络的推断阶段,这其实是很多AI应用需要“真刀真枪”落地的核心环节。项目的主要研究人员之一,中科院计算所特别研究助理严明玉博士解释说,Zero的名字寄托了一个愿景:从“0号”认知智能芯片起步,缩小机器与人类智能上的差距。而G和U合起来是Graph Unit,也就是图处理单元——专门为图神经网络特殊算力量身设计的计算单元。C则代表Cognitive Intelligence,意为认知智能。
这种命名并非玩梗,背后是精心设计的结构思路。GCU Zero采用了混合架构思想,为图神经网络的两个主要执行阶段——图遍历和神经网络变换,分别设计了专门的加速引擎,并且实现流水线执行。听起来是不是像一条高效的双车道高速?两个步骤互不干扰,又能顺畅衔接,大幅提升了图神经网的执行效率。
GCU Zero Homosapiens系列
比如说,在加速图卷积神经网络时,GCU Zero提供了两种工作模式:低延迟的独立执行模式和高并发的融合执行模式。团队用“四高三低四少”总结它的优点,听起来像一份漂亮的成绩单。
具体来说,“四高”包括高可配性、高可拓展性、高并发、高能效。这图意思是:你在不同场景下可以灵活配置执行模式;如果你要处理更大规模的图神经网络,多个IP核可以互联协同;而且它能同时并行处理几十个图节点任务,效率比传统处理器高出一截。
“三低”是指在低延迟模式下,所有资源集中处理单个图节点,这样延迟、开销、能耗都压得很低。“四少”则是在高并发模式下,多个图节点的任务同时进行,两个主要阶段还能流水线运行,减少了中间数据的来回搬运和计算开支,所以计算少、访存少、功耗少,运行时间也更短。
这些参数放到实战中,效果立竿见影。在Reddit数据集和GraphSage模型下的测试中,GCU Zero IP基于64 GB/s的片外存储带宽,10毫秒内完成的图节点处理任务,是英伟达TESLA T4的两倍以上。要知道,T4可是目前推理端的常用卡。
开启图神经网络加速时代
图神经网络被业界普遍认为是推动“认知智能”落地的关键技术,它能攻克深度学习处理不了的关系推理、可解释性等难题,让机器从“感知”进阶到“理解”和“思考”。
不过,虽然国际上不少学术团队已经开始做图神经网络加速的相关研究,工业界也出现了基于图神经网络的实际应用,但图神经网络加速芯片在国际上还是一片“无人区”。2020年初,严明玉博士就在国际计算机体系结构顶会HPCA上发表了第一个图神经网络加速结构设计——HyGCN。这个名字的寓意也很直白:向图神经网络加速说“Hi”,宣告这个加速时代即将开启。
GCN作为图神经网络最重要的分支,将深度学习算法和图计算算法融合在一起,在搜索、推荐、风险控制等关键领域展现出更强的认知和处理能力。从此刻开始,硬件的适配终于跟上了算法的节奏。
完整芯片进入投片倒计时
GCU Zero IP核其实是Homosapiens系列的首个产品。严明玉博士透露,面向高性能和超高性能的图神经网络训练和推断,这个系列在今明两年还会有新产品陆续发布。“Homosapiens”取自生物学上的“智人”,寓意很明确:正是高度发展的大脑赋予了人类推理和语言能力,让智人在残酷的生存竞争中脱颖而出。团队把这份信念投射到芯片上,期望赋予机器真正的认知智能。
眼下,人工智能正从数据驱动的“感知智能”阶段,迈向数据与知识双驱动的“认知智能”阶段。机器被期待具备基于知识的逻辑推理能力,而图神经网络技术的发展和应用就是那把关键钥匙。它的效果已经在工业界落地中得到验证,接下来大家都盼着能直接用于图神经网络计算的翻跟斗件。
至于芯片的硬参数,GCU Zero IP核基于台积电12 nm制程工艺,运行频率可达1.2 GHz。严明玉进一步透露,基于GCU Zero,团队已经设计了完整的芯片,投片计划已经排上日程。今年第二季度,它将搭载在中科睿芯的“金刚”高通量计算机上正式亮相。一切都在倒计时。
你是一名 AI 行业编辑,请围绕下面这条热点输出一份资讯解读:
热点:首款商用图神经网络加速IP核正式发布上市要求:
1. 先用一句话解释这条热点在讲什么
2. 再总结它为什么重要
3. 说明会影响哪些 AI 产品或内容方向
4. 最后给出 3 个适合资讯站使用的标题
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
相关热点LucidaAI是一款面向企业的AI英语口语教练,通过实时对话提供发音、语法、词汇和流利度的个性化反馈。采用端到端加密并支持合规定制,定价策略注重普及化,旨在以低成本提升团队英语沟通能力。
Screenshot2Code工具能够从截图中自动识别代码,并将其转换为可直接运行的代码。支持Python、HTML及API接口信息提取,帮助开发者快速复用他人分享的代码片段,从而显著提升工作效率。这个工具极大简化了代码复用过程。
SpeakStruct通过可自定义模板将语音转换为结构化数据,适用于会议记录、客户通话等场景。核心功能包括自定义模板、准确转录和随处捕捉,使口语信息直接转化为可用的数据资产。
IzzyAI是一款AI驱动的语音治疗应用,提供全天候服务。通过智能治疗师头像互动,系统评估并治疗五种常见语音语言障碍,融合语音与面部识别技术给予实时反馈。内置综合评估、个性化练习、进展报告及支持性社区,提升治疗效果。
- 日榜
- 周榜
- 月榜
热点快看
