基于即时编译技术的新一代深度学习框架
清华大学开源的深度学习框架Jittor,基于元算子与动态即时编译技术,融合静态图高性能与动态图灵活性,支持模型运行时自动优化,兼容PyTorch模型迁移,推理速度相比传统框架提升10%至50%。
最近,国内AI开源圈迎来了一项重磅消息:清华大学计算机系图形实验室正式开源了一款全新的深度学习框架——Jittor,中文名为“计图”。
这绝非一个普通的框架。根据官方介绍,Jittor的核心设计理念相当前沿:它采用“元算子”来表达神经网络的运算单元,并且完全基于动态即时编译(Just-in-Time)技术。简而言之,这个框架试图从底层重新思考,如何在保持灵活性的同时,还能让开发者用得顺手。
具体来看,Jittor内部有两大创新支柱:一是元算子,二是统一计算图。什么是元算子?你可以把它理解为比Numpy更高级的“乐高积木块”。它在保证编程体验像写Python一样简洁的同时,能搭建出更复杂、运算效率更高的结构。而统一计算图,则巧妙地将静态图的高性能与动态图的易调试性融为一体,力求兼得二者的优势。基于这套体系开发的模型,能够被框架实时自动优化,并流畅地运行在CPU或GPU上。
Jittor 特性
那么,这款新框架在实际使用中表现如何?设计团队重点强调了几个特点:易用性、可定制性、实现与优化分离、即时编译。用户只需寥寥几行代码,就能自定义新的算子或模型,所有代码均即时编译后执行,无需等待。
它的扩展性同样令人眼前一亮。在Jittor中,多个基础的元算子可以相互融合,组合成更复杂的复合算子,进而像搭积木一样构建出整个神经网络。这种设计让框架底层具备极高的灵活性。
对开发者而言,一个很实用的特性是它支持计算任意高阶导数。由于元算子在反向传播后依然是元算子,开发者不必为每个新算子单独编写繁琐的反向传播代码,既省时又省力,还能共享统一的优化策略。
性能优化是重头戏。通过内置的元算子编译器,用元算子编写的Python代码可以被直接动态编译成更底层、经过优化的C++代码。这套编译器兼容主流的LLVM,能够针对不同计算设备(比如不同型号的GPU)进行自动调优,生成的底层算子对硬件非常友好。
此外,Jittor统一管理GPU和CPU内存。当模型训练耗尽宝贵的GPU显存时,框架会自动调用CPU内存来弥补,这在一定程度上缓解了“显存不足”这一常见痛点。

为了兼顾开发的便捷性与运行的高效性,Jittor同时提供了同步和异步编程接口。这意味着,你可以用同步接口快速搭建原型、验证想法;而在追求极致性能时,又能切换到异步接口,把硬件潜力榨干。

生态兼容性往往是新框架成败的关键。Jittor显然考虑到了这一点。它提供了一个辅助转换脚本,能够直接将现有的PyTorch代码转换成Jittor模型。更贴心的是,在模型参数保存和数据传输协议上,Jittor直接采用了与PyTorch相同的Numpy+pickle格式。也就是说,两个框架的模型可以互相加载和调用,迁移成本大大降低。

性能超越 Pytorch
尽管是清华大学首次发布的开源机器学习框架,但Jittor一上来就瞄准了高水准。目前,ResNet、VGG、SSD、DeepLab、LSGAN等主流网络模型已在平台上实现并开源。根据官方测试数据,在达到相同模型精度的前提下,Jittor的推理速度相比同类主流框架,能有10%到50%的性能提升。这个数字,足以让业界为之侧目。
当然,这样一个大型项目的诞生离不开多方支持。Jittor背后,获得了国家自然科学基金、北京信息科学与技术国家研究中心团队项目,以及清华-腾讯联合实验室项目等资助。
开源超级玩家
话说回来,开源——尤其是人工智能领域的开源——早已成为衡量一个机构技术实力与生态影响力的硬指标。清华大学在这方面,展现出的是一种体系化的布局和深厚的传承。
首先是学术积淀。2019年,清华大学人工智能研究院在张钹院士的带领下动作频频,先后成立了听觉智能研究中心和基础理论研究中心,在基础算法、AI框架、应用与数据资源等层面打下了坚实基础。此次推出的计图(Jittor),牵头人正是清华大学计算机系的胡事民教授,而核心开发团队,正是他领导的图形学实验室的一批博士生。这不禁让人联想到当年从清华走出的贾扬清,他在伯克利读博期间创建的Caffe框架,曾是深度学习领域早期的重要基石。
这种开源基因在清华其他实验室同样显著。例如,清华大学自然语言处理实验室(THUNLP)开源的OpenNRE框架,专注于关系抽取任务,是构建知识图谱、驱动推荐系统与搜索引擎的关键技术。该实验室在GitHub上获得的影响力,已与国际顶尖的斯坦福NLP小组旗鼓相当。
这种传承也孕育了强大的学生梯队。除了广为人知的“姚班”,姚期智教授在2019年又主导创立了“智班”,专攻人工智能人才培养。从清华走出的学子也在持续创造惊喜,例如姚班毕业生、现于MIT深造的胡渊鸣,他设计实现的Taichi编程语言及其编译器,在图形计算领域备受关注。
另一方面,清华与产业界的深度合作也结出了累累开源硕果。例如,与微软研究院合作推出了Convlab端到端对话系统,与美团合作发布了视频动作分析数据集COIN。特别值得一提的是,去年清华-伯克利深圳学院引入了“精简指令集”(RISC)奠基人、图灵奖得主大卫·帕特森,共同成立了“RISC-V国际开源实验室”。这一步棋,直接布局于开源芯片生态的源头,其长远意义不言而喻。
从基础理论到核心框架,从学术研究到产业应用,再到人才培养与生态构建,清华大学在AI开源领域的这份“全景图”,已然清晰。
你是一名 AI 行业编辑,请围绕下面这条热点输出一份资讯解读:
热点:基于即时编译技术的新一代深度学习框架要求:
1. 先用一句话解释这条热点在讲什么
2. 再总结它为什么重要
3. 说明会影响哪些 AI 产品或内容方向
4. 最后给出 3 个适合资讯站使用的标题
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
相关热点GoogleMeet是面向商业与企业的视频会议服务,支持屏幕共享、实时字幕及与GoogleWorkspace集成,适用于项目讨论、网络研讨和线上教学等多种会议场景,具备扎实的安全与隐私保护。
Lanter是Chrome扩展,利用AI将YouTube视频语音转为带时间戳的文字笔记,支持一键抓取高光、自动标点排版、书签管理、全局搜索及每日邮件汇总,方便高效回顾视频关键内容。
一款AI驱动的Chrome扩展音频笔记应用,支持录音自动转文字、标签分类与全文搜索,将语音转化为可检索的数字资产,显著提升信息定位与管理效率。
专为GoogleMeet设计的AIChrome扩展,实时转录会议内容,自动生成摘要并提取行动项与决策,无缝同步至Google文档、任务及Gmail,省去手动整理时间,显著提升协作效率。
- 日榜
- 周榜
- 月榜
热点快看
