首页
科技
中国团队研制新型芯片突破:特定任务算力超GPU千倍,攻克模拟计算世纪难题

中国团队研制新型芯片突破:特定任务算力超GPU千倍,攻克模拟计算世纪难题

热心网友
转载
2025-10-28

“作为通用‘总指挥’的CPU,凭借着成熟的技术架构和经济性,始终在计算生态中占据着核心位置。GPU则专注于加速并行计算,尤其在处理海量矩阵乘法上表现卓越。而我们研发的这款模拟计算芯片,则瞄准了AI等前沿领域中最耗能的矩阵逆运算,旨在更高效地解决此类问题,为现有算力体系提供重要的补充。”

编辑 | 云昭

在数字计算统治计算机世界半个多世纪后,一场颠覆性的技术变革正在中国悄然上演。

北京大学人工智能研究院孙仲团队,携手集成电路学院研究力量,成功研制出全球首个基于阻变存储器的高精度、可扩展模拟矩阵计算芯片。该芯片首次将模拟计算精度提升至24位定点级别,让这项曾被视作“老旧技术”的计算范式重新焕发活力。

图片图片

实测数据显示,在求解大规模MIMO信号检测等关键科学问题时,这款芯片的计算吞吐量与能效相较顶级GPU提升了百倍至千倍。相关突破性成果已于10月13日发表在国际顶级期刊《Nature Electronics》(《自然·电子学》)上。

图片图片

一项“教科书技术”的重生

论文通讯作者、北大人工智能研究院孙仲教授介绍道,

“模拟计算是早期计算机的核心技术框架,通过物理定律直接进行运算,具备高并行、低延迟、低功耗的先天优势。”

但随着数字计算在精度和可编程性方面的快速崛起,传统模拟计算因精度受限、扩展性不足而逐渐淡出历史舞台。

“如何让模拟计算兼具高精度与可扩展性,进而在现代计算任务中充分发挥其潜能,始终是困扰全球科学界的‘世纪难题’。”他进一步解释道,“数字计算虽精度可控,但存在速度瓶颈,且受冯·诺依曼架构中‘内存墙’的制约,这已成为制约人工智能、科学计算和6G通信发展的瓶颈。”

那么模拟计算究竟有何独特之处?

为了更直观地说明这个问题,孙仲打了个形象的比方:

“数字芯片在处理信息时,都需要先将数据转换成0和1的符号串。例如数字‘十’,就要编译成‘1’和‘0’的组合,记为‘1010’。”

如果用二进制书写“1+1=2”,实际上它呈现的是“1+1=10”的结果。

而模拟计算则采用了完全不同的原理。

“模拟计算无需这层‘翻译’过程,它是一种‘类比计算’,可以直接用连续的物理量来对应数学上的数值。举例来说,数学上的‘十’,可以直接用十伏或十毫伏的电压来表示。”

简单来说,数字计算通过符号来表征世界,而模拟计算则直接“让物理世界自己完成计算”。

这项技术在计算机发展的早期阶段——上世纪30至60年代曾被广泛应用。当时的科学家们巧妙地运用电压、电流、齿轮和旋钮来求解复杂方程。然而随着计算任务变得日益庞大而精密,模拟计算的“精度短板”逐渐暴露,最终被数字计算全面取代,成为教科书中尘封的篇章。

孙仲指出,此项研究的核心突破正是要攻克模拟计算“算不准”这一根本痛点。

提升五个数量级,破解“精度困境”

面对这一技术瓶颈,研究团队并未沿袭传统思路,而是选择了“融合创新”的突破路径。

他们在新型信息器件、原创电路架构和经典算法之间建立协同设计体系,首次实现了可与数字计算相媲美的高精度模拟计算系统——将传统模拟计算的精度提升了整整五个数量级。

“我们研发的新方案在保持模拟计算低复杂度优势的同时,实现了与数字FP32处理器相媲美的计算精度。”

在实验室环境中,团队成功实现了16×16矩阵的24位定点精度求逆,经过10次迭代后,相对误差可低至10⁻¹¹量级。

图片图片

“团队还创新性地提出了块矩阵模拟计算方法,如同拼图游戏般将复杂问题分解到多个芯片上协同解决,成功突破了模拟计算的规模限制,实验实现了16×16矩阵方程的求解。”

算力超越GPU,能效高出百倍

更令人震撼的是性能测试结果。

在算力表现方面尤为突出:

“当求解32×32矩阵求逆问题时,该芯片算力已超越高端GPU的单核性能;当问题规模扩大至128×128时,计算吞吐量更是达到顶级数字处理器的1000倍以上。”

换句话说——传统GPU需要运算一整天的任务,这款芯片只需一分钟就能完成。

孙仲补充说明:

“在同等精度下,该技术的能效比传统数字处理器高出100倍以上,为算力中心应对能耗瓶颈提供了关键技术支撑。”

通向“算力新范式”的钥匙

我们熟知的计算机,无论是CPU还是GPU,本质上都属于“数字芯片”范畴。它们遵循冯·诺依曼架构——将计算和存储分离,通过“0”和“1”的数字流来完成编译、运算与传输。

这种模式已经持续了半个多世纪。但随着人工智能和6G通信对算力需求的急剧膨胀,这种架构的局限性日益凸显——数据在计算单元和存储单元之间来回搬运,能耗与延迟不断攀升。

而北大孙仲团队的突破,正是要从根本上“重构”这种算力逻辑。

“这项工作的核心价值在于,它用事实证明模拟计算能够以极高效率和精度解决现代科学与工程中的核心计算难题。”

他们研发的基于阻变存储器的模拟计算芯片,跳出了“将数据转换成二进制再运算”的繁琐过程,也不再依赖“过程性存储”。

在这里,计算与存储融为一体——电流流过的那一瞬间,就是运算本身。这意味着算力得到彻底释放:在6G通信中,它能让基站在低功耗下实时处理海量天线信号,提升网络容量与能效;在人工智能领域,有望加速大模型训练中的二阶优化算法,显著提高训练效率;而在边缘计算设备中,它的低功耗特性意味着AI训推一体化将更易落地。

“更重要的是,低功耗特性也将为复杂信号处理和AI训推在终端设备上的直接运行提供强力支持,从而大幅降低对云端的依赖,进而推动边缘计算迈向新阶段。”

从实验室到产业化:算力革命的起点

据悉,孙仲团队已启动产业化进程,计划将这一突破性技术从实验室推向市场。

“这项突破的意义远不止于一篇顶刊论文,其应用前景覆盖多元计算场景,有望重塑算力格局。”

“可以说,我们为算力提升探索出了一条极具潜力的路径,有望打破数字计算的长期垄断,开启一个算力无处不在且绿色高效的新时代。”

谈及与现有计算架构的关系,孙仲强调未来将是互补共存,而非替代:

“作为通用‘总指挥’的CPU,因其成熟性与经济性而难以被淘汰。GPU专注于加速矩阵乘法计算。我们的模拟计算芯片,则致力于更高效地处理AI等领域最耗能的矩阵逆运算,这是对现有算力体系的有力补充。”

参考链接:

https://www.zhihu.com/question/1964688206738978150

来源:https://server.51cto.com/article/828182.html

免责声明

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章

神舟二十一蓄势待发:雷达成像领衔,护航飞天精准测控

近日,神舟二十一号载人飞船发射任务进入关键阶段。本月24日,船箭组合体已顺利转运至发射区,计划于近期择机实施发射。为确保任务万无一失,27日发射场区组织开展了全系统合练,各单位协同配合,模拟发射全流

2025-10-28.

杨龚轶凡迪拜AIM峰会详解中昊芯英AI芯片实践与商业化路径

全球顶级投资与经济盛会AIM SUMMIT近日在迪拜拉开帷幕。作为聚焦全球资本格局与新兴经济增长模式的行业盛会,本届大会以“全球市场、未来经济与新生代”为核心议题,吸引了来自181个国家和地区的15

2025-10-28.

植入人工耳蜗到脑机接口:前沿医疗科技的创新突破

在医疗科技领域持续深耕的美好医疗(301363),近期通过投资者关系活动记录释放了重要战略信号:公司正依托人工耳蜗核心技术优势,加速向脑机接口(BCI)领域拓展,并已形成覆盖侵入式、半侵入式及非侵入

2025-10-28.

“蓝月亮”不蓝?历法巧合如何造就19年一见的天象趣闻

当 "蓝月亮 "三个字跃入耳中,总让人联想到夜空中漂浮着一块幽蓝的宝石。但这个充满诗意的名字背后,却藏着一段跨越语言与历法的奇妙故事。最新研究显示,这个天文名词的诞生既非源于视觉奇观,也非出自浪漫想象,

2025-10-28.

荣耀Magic8系列评测:旗舰手机体验的重新定义

2025年的高端手机市场竞争格局已悄然生变,消费者的目光不再局限于性能与影像,更聚焦于谁能在AI智能体验上实现真正的突破。在此背景下,荣耀Magic8系列应势而生,它不仅在硬件层面持续精进,更以开创

2025-10-28.

热门教程

更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程

最新下载

更多
不休骑士2手游
不休骑士2手游 角色扮演 2025-10-28更新
查看
镜花奇缘手游
镜花奇缘手游 角色扮演 2025-10-28更新
查看
妖鸡三国手游
妖鸡三国手游 棋牌策略 2025-10-28更新
查看
忘仙2
忘仙2 角色扮演 2025-10-28更新
查看
极无双
极无双 角色扮演 2025-10-28更新
查看
奇妙碰碰车
奇妙碰碰车 休闲益智 2025-10-28更新
查看
暗黑高校
暗黑高校 动作冒险 2025-10-28更新
查看
决战平安京oppo
决战平安京oppo 角色扮演 2025-10-28更新
查看
战地模拟器2
战地模拟器2 飞行射击 2025-10-28更新
查看
蘑菇战争2
蘑菇战争2 棋牌策略 2025-10-28更新
查看