当前位置: 首页
AI
AI芯片良率提升的高带宽内存左移测试策略解析

AI芯片良率提升的高带宽内存左移测试策略解析

热心网友 时间:2026-05-13
转载

随着高带宽内存(HBM)堆叠层数持续增加与硅通孔(TSV)间距不断微缩,AI计算模组的最终良率管控正面临前所未有的复杂性。行业共识指向一个明确的策略:将测试环节尽可能向制造前端迁移。然而,测试“左移”战略的背后,是必须直面的额外成本与工程挑战。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

高带宽内存左移测试策略助力AI芯片良率提升

当前,HBM已成为AI加速系统的核心内存解决方案。面对持续爆发的数据洪流,AI对内存带宽与容量的需求似乎永无止境。过去十年间,HBM芯片的堆叠层数已从最初的2层迅猛增长至12层,16层堆叠技术也已进入视野。同时,在先进AI数据中心的多芯片封装中,HBM堆叠的数量也从常见的4个增至8个。

一个关键的趋势是,HBM芯片的成本占比已攀升至整个AI芯片成本的近50%。这意味着,若在最终的系统测试阶段才发现某个内存堆叠存在缺陷,所带来的经济损失将是灾难性的。这正是“已知良好堆叠”(KGS)理念日益受到芯片制造商与系统集成商高度重视的根本原因。然而,芯片堆叠本身是一项极其精密的3D集成工艺:TSV与微凸点的对准精度要求达微米级;晶圆减薄与划片过程引入的机械应力,可能加剧潜在的裂纹、晶格滑移及划痕缺陷;而热压键合工艺则可能引发断路、短路、“枕头效应”及高阻抗连接等一系列可靠性问题。

更大的挑战在于如何有效检测这些潜在缺陷。堆叠芯片测试需要在测试覆盖率、测试时间、机械处理、热管理和供电等多个维度间取得艰难平衡。工程团队固然可以借助可测性设计(DFT)和高并行多站点测试来摊薄成本,但堆叠芯片因物理高度和功耗密度带来的热管理难题尤为棘手。随着HBM4乃至HBM5标准的演进,这些挑战只会进一步加剧。

新思科技(Synopsys)SLM产品管理总监Faisal Goriawalla指出,来自超大规模数据中心的数据分析显示,HBM故障是导致数据中心GPU故障的首要原因。研究也证实,由于其复杂的垂直堆叠结构,HBM比传统2D DRAM更易出现故障,其中与TSV相关的列故障尤为常见。从HBM3升级到HBM4,为支持多芯片互连,2048位宽的内存接口需要穿越堆叠的TSV数量显著增加,这要求外部凸点间距进一步缩小,微凸点总数将大幅上升。此外,支持高达16层的TSV堆叠,为实现更多DRAM芯片的无缺陷连接带来了全新的工程复杂性。

面对现状,出路何在?答案清晰而坚定:必须在制造流程的更早期阶段引入更多测试节点,以便在昂贵封装之前就将缺陷堆叠淘汰。目前,为生产出合格的HBM堆叠芯片,测试流程在晶圆级和堆叠芯片级设置了多个关键插入点:HBM的逻辑芯片(Base Die)和DRAM芯片均需经过严格的晶圆测试;每颗DRAM还需经历晶圆级老化、高低温测试以及冗余修复等多轮考验。随后,经过减薄、植球和划片的DRAM晶粒被堆叠到逻辑基底芯片晶圆上,并再次进行一系列测试。具体的测试节点因封装厂的工艺路线而异——可以在每层DRAM堆叠后立即测试,也可以在堆叠2层或4层后进行阶段性测试,最终完成堆叠晶圆的划片。

理论上,可以对已划片的独立HBM DRAM堆叠进行单独测试,但目前这一更具前瞻性的方案尚未投入大规模量产应用。

泰瑞达(Teradyne)内存事业部产品营销经理Hanh Lai解释道,当前行业标准仍以晶圆级堆叠测试(左侧流程)为主。该方案被认为最具成本效益且风险较低,因为它避免了对已划片的特殊堆叠结构进行探针测试的挑战,尽管在晶圆上进行芯片堆叠同样面临平整度问题。然而,业界对已划片堆叠芯片测试的兴趣正日益增长,探针设备供应商也在积极开发相应的解决方案。其核心驱动力在于,像英伟达(Nvidia)、超威半导体(AMD)这样的系统集成商极度关注最终封装良率——在典型的GPU封装中,一颗GPU周围环绕着八个HBM堆叠,任何一个HBM堆叠存在缺陷,都将导致整颗高端GPU报废,损失极为高昂。

随着单颗缺陷芯片或缺陷堆叠的成本不断攀升,推动测试左移的行业呼声也越来越高。

Aehr Test Systems销售与市场营销执行副总裁Vernon Rodgers认为,归根结底,这是成本与效益的权衡。降低报废率、提升整体良率、减少材料浪费,这些核心目标共同驱动着测试策略的演进。或许在过去,测试左移的成本过高,但如今良率成本曲线正越来越强烈地推动测试向更早阶段迁移。以晶圆级老化测试为例,它能有效筛除与早期失效相关的潜在缺陷。随着堆叠层数增加和封装尺寸增大,早期筛查的价值只会愈加凸显。

FormFactor高级产品营销总监Kevin Tran也持相同观点:随着HBM器件的复杂度和制造成本指数级增长,测试内容正持续向制造流程前端迁移。这种左移策略有助于防止缺陷芯片进入成本高昂的堆叠工序,同时也对晶圆测试阶段的高速测试能力、更大测试并行度以及更精确的热控制提出了更高要求。

晶圆测试与老化

实现“已知良好堆叠”(KGS)的基石,是确保每一颗芯片都是“已知良好芯片”(KGD)。对每颗DRAM及逻辑基底芯片进行全面的晶圆测试,必须覆盖内部电路、核心存储单元以及关键的TSV互连。

DRAM测试需要运行数千种针对其特定内存架构设计的测试图案。由于存储单元密度极高,冗余修复技术在测试过程中扮演着不可或缺的角色——缺乏它,晶圆级良率将大幅下滑。测试图案由自动测试设备(ATE)提供,为降低测试成本,DRAM芯片通常以64至128个站点的高并行度进行测试。

业界专家特别强调了逻辑基底芯片测试的极端重要性,因为它是访问上方堆叠内存芯片的唯一通道,其质量对堆叠芯片的最终良率具有决定性影响。Rodgers指出,设想一个堆叠结构——一颗逻辑基底芯片上方堆叠着8到16颗HBM DRAM芯片。确保基底逻辑芯片具备最高质量至关重要,因为一旦它存在缺陷,其上所有堆叠的DRAM芯片都将一并报废,这对整体良率的影响是巨大的乘数效应。

逻辑基底芯片的测试重点集中在支撑其可测性的DFT电路上,这些电路保障了HBM DRAM在整个堆叠过程及产品全生命周期内的可测试性。测试通过符合JEDEC规范的直接访问接口或IEEE 1500标准,利用有限数量的焊盘或微凸点来实施。在逻辑晶圆测试阶段执行充分的测试内容,可确保内部逻辑、IEEE 1500电路、直接访问总线、内存内建自测(MBiST)引擎、TSV连通性以及高速PHY电路均无缺陷。

然而,随着HBM每一代产品的迭代,晶圆探针测试的挑战也在不断升级。

Tran表示,在先进DRAM工艺节点(尤其是HBM所采用的节点)上,晶圆级测试已超越简单的接触和功能筛选,演变为涵盖机械性能、供电完整性、信号完整性和测试吞吐量等多个维度的综合挑战。应对焊盘几何尺寸持续缩小的问题,需要依赖先进的MEMS探针技术——该技术能够提供更小的间距、更优的精度控制和更长的使用寿命。HBM4和HBM5对数据传输速率与功耗提出了新要求,未来几代产品的数据速率将突破10 Gbps,每个HBM堆叠的功耗也可能高达100瓦。MEMS探针具备更高的电流承载能力,与经过优化的探针卡级供电设计相结合,能够满足KGD测试对高功率、高速度的严苛需求。

典型的DRAM制造流程包含晶圆级老化环节,通过施加电压和温度应力加速激活潜在缺陷,以便后续的标准测试能够有效将其筛除。Rodgers解释说,老化测试主要解决两个问题:第一,筛查具有潜在薄弱环节的器件,例如栅氧化层缺陷;第二,由于DRAM存储单元本质上是电容,需要对其电荷保持特性进行稳定化处理。行业内一直存在技术路线的争论——究竟应该在晶圆级、单颗芯片级还是封装级进行老化?但现在,当我们致力于芯片堆叠制造时,目标是将测试尽量前移,这正是推动晶圆级老化测试兴起的关键驱动力。

晶圆级老化测试的接触方案需要应对探针访问测试焊盘/凸点时的机械挑战,可通过MEMS技术或微弹簧针(micro-pogo pin)来实现,并适用于300mm大尺寸晶圆。

将DFT设计与铝制测试焊盘上的探针测试相结合,有助于进一步降低测试成本。JEDEC标准在规定HBM I/O微凸点布局时,预留了添加牺牲性测试焊盘的空间。Rodgers指出,当设计中使用牺牲焊盘并适当拉开间距时,探针卡的成本会大幅下降,无需花费50万美元购置一张高端探针卡,成本最高可节省80%。DFT不仅保障了测试质量,更重要的是,它为实现低成本的晶圆级老化测试提供了可能——客户可以选择成本更优的微弹簧针方案而非MEMS方案。我们可以在两个截然不同的成本区间提供技术方案,而DFT的部署水平将决定客户实际所处的成本层级。

堆叠芯片测试

对部分堆叠或完全堆叠后的芯片进行测试,能够显著降低AI产品在最终系统测试阶段的良率风险。如前所述,当前主流的制造与测试流程是在晶圆形态下将HBM DRAM堆叠至基底芯片上,然后通过测试接口从晶圆背面进行探针测试,高并行度的多站点测试已成为行业标配。但芯片堆叠工艺在热管理、供电以及机械处理方面带来了严峻挑战,而随着测试插入次数的增加,控制总体测试成本也愈发困难。对于12层堆叠芯片而言,测试插入次数因封装厂的质量标准不同,可从3次到12次不等。

Tran指出,DRAM芯片堆叠过程可能引入新的缺陷模式,包括堆叠内部高速数据传输相关的信号完整性问题、更高堆叠对更大功率和电流的需求,以及由此带来的严峻散热挑战。通过对堆叠芯片进行中间测试和分选,可以在早期剔除缺陷芯片,从而有效降低后续工序的整体测试成本。堆叠芯片测试要求探针对准精度达到个位数微米级别,而HBM5要求最高16层堆叠,这使得对准精度的要求愈发严苛,必须充分考虑TSV和键合工艺的容差。

也有行业专家强调了在封装过程中进行中间测试的极端重要性。

安靠(Amkor Technology)全球测试服务副总裁Omer Dossani表示,随着HBM成本持续攀升,封装过程中的中间测试变得越来越关键。为此,业界正在开发新型的接触机制,以实现在中间制造阶段的可靠测试。许多工程挑战在我们工厂进入大批量生产(HVM)阶段之前便已得到解决,但它们仍是重要的制造考量因素,需要在测试过程中对温度稳定性实施越来越严格的管控,并使用专用测试插座、专用清洁材料,以及在整个制造链中加强数据监控与追溯。

在测试方案的选择上,供电和热管理始终是核心考量,且随着堆叠高度增加,复杂程度呈指数级上升。Rodgers用了一个生动的比喻:如果你看一栋16层的建筑,阳光照射外墙,中心部分几乎感受不到直接热量。而堆叠芯片恰恰相反——外层芯片表面可以相对容易地散热,但中心层芯片产生的热量如何有效导出?在堆叠芯片进行老化或测试过程中,如何管理中间芯片层的温度是至关重要的工程难题。

Teradyne的Lai也指出了这一问题:核心难点在于如何管理这些高功耗器件在测试中产生的热量。探针设备公司需要为HBM堆叠提供有效的主动散热方案。目前,我们的测试机可根据器件引脚数和功率需求,支持最高128个器件的并行测试。从HBM3到HBM4,每个堆叠的功耗增幅预计超过两倍,这对探针设备和探针卡公司都提出了严峻的散热设计挑战。

在2.5D/3D集成封装之前对已划片的独立堆叠芯片进行测试,是一种颇具吸引力的深度左移测试方案,它同时支持主动热控制(相对于全晶圆测试通常采用的被动热控制),能够在测试过程中实现更精确的温度管理。然而,针对已划片堆叠芯片的测试方案涉及多项昂贵技术——专用的堆叠芯片载板、精密的上下料设备、堆叠芯片处理机以及复杂的主动热控制系统,均成本不菲,且都需要进一步开发并验证其在大规模量产(HVM)环境下的成熟度与经济效益。

目前对堆叠芯片进行测试的主流方案,是在划片前从逻辑基底芯片背面的铝制焊盘进行探针测试,这些焊盘位于微凸点布局中预留的专用“测试街区”内。因此,ATE需要同时具备强大的逻辑测试和内存测试能力,在多达128个测试站点并行测试时,其供电需求极为可观。

将DRAM堆叠至基底芯片后,可利用逻辑基底芯片内置的可编程MBiST引擎或直接访问总线对核心存储单元进行测试,并在每次测试插入时对有缺陷的TSV实施修复。

Goriawalla表示,SoC设计者必须能够部署一套灵活的BiST引擎,支持在不同应用场景(如制造测试、上电自测(POST)、系统内调试与诊断)下切换不同测试算法,以实现高覆盖率与合理测试时间之间的最佳平衡。该引擎必须高度可编程,以适应不同DRAM厂商在延迟、地址范围及测试操作时序上的差异,还可能需要支持针对HBM DRAM的封装后修复(PPR)能力,以推迟或减少现场服务的需求。BiST引擎所执行的诊断必须精确到位,能够在检测到DRAM堆叠存在缺陷时,准确报告发生故障的Bank、行地址、列地址等详细信息。

结语

尽管HBM DRAM厂商目前在市场上享有一定的技术溢价能力,但其核心关注点依然是持续降低成本。Teradyne的Lai指出,内存厂商的思维模式是,测试方案必须经过高度优化且尽可能降低成本——这一点比那些产品生命周期极短、迭代快速的消费级SoC厂商更为突出。HBM厂商在这个资本密集、竞争激烈的市场中深耕多年,历来利润空间相对有限。

尽管如此,由缺陷报废带来的巨大经济压力,正在不可逆转地推动HBM堆叠芯片制造商在流程更早阶段开展更多测试,这不可避免地增加了单颗芯片的测试成本。但这一新增成本或许能通过在基底芯片上部署灵活的MBiST来部分抵消,后者允许设计者对测试内容、覆盖率和时间进行灵活权衡。然而,以高并行度对堆叠芯片进行测试,对ATE的供电能力和散热方案提出了更高要求。此外,对已划片堆叠芯片进行测试的前沿方案仍有待量产验证,其最终的经济影响与投资回报尚存不确定性。

Q&A

Q1:为什么HBM测试需要向制造流程的更早阶段迁移?

随着HBM芯片堆叠层数不断增加(最高可达16层),单个坏芯片或坏堆叠导致的损失成本急剧攀升。HBM成本已接近AI芯片总成本的一半,如果存在缺陷的堆叠直到最终系统测试阶段才被发现,损失将极为高昂。通过在制造流程更早阶段(如晶圆级测试、晶圆级老化测试)筛查出缺陷,可以避免缺陷芯片进入昂贵的后续堆叠与封装工序,从而有效降低整体报废损失,显著提升整体良率与经济效益。

Q2:HBM堆叠芯片测试在热管理方面面临哪些挑战?

堆叠芯片的散热问题与普通2D芯片完全不同。外层芯片可以通过表面进行一定程度的散热,但中间层芯片产生的热量难以有效导出,容易形成热积聚。随着HBM从HBM3升级到HBM4,每个堆叠的功耗预计增加超过两倍,未来几代产品每个堆叠的功耗甚至可能高达100瓦。这对探针设备和探针卡公司提出了严峻的散热设计挑战,需要通过主动热控制、优化探针卡材料与结构等手段,确保测试过程中堆叠内各层芯片的温度均处于可控且均匀的范围内。

Q3:DFT(可测性设计)在降低HBM测试成本方面具体能发挥哪些作用?

DFT在降低HBM测试成本方面发挥着多重关键作用。一方面,通过在HBM I/O微凸点布局中预留牺牲测试焊盘,可将高端探针卡的采购成本降低高达80%,无需购置价格高达50万美元的复杂探针卡;另一方面,集成在逻辑基底芯片上的可编程MBiST引擎,支持在制造测试、上电自测和系统内调试等不同场景下灵活切换测试算法,从而在测试覆盖率和测试时间之间实现最优平衡。此外,良好的DFT设计还能支持更经济的测试接口方案(如微弹簧针),从多方面有效控制总体测试成本。

来源:https://ai.zhiding.cn/2026/0512/3186700.shtml

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章
更多
城大腾讯AI评分官突破背书模式实现深度思考与全面评判

城大腾讯AI评分官突破背书模式实现深度思考与全面评判

2026年,一项来自香港城市大学、腾讯混元与阿联酋MBZUAI的研究,为AI的评价能力带来了突破。这项发表于3月3日、编号为arXiv:2603 01571v1的工作,核心在于解决一个普遍痛点:如何让AI的评分系统,不再像个只会对照清单打钩的机械考官,而是更像一位懂得灵活评判、能给出深度理由的人类专

时间:2026-05-13 09:09
港科大研发AI数据筛选新方法 机器学习训练效率提升一倍

港科大研发AI数据筛选新方法 机器学习训练效率提升一倍

这项由香港科技大学(广州)、伦敦大学学院与快手科技等机构合作的前沿研究,于2026年3月3日发布在arXiv预印本平台(编号:arXiv:2603 01907v1)。研究团队创新性地提出了一种名为INSIGHT的全新训练数据选择策略,旨在显著提升大语言模型在强化学习训练中的效率与效果。 当前,训练一

时间:2026-05-13 09:09
伦敦玛丽女王大学研发音乐AI评价新标准 让机器学会品鉴音乐创作

伦敦玛丽女王大学研发音乐AI评价新标准 让机器学会品鉴音乐创作

这项由伦敦玛丽女王大学、北京大学、慕尼黑工业大学等全球顶尖科研机构联合主导的突破性研究,已于2026年3月正式发布,相关预印本论文编号为arXiv:2603 00610v1。 当我们用手机流媒体平台欣赏歌曲时,或许很少深入思考一个核心问题:人工智能如何像人类一样,精准地评判一首音乐作品的优劣?这看似

时间:2026-05-13 09:08
威斯康星大学与朴茨茅斯大学合作研发卫星图像冰雪数据智能解读技术

威斯康星大学与朴茨茅斯大学合作研发卫星图像冰雪数据智能解读技术

一项于2026年发表在《计算机视觉》期刊上的前沿研究,揭示了一个关键挑战:即便是功能强大的通用人工智能模型,在解读地球冰冻圈(如冰川、海冰)的卫星遥感图像时,也会出现显著的性能下降。这项由威斯康星大学麦迪逊分校与朴茨茅斯大学联合开展的研究,其预印本论文编号为arXiv:2603 01576v1,系统

时间:2026-05-13 09:08
中国人民大学破解AI大模型训练平衡难题 神经网络高效优化方法

中国人民大学破解AI大模型训练平衡难题 神经网络高效优化方法

这项由中国人民大学高瓴人工智能学院与字节跳动种子研究团队联合完成的重要研究成果,已于2025年2月28日正式发布在预印本平台arXiv上,论文编号为arXiv:2603 00541v1。 想象一下,你正在训练一位大力士。起初,他身材普通,训练方案很容易制定。但随着他飞速成长,身高猛增,肌肉也日益发达

时间:2026-05-13 09:07
热门专题
更多
刀塔传奇破解版无限钻石下载大全 刀塔传奇破解版无限钻石下载大全
洛克王国正式正版手游下载安装大全 洛克王国正式正版手游下载安装大全
思美人手游下载专区 思美人手游下载专区
好玩的阿拉德之怒游戏下载合集 好玩的阿拉德之怒游戏下载合集
不思议迷宫手游下载合集 不思议迷宫手游下载合集
百宝袋汉化组游戏最新合集 百宝袋汉化组游戏最新合集
jsk游戏合集30款游戏大全 jsk游戏合集30款游戏大全
宾果消消消原版下载大全 宾果消消消原版下载大全
  • 日榜
  • 周榜
  • 月榜
热门教程
更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程