NVIDIA Blackwell显卡曝虚拟化重置故障,需物理重启方可恢复

近日,有技术团队披露,NVIDIA最新发布的RTX 5090和RTX PRO 6000显卡在部分使用场景下出现了一个可重复触发的虚拟化重置问题。该问题会导致显卡完全失去响应,必须通过物理重启主机才能恢复运行。
该问题由GPU云计算服务提供商CloudRift首次公开。他们在多个部署了Blackwell架构GPU的生产系统中反复遇到这一故障,并随后发布了一份详尽的技术分析报告。为寻求有效解决方案或明确问题根源,该公司还宣布设立1000美元的奖励,征集相关线索。
根据CloudRift的系统日志记录,当GPU通过KVM与VFIO方式直通给虚拟机使用后,在虚拟机关机或GPU资源重新分配的过程中,主机系统会向GPU发送PCIe功能级重置(FLR)指令。然而,与正常情况不同的是,受影响的显卡在接收该指令后未能恢复正常运行状态,而是陷入无响应状态。
系统内核会记录类似“在FLR操作后65535毫秒仍未就绪,放弃恢复”的提示信息。此时,显卡已无法被标准工具lspci识别,并报出“未知头部类型7f”的错误代码。CloudRift指出,目前唯一能够使设备恢复正常的办法,是对整台设备进行断电重启。
另一家AI初创企业Tiny Corp也验证了这一问题的可复现性,并公开提出质疑:RTX 5090和RTX PRO 6000是否存在硬件层面的设计缺陷?该公司表示已进行多轮排查,但仍未找到可行的解决办法。
在相关技术社区中,越来越多的个人用户和早期采用者反馈遇到类似情况。有用户描述,在关闭运行中的Windows虚拟机后,主机系统随即发生卡死,即便完成操作系统级别的重启,显卡依然无法完成初始化。
用户测试发现,修改PCIe的ASPM或ACS相关设置,均无法缓解该问题。值得关注的是,截至目前尚未发现前代产品如RTX 4090存在类似故障,这表明该问题可能仅存在于NVIDIA的Blackwell系列显卡中。
免责声明
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
最新文章
拉瑞安新作将呈现更震撼的过场动画
近日,《博德之门3》的开发商拉瑞安接受了某外媒的采访。在此次访谈中,拉瑞安的动画总监Greg Lidstone透露,团队正在为《博德之门3》之后的下一款游戏打造更加精彩的过场动画,值得期待。拉瑞安向
英特尔和AMD移动CPU路线图因黑客攻击泄露
本周二,黑客组织RansomHub宣布成功攻击了笔记本公模厂商蓝天,并窃取了约200GB的内部机密信息。这批泄露资料主要包括笔记本电脑的设计文件和产品路线图等内容。根据RansomHub公布的PPT
IGN法国就《黑神话》争议言论正式致歉
IGN法国表示:“早上好,显然我们对《黑神话:悟空》最新预告片发表的一个玩笑,引发了玩家的不满。尽管这源于我们对相关神话知识的不足,但我们并非有意冒犯。因此,我们已删除了那篇引发争议的评论,并向对此
IGN法国:游戏资讯与文化深度探索
此前,IGN法国在社交媒体上对《黑神话:悟空》发表评论,称:“把你的魔法生长棒放在耳朵里是不是有点冒险?这不是棉签。”这一发言引发了玩家的强烈反响,许多人并不认同IGN法国的观点,并纷纷在评论区表达
《FF16或登Xbox展会:加入XGP引期待》
Xbox游戏展会即将于北京时间6月10日凌晨1点举行。爆料人Pirat_Nation表示,《最终幻想16》有可能在本次发布会上亮相。据悉,发布会可能会公布《最终幻想16》登陆PC平台的新消息,同时游
热门推荐
热门教程
更多- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程


















