NVIDIA Blackwell架构显卡曝虚拟化重置问题,断电重启成唯一解


近日,有技术团队在使用NVIDIA最新发布的RTX 5090和RTX PRO 6000显卡时,发现了一个可重复触发的虚拟化重置问题。该问题会导致显卡完全失去响应,必须通过主机断电重启才能恢复。
该问题由一家提供GPU云服务的公司首次披露。该公司在多个部署了Blackwell架构GPU的生产系统中均遇到该问题,并在深入分析后发布了详细的技术报告。为推动问题解决,该公司还设立1000美元奖金,公开征集能够定位问题根源或提出有效解决方案的技术方案。
根据披露的日志信息,该问题出现在GPU通过虚拟化技术被分配给虚拟机使用之后。当虚拟机关闭或GPU资源被重新分配时,主机系统会尝试对GPU执行PCIe功能级重置(FLR)。然而,在出现问题的设备上,重置后GPU并未恢复到正常状态,而是进入无响应状态。系统内核会记录类似信息:“经过65535毫秒,FLR仍未完成,操作中止。”
此时,显卡已无法被系统识别。使用lspci命令时,会报告“未知头部类型7f”的错误信息。唯一可行的恢复方法是将整台设备断电并重新启动。
这一问题随后被一家人工智能初创公司验证复现。该公司在技术社区中提出疑问:“RTX 5090和RTX PRO 6000是否存在某种硬件层面的设计缺陷?”他们表示,尽管进行了深入排查,但仍未能找到可行的解决方案。
随着问题的公开,越来越多的个人用户和技术爱好者也加入了讨论。部分RTX 5090的早期使用者报告了类似现象。有人描述,在关闭运行Windows系统的虚拟机后,主机系统出现完全卡死的情况。即使尝试操作系统级别的重启,也无法重新初始化GPU设备。
进一步测试表明,调整PCIe的ASPM或ACS相关设置并不能缓解此问题。此外,目前尚未发现上一代显卡(如RTX 4090)存在类似状况,这表明该问题可能仅限于NVIDIA Blackwell架构的GPU产品。
免责声明
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
最新文章
2025数字电商赋能实体经济大会在京举办
九月五日,“石聚合力·联动未来——2025数字电商赋能实体经济高质量发展大会暨资本创新高峰论坛”在北京隆重举行。第十二届全国政协副主席刘晓峰出席并宣布大会开幕,商务部原副部长张志刚、工业与信息化部政
华为推出首款小型平板Matepad Mini,起售价3299元
华为正式推出旗下首款小型平板设备——华为Matepad Mini,起售价为3299元。这款新品是华为首款配备8 8英寸屏幕的平板产品,定位介于传统智能手机与大屏平板之间。相比手机,它能展示更丰富的内
九号公司智能两轮电动车累计出货突破900万台,年销700万台目标在路上
九号公司于今日宣布,其旗下智能两轮电动车在中国市场的累计出货量已突破900万台,再次创下行业新的增长纪录。据了解,从700万台到800万台的跨越,九号公司用时64天;而从800万台增长至900万台,
AMD ROCm文档曝光RDNA 4架构Radeon RX 9060 XL显卡信息
近日,在AMD的ROCm文档中出现了一款此前未见提及的RDNA 4架构GPU——Radeon RX 9060 XL,但目前尚无法确认这款显卡是否真实存在,还是仅仅是文档中的错误信息。ROCm是AMD
8月燃油B级车市场格局稳定,头部车型主导竞争激烈
8月燃油B级车市场整体格局延续了以往的稳定态势,头部车型依然占据主导地位,中后段竞争则更加白热化。帕萨特在最后一周销量激增,单周接近4700辆,使整体月销量突破2万辆,稳居榜首。凯美瑞在月中一度下滑
热门推荐
热门教程
更多- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程



















