数码系统

相机 win10

测评 win11

手机智车

华为 Tesla

小米理想

苹果蔚来

游戏软件

LOL 抖音

原神微信

当前位置：首页

AI资讯

热点详情

赛灵思FPGA与VMware vSphere协同实现高效ML推理

AI热点日报时间：2026-07-02

热点解读

先看一个趋势：硬件翻跟斗已经是数据中心里的“常客”了。随着各行各业对机器学习（ML）的关注日益升温，FPGA凭借着其灵活性和独特的计算效率优势，正迅速地在私有云、公有云乃至混合云环境中铺开，成为处理密集型计算任务的一把好手。在这个IT基础设施向异构计算转型的关键时期，赛灵思与VMware展开了一项

先看一个趋势：硬件翻跟斗已经是数据中心里的“常客”了。随着各行各业对机器学习（ML）的关注日益升温，FPGA凭借着其灵活性和独特的计算效率优势，正迅速地在私有云、公有云乃至混合云环境中铺开，成为处理密集型计算任务的一把好手。

在这个IT基础设施向异构计算转型的关键时期，赛灵思与VMware展开了一项颇具意义的协作——在VMware的vSphere虚拟化平台上验证FPGA的加速能力。鉴于赛灵思FPGA在ML推断加速领域的广泛应用，这篇分享将为你揭示，如何将两者结合，在虚拟化部署中达到与裸机部署近乎同等的高吞吐、低延迟性能。

“自适应计算”为何脱颖而出？

FPGA的核心优势在于“自适应”。它是一种可重复编程的计算器件，能够灵活调整硬件逻辑，精准匹配不同应用的特定需求。这种特性，让它从GPU和ASIC等架构固定的方案中区别开来，尤其对比开发成本不断攀升的定制ASIC，优势更为明显。

除了灵活性，高能效和低延迟也是FPGA的制胜法宝，这使得它特别适合ML推断这类对实时性要求高的工作负载。与主要依赖海量并行计算核心来提升吞吐量的GPU不同，FPGA通过其定制化的硬件内核、精心设计的数据流水线和高效互连，能够同时兼顾高吞吐量与超低延迟，为ML推断提供了一个更平衡、高效的硬件选择。

在 vSphere 上使用 FPGA 开展 ML 推断

在双方的测试中，VMware实验室使用了赛灵思的Alveo U250数据中心加速卡。整个ML模型的配置过程非常高效，这得益于Vitis AI提供的Docker容器——这是一个为赛灵思硬件平台（从边缘到云）量身打造的ML推断统一开发栈。

这个容器内置了经过深度优化的工具链、库、预置模型和丰富示例。Vitis AI广泛支持包括Caffe和TensorFlow在内的主流框架，并能运行涵盖各种深度学习任务的最新模型。值得一提的是，Vitis AI本身是一个开源项目，开发者可以直接在GitHub上获取其全部资源。

图 1：Vitis AI 软件协议栈

目前，赛灵思FPGA在vSphere上主要通过DirectPath I/O模式（即直通模式）来使用。这种模式允许虚拟机内部的应用直接访问FPGA硬件，绕过了中间的管理层，从而最大化性能并极致压低了延迟。配置过程相当简洁，主要分为两步：首先在ESXi主机层面启用相应功能，然后将设备挂载到目标虚拟机即可。具体的操作指南可以参考VMware官方知识库文章（编号1010789）。另外有个好消息，如果你使用的是vSphere 7，整个过程甚至无需重启主机，便捷性大大提升。

高吞吐量、低时延 ML 推断性能

为了量化性能，VMware与赛灵思合作，使用四个具有不同复杂度的经典CNN模型——Inception_v1、Inception_v2、Resnet50和VGG16——在DirectPath I/O模式下对Alveo U250加速卡进行了严格的吞吐量与延迟评估。

测试平台基于一台Dell PowerEdge R740服务器，搭载双路Intel Xeon Silver 4114 CPU和192GB内存。测试采用ESXi 7.0作为虚拟机管理程序，并将每个模型的端到端性能与裸机环境（作为性能基线）进行对比。客户机与本地操作系统均使用Ubuntu 16.04，并全程结合Vitis AI v1.1与Docker CE 19.03.4进行测试。为了确保评估纯粹聚焦于计算性能，测试使用了ImageNet2012数据集中的5万张图像，并且将这5万张图像置于RAM磁盘中，彻底避免了磁盘I/O可能带来的性能瓶颈。

接下来，我们可以通过下面两组对比图，直观地看到虚拟化测试与裸机测试的性能差距。第一张图聚焦吞吐量，y轴代表虚拟化测试相对于裸机测试的吞吐量比值，当y=1.0时，意味着两者性能完全一致。

图 2：在 Alveo U250 FPGA 上运行 ML 推断时裸机测试和虚拟测试的吞吐量性能比较

图 3：在 Alveo U250 FPGA 上运行 ML 推断时裸机测试和虚拟测试的时延性能比较

测试结果非常有说服力：无论是在吞吐量还是延迟方面，虚拟化环境与裸机环境之间的性能差异最大未超过2%。这清楚地表明，运行在vSphere虚拟化环境中的Alveo U250加速卡，其ML推断性能已经无限接近原生裸机的水平。

云端的 FPGA 性能

毫无疑问，在数据中心采用FPGA翻跟斗已是大势所趋。为了满足日益增长的异构计算和对极致性能的追求，FPGA翻跟斗的应用广度与深度都将持续扩展。本次与VMware的成功合作，其意义在于确保了客户在vSphere这一主流虚拟化平台上，也能充分释放赛灵思FPGA的全部加速潜力。

通过对Alveo U250加速卡在vSphere上进行系统的ML推断性能测试，我们向市场清晰地证明了：在DirectPath I/O模式下，虚拟化部署不仅可行，更能实现接近裸机的高性能。这对于企业客户而言，意味着在享受虚拟化带来的灵活性、可管理性和资源池化优势的同时，无需在关键的计算性能上做出妥协。

热点追踪提示词

你是一名 AI 行业编辑，请围绕下面这条热点输出一份资讯解读：
热点：赛灵思FPGA与VMware vSphere协同实现高效ML推理要求：
1. 先用一句话解释这条热点在讲什么
2. 再总结它为什么重要
3. 说明会影响哪些 AI 产品或内容方向
4. 最后给出 3 个适合资讯站使用的标题

来源：https://m.elecfans.com/article/1308536.html

赛灵思

上一篇：Cursor 0.46版本6大高频问题汇总

下一篇：微软GraphRAG：知识图谱提升AI检索能力

游乐网为非赢利性网站，所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系youleyoucom@outlook.com。

延伸阅读

iPhone 17系列液态硅胶壳曝光：8色可选+挂绳孔设计 iOS 26整合ChatGPT-5：AI全面赋能苹果智能生态真我828真粉节揭晓：10000mAh超大电池手机即将亮相？苹果折叠iPhone曝光：搭载自研C2基带芯片与Touch ID指纹识别对话元戎启行周光：VLA模型核心成本在AI芯片，辅助驾驶方案交付近10万套刘志强：京东方坚持开放合作，拒绝低质低价竞争 Redmi K90系列全系标配5000万长焦与3D超声波指纹，配置再升级 vivo X300系列曝光：天玑9500+2亿像素主摄，长焦微距实力升级

日榜
周榜
月榜

01 / 08-26iPhone 17系列液态硅胶壳曝光：8色可选+挂绳孔设计 02 / 08-26iOS 26整合ChatGPT-5：AI全面赋能苹果智能生态 03 / 08-26真我828真粉节揭晓：10000mAh超大电池手机即将亮相？ 04 / 08-26苹果折叠iPhone曝光：搭载自研C2基带芯片与Touch ID指纹识别 05 / 08-27对话元戎启行周光：VLA模型核心成本在AI芯片，辅助驾驶方案交付近10万套

01 / 本周小米MiMo-V2系列模型2026年6月30日下线，Pro版已自动切换至V2.5 02 / 本周款长安猎手K50重庆车展上市14.19万起 03 / 本周上期所与普陀区签战略协议深化金融区域联动 04 / 本周世纪华通平价大宗交易成交757万股金额1.09亿元 05 / 本周哈啰电助力车搭载海思谛听模组集成开源鸿蒙星闪

01 / 本月小米MiMo-V2系列模型2026年6月30日下线，Pro版已自动切换至V2.5 02 / 本月款长安猎手K50重庆车展上市14.19万起 03 / 本月上期所与普陀区签战略协议深化金融区域联动 04 / 本月世纪华通平价大宗交易成交757万股金额1.09亿元 05 / 本月哈啰电助力车搭载海思谛听模组集成开源鸿蒙星闪

热点快看

07-04 09:10小米MiMo-V2系列模型2026年6月30日下线，Pro版已自动切换至V2.5 07-04 09:10款长安猎手K50重庆车展上市14.19万起 07-04 09:10上期所与普陀区签战略协议深化金融区域联动 07-04 09:09世纪华通平价大宗交易成交757万股金额1.09亿元 07-04 09:09哈啰电助力车搭载海思谛听模组集成开源鸿蒙星闪

热点追踪

持续追踪iPhone 17系列液态硅胶壳曝光：8色可选+挂绳孔设计 持续追踪iOS 26整合ChatGPT-5：AI全面赋能苹果智能生态 持续追踪真我828真粉节揭晓：10000mAh超大电池手机即将亮相？ 持续追踪苹果折叠iPhone曝光：搭载自研C2基带芯片与Touch ID指纹识别