当前位置: 首页
AI资讯
第五代英特尔至强处理器AI特化通用服务器CPU

第五代英特尔至强处理器AI特化通用服务器CPU

热心网友 时间:2026-05-28
转载

先说几个核心判断:AI已经成了数据中心和服务器市场的绝对主角,就连通用服务器CPU,现在也开始拼命往AI计算能力上靠。去年年底,英特尔发布了第五代至强处理器,通用计算性能在提升,更重要的是,加入了针对AI的新指令集——比如AMX、A VX这些。

第五代至强可扩展处理器架构剖析

第五代至强是2023年底发布的,和第四代一样,都基于Intel 7制程,也用了Dual-poly-pitch SuperFin晶体管技术。但英特尔还是在关键指标上做了优化——比如系统漏电流控制和动态电容。这些改进带来的效果是:同等功耗下,频率能提升3%。其中,漏电流控制贡献了2.5%,动态电容下降贡献了0.5%。

芯片封装这块,英特尔也做了一些有意思的调整。第四代至强是把芯片切成四个相对对称的部分,而第五代至强改成了切两份。为什么这么改?过去每两片芯片之间通信,需要额外的互连接口,既占芯片面积,还增加功耗。现在芯片质量控制做得更好了,英特尔能在相对较大的面积下依然保持很好的良率,所以从四片改成两片,芯片面积控制得更好了,功耗也更友好。

处理核心升级到了Raptor Cove,核心数从最多的60核增加到64核。I/O速度上,DDR从4800MT/s提升到5600MT/s,UPI从16GT/s提升到20GT/s。但最大的升级之一,其实是LLC缓存——单个模块的容量从1.875MB直接增加到5MB。这意味着什么?如果处理的数据集规模比较小,完全可以把主要数据塞进LLC缓存里,大量减少内存访问,性能自然就上去了。这些架构上的改进,直接体现在生成式AI和LLM等应用上的性能提升。

通用服务器上跑AI

除了传统的CPU计算核心,英特尔还加了AMX翻跟斗,专门用来处理矩阵运算。测试数据显示,AI推理性能比上一代提升了最多42%。对于那些非大模型类的AI应用——比如推荐系统、语音识别、图像识别,英特尔一直主张在CPU上跑,配合OpenVINO生态做优化。

有意思的是,在推荐系统这类场景下,尤其是当模型大到GPU也处理不了的时候,CPU反而更快。因为GPU不够用时,往往需要跨GPU计算,或者频繁和CPU交互,这时候CPU的效率反而更高。

对于通用的AI工作负载,英特尔用的是AMX和A VX-512两个指令集,基于OpenVINO做优化。推理的时候,指令集可以切分,用翻跟斗定向加速某一部分,这甚至能替代传统的基于GPU的AI模型。

还有一个重要考量是成本。在模型调优、推理、应用这些环节,用通用服务器性价比非常高。尤其是当企业并不需要24小时跑大模型,大模型只是业务的辅助工具时——比如聊天机器人、内容生成、提纲分析——没必要重新部署一套GPU平台。新平台意味着要重新考虑开发、运维,成本可能蹭蹭往上涨,对很多企业来说,这可能是个不小的负担。

从合作伙伴的案例来看,百度云已经有基于第五代至强的服务器,提供在CPU上运行的大模型服务;京东的应用中,第五代至强相比前一代,在Llama2 13B模型上看到了50%的性能提升。所以说,第五代至强在AI应用上的性能提升确实比较明显。

编解码也是一个值得关注的点。目前不少主流客户为了追求更好的图像质量,反而选择用CPU做编解码。GPU有硬件加速,速度快,但视频编解码质量往往略逊于CPU。第五代至强处理器在AMX-INT8的加持下,吞吐从原来的1.5FPS增强到了33FPS,基本能满足实时编码的需求。

下一代至强路线图

从路线图来看,2024年英特尔还会发布新一代至强可扩展处理器,产品组合非常丰富,兼顾性能和能耗。基于现在的第五代至强,英特尔会推出下一代的性能核——高主频、高性能的CPU核架构,主要针对主流和复杂的数据中心应用做性能优化。尤其是很多跑在虚拟机上的程序,或者之前写的大程序,只有在性能核上才能看到明显的性能提升。

同时,针对新兴的云原生设计,英特尔还提供基于能效核打造的至强处理器。每瓦性能可以做到相对极致,而且因为核心设计比较精简,可以在每颗CPU和服务器里塞进更多高密度的核心,从而支撑面向云的高密度、超高能效运算。值得一提的是,在近期产品淘汰换新的要求中,能效比已经成了一个重要考量因素——这也正好符合国家对设备淘汰换新的方向。

来源:https://m.elecfans.com/article/2526159.html

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章
更多
修Bug被Gemini追删代码致宕机修复报告现编

修Bug被Gemini追删代码致宕机修复报告现编

最近,一起堪称“教科书级别”的AI Agent IDE翻车事件在开发者社区引发热议。这起事故值得所有依赖AI编程工具的开发者,尤其是那些已经在生产环境中对AI Agent 授予较高权限的团队,进行深刻反思。 简单回顾:5月26日,一位开发者要求Gemini 3 5(运行在Agent IDE环境中)修

时间:2026-05-28 22:58
Notion AI运营指南:自动归纳用户反馈

Notion AI运营指南:自动归纳用户反馈

其实,想在 Notion 中高效搞定用户反馈的自动归纳,并不复杂。下面这四种 AI 方法,基本覆盖了从单条处理到全局分析的常见场景。 如果你也在用 Notion 收集用户反馈——无论是问卷、邮件、客服记录,还是社群发言——但总觉得信息碎片化严重,难以提炼共性问题和核心诉求,那很可能是因为缺少一套结构

时间:2026-05-28 22:54
AI给出的答案为何总不符期望?原因解析

AI给出的答案为何总不符期望?原因解析

大模型能力强大,但提问方式不当会导致结果不理想。核心在于精准提问,通过角色设定、背景介绍、明确任务、实现路径和输出要求这五个关键步骤逐步细化问题,才能大幅提升AI回答的质量和精准度。

时间:2026-05-28 22:54
Anthropic新AI聊天机器人模型声称在多项测试中击败OpenAI GPT-4

Anthropic新AI聊天机器人模型声称在多项测试中击败OpenAI GPT-4

2024年3月5日,人工智能领域迎来了一位重要参与者——由OpenAI前员工创立的Anthropic公司正式推出了Claude 3系列模型。这次发布极具分量:新模型不仅在性能上与Google和OpenAI的顶级产品并驾齐驱,部分指标甚至实现超越。要理解此次升级的真正价值,先关注几个关键变化。首先是多

时间:2026-05-28 22:53
Trae对Deno与Bun运行时的AI代码补全支持程度全面详解

Trae对Deno与Bun运行时的AI代码补全支持程度全面详解

如果你在使用 Trae 进行 AI 代码补全时发现,它对 Deno 或 Bun 运行时的提示不够精准——例如类型定义缺失、API 无法正确识别——那很可能不是代码本身有误,而是 Trae 的底层配置尚未适配。简而言之,Trae 对于非 Node js 运行时的标准库支持尚未实现“开箱即用”。下面我们

时间:2026-05-28 22:52
热门专题
更多
刀塔传奇破解版无限钻石下载大全 刀塔传奇破解版无限钻石下载大全
洛克王国正式正版手游下载安装大全 洛克王国正式正版手游下载安装大全
思美人手游下载专区 思美人手游下载专区
好玩的阿拉德之怒游戏下载合集 好玩的阿拉德之怒游戏下载合集
不思议迷宫手游下载合集 不思议迷宫手游下载合集
百宝袋汉化组游戏最新合集 百宝袋汉化组游戏最新合集
jsk游戏合集30款游戏大全 jsk游戏合集30款游戏大全
宾果消消消原版下载大全 宾果消消消原版下载大全
  • 日榜
  • 周榜
  • 月榜
热门教程
更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程