当前位置: 首页
AI资讯
Ampere与高通联合开发AI推理解决方案

Ampere与高通联合开发AI推理解决方案

热心网友 时间:2026-05-28
转载

先说几个核心判断:人工智能的爆发,把电力与能效问题从幕后直接推到了行业舞台的中央。在这个关键节点,一家六年前就开始深耕"高性能、低功耗"芯片路线的公司,反而成为业界瞩目的焦点。

近期,Ampere Computing 更新了 2024 年的战略与产品路线图,重点展示了他们在云计算和 AI 计算领域,围绕可持续性与高能效所做出的持续创新。同时,一个重磅消息被宣布:他们正在与高通技术公司合作,将高通的 Qualcomm Cloud AI 100 推理方案与自家 CPU 整合,推出面向人工智能推理的联合解决方案。

Ampere与高通技术携手合作,共同开发人工智能推理联合解决方案

Ampere 的 CEO Renee James(半导体行业的资深老兵)指出,AI 的发展带来了日益增长的电力需求与能源挑战,这促使 Ampere 围绕性能和能效的芯片设计思路,比以往任何时候都更受行业关注。她回顾道,Ampere 从六年前就认准了这个方向,因为坚信这才是未来。过去人们总觉得低能耗就等于低性能,但 Ampere 打破了这种固有认知,开创了计算效率的新领域,在高效计算环境中提供了超越传统 CPU 的性能表现。

Renee James 进一步点明了 AI 快速发展带来的核心痛点:能源问题。她直言当前的发展路径不可持续。未来的数据中心基础设施必须解决两个关键难题:一是如何通过计算升级来优化现有的风冷环境;二是如何构建符合电网供电能力的新型可持续数据中心。而这,正是 Ampere 要达成的目标。

Ampere 首席产品官 Jeff Wittich 则介绍了公司的愿景——"人工智能计算(AI Compute)",简单来说,就是将传统的云原生能力与 AI 做深度融合。他强调,Ampere 的 CPU 能处理各种工作负载,从最常见的云原生应用到 AI,包括那些与云原生应用深度集成的人工智能,比如数据处理、Web 服务、媒体分发等。

在这次发布中,Renee James 和 Jeff Wittich 共同确认了一个关键信息:基于 N3 工艺节点、配备 12 通道和 256 核的全新 AmpereOne 平台即将登场。

这次更新的 2024 年战略和产品路线图,除了明确公司的发展方向和愿景外,还涵盖了以下几个关键点:

首先,是与高通的合作。双方将共同开发基于 Ampere CPU 和 Qualcomm Cloud AI 100 Ultra 的解决方案,目标直指业界最大生成式 AI 模型上的大语言模型(LLM)推理问题。

其次,Ampere 12 通道平台将进行扩展,搭载即将推出的 256 核 AmpereOne CPU。这个平台有一个非常亮眼的特点:它能复用现有 192 核 AmpereOne CPU 的风冷散热方案,性能却比市面上现有的 CPU 高出 40%,而且无需复杂的平台设计。预计 192 核的 12 通道内存平台会在今年晚些时候推出。

性能数据也极具说服力。在基于 Oracle Cloud 上运行 Meta Llama 3 的测试中,仅靠 128 核 Ampere Altra CPU(没有 GPU 辅助),其性能就足以媲美 Nvidia A10 GPU 与 x86 CPU 的联合运算,而功耗却只有后者的三分之一。这个对比非常直观,也很有说服力。

另一个值得关注的动向是,Ampere 宣布成立 UCIe 工作组,作为 AI 平台联盟(AI Platform Alliance)的一部分。这意味着他们打算利用开放接口技术来增强 CPU 的灵活性,未来可以将其他客户的 IP 整合到 CPU 中。

关于 AmpereOne 的性能和平台细节也更加清晰了。在每瓦性能上,AmpereOne 继续保持领先,与市场上两款主流的传统 x86 处理器相比,每瓦性能分别高出 50% 和 15%。对于希望更新和整合老旧基础设施、以节省空间、预算和电力的数据中心来说,AmpereOne 的每机架性能提升高达 34%。

产品落地方面,全新 AmpereOne OEM 和 ODM 平台将在未来几个月内发货。同时,Ampere 还宣布与 NETINT 推出联合解决方案,结合 NETINT 的 Quadra T1U 视频处理芯片和 Ampere CPU,可以同时对 360 个直播频道进行转码,并使用 OpenAI 的 Whisper 模型为 40 个流媒体提供多种语言的实时字幕。

最后,在软件和功能层面,除了现有的内存标记(Memory Tagging)、QOS 强制(QOS Enforcement)和网格拥塞管理(Mesh Congestion Management)等功能,Ampere 还推出了全新的 FlexSKU 功能,允许客户用同一个 SKU 来应对横向扩展和纵向扩展两种不同的用例,灵活性大幅提升。

来源:https://m.elecfans.com/article/2887957.html

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章
更多
修Bug被Gemini追删代码致宕机修复报告现编

修Bug被Gemini追删代码致宕机修复报告现编

最近,一起堪称“教科书级别”的AI Agent IDE翻车事件在开发者社区引发热议。这起事故值得所有依赖AI编程工具的开发者,尤其是那些已经在生产环境中对AI Agent 授予较高权限的团队,进行深刻反思。 简单回顾:5月26日,一位开发者要求Gemini 3 5(运行在Agent IDE环境中)修

时间:2026-05-28 22:58
Notion AI运营指南:自动归纳用户反馈

Notion AI运营指南:自动归纳用户反馈

其实,想在 Notion 中高效搞定用户反馈的自动归纳,并不复杂。下面这四种 AI 方法,基本覆盖了从单条处理到全局分析的常见场景。 如果你也在用 Notion 收集用户反馈——无论是问卷、邮件、客服记录,还是社群发言——但总觉得信息碎片化严重,难以提炼共性问题和核心诉求,那很可能是因为缺少一套结构

时间:2026-05-28 22:54
AI给出的答案为何总不符期望?原因解析

AI给出的答案为何总不符期望?原因解析

大模型能力强大,但提问方式不当会导致结果不理想。核心在于精准提问,通过角色设定、背景介绍、明确任务、实现路径和输出要求这五个关键步骤逐步细化问题,才能大幅提升AI回答的质量和精准度。

时间:2026-05-28 22:54
Anthropic新AI聊天机器人模型声称在多项测试中击败OpenAI GPT-4

Anthropic新AI聊天机器人模型声称在多项测试中击败OpenAI GPT-4

2024年3月5日,人工智能领域迎来了一位重要参与者——由OpenAI前员工创立的Anthropic公司正式推出了Claude 3系列模型。这次发布极具分量:新模型不仅在性能上与Google和OpenAI的顶级产品并驾齐驱,部分指标甚至实现超越。要理解此次升级的真正价值,先关注几个关键变化。首先是多

时间:2026-05-28 22:53
Trae对Deno与Bun运行时的AI代码补全支持程度全面详解

Trae对Deno与Bun运行时的AI代码补全支持程度全面详解

如果你在使用 Trae 进行 AI 代码补全时发现,它对 Deno 或 Bun 运行时的提示不够精准——例如类型定义缺失、API 无法正确识别——那很可能不是代码本身有误,而是 Trae 的底层配置尚未适配。简而言之,Trae 对于非 Node js 运行时的标准库支持尚未实现“开箱即用”。下面我们

时间:2026-05-28 22:52
热门专题
更多
刀塔传奇破解版无限钻石下载大全 刀塔传奇破解版无限钻石下载大全
洛克王国正式正版手游下载安装大全 洛克王国正式正版手游下载安装大全
思美人手游下载专区 思美人手游下载专区
好玩的阿拉德之怒游戏下载合集 好玩的阿拉德之怒游戏下载合集
不思议迷宫手游下载合集 不思议迷宫手游下载合集
百宝袋汉化组游戏最新合集 百宝袋汉化组游戏最新合集
jsk游戏合集30款游戏大全 jsk游戏合集30款游戏大全
宾果消消消原版下载大全 宾果消消消原版下载大全
  • 日榜
  • 周榜
  • 月榜
热门教程
更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程