高通推出AI200/AI250芯片,挑战英伟达,股价大涨超20%
10月27日消息,高通公司今日正式宣布推出新一代数据中心AI推理优化解决方案,该方案基于全新研发的AI200和AI250芯片系列,涵盖加速卡及配套机架系统。

高通AI200是一款专为机架级AI推理设计的解决方案,致力于通过优化总体拥有成本(TCO)与提升性能表现,为大型语言模型和多模态模型(LLM、LMM)的推理及其他AI工作负载提供高效支持。每张加速卡配备768GB LPDDR内存,在实现更大内存容量的同时有效降低了部署成本。
AI250解决方案则采用了基于近内存计算(near-memory computing)的创新内存架构,通过提供超过10倍的内存带宽提升及显著的功耗优化,为AI推理工作负载带来更卓越的能效表现。
这两款机架解决方案均采用直接液冷技术提升散热效率,支持PCIe扩展、以太网扩展、机密计算以保障AI工作负载安全,以及160kW的机架级功耗设计。

高通打造的端到端超大规模AI软件栈,从应用层到系统软件层均针对AI推理场景进行了深度优化。该软件栈支持主流的机器学习(ML)框架、推理引擎、生成式AI框架,以及LLM/LMM推理优化技术(如解耦合服务)。开发者可借助高通的Efficient Transformers Library和AI推理套件,实现模型的平滑上架与Hugging Face模型的一键部署。高通的软件平台提供开箱即用的AI应用和代理、完备的工具链、函数库、API及服务,助力企业高效运营AI业务。
高通AI200和AI250预计将分别于2026年及2027年投入商用。
受此消息影响,截至发稿时,高通公司股价已大幅攀升20%。

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
Perplexity Pro订阅用户切换Claude 3.5模型使用指南
作为Perplexity Pro订阅用户,却无法在界面中找到Claude 3 5模型?这通常是由于账户权限同步延迟、浏览器本地缓存未更新或平台临时路由策略调整所致。无需担心,问题通常可以快速解决。本文将为您详细解析五种行之有效的方法,总有一种能帮助您顺利启用Claude 3 5 Sonnet或Hai
Claude 3 Opus隐私优势解析与零样本训练表现对比
对于Perplexity Pro用户而言,若您格外重视数据隐私与模型在全新任务上的直接应用能力,那么深入理解其集成的Claude 3 Opus模型至关重要。该模型在数据处理逻辑与推理架构上具备独特优势,本文将为您详细解析其核心机制。 一、Perplexity Pro 中 Claude 3 Opus
中国科学院瞬悉2.0类脑大模型发布 突破长序列与低耗部署瓶颈
人工智能领域的长文本处理竞赛正进入白热化阶段。无论是深度解析代码仓库、构建智能体的长期记忆,还是处理复杂的多模态交互,都迫切需要模型能够高效处理数十万乃至上百万token的超长序列。 然而,一个根本性的技术瓶颈也随之凸显:基于传统Transformer架构的模型,其推理时的计算复杂度和显存消耗会随着
2026青岛国际车展盛大开幕 千款绿色智能车型引领出行新风尚
4月29日,青岛国际会展中心(崂山馆)人潮涌动,备受瞩目的2026第二十五届青岛国际汽车工业展览会在此盛大启幕。作为山东地区规格最高、参展品牌最全的国际性车展,本届展会以“向上而行,领创未来”为核心主题,吸引了全球88家主流汽车制造商参展,近千款热门与新款车型集中亮相,全面展示了汽车产业的最新科技成
通义万相AI生成桌游素材教程与实用技巧
想用通义万相高效产出专业级桌游美术素材,却总被角色失调、场景混乱或风格不统一困扰?这通常是因为未掌握AI生成桌游图像的核心逻辑。桌游素材不同于普通插画,它更强调主体的高识别度、明确的功能性以及系列作品的视觉统一。下面这套经过实战验证的五步工作流,将系统性地解决这些痛点,帮助你稳定生成可直接投入设计流
- 日榜
- 周榜
- 月榜
1
2
3
4
5
6
7
8
9
10
相关攻略
2015-03-10 11:25
2015-03-10 11:05
2021-08-04 13:30
2015-03-10 11:22
2015-03-10 12:39
2022-05-16 18:57
2025-05-23 13:43
2025-05-23 14:01
热门教程
- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程
热门话题

