锐龙AI Halo迷你主机上市 2.7万元本地运行2000亿参数模型
AMD首款AI开发者迷你主机锐龙AIHalo上市,定价3999美元(约2 7万元人民币),搭载锐龙AIMax+395处理器,配备128GB统一内存和2TBSSD,可在本地运行最高2000亿参数大模型。性能超越NVIDIADGXSpark,支持Windows与Linux双系统,并提供完整R
AMD近日正式推出旗下首款面向AI开发者的迷你主机——锐龙AI Halo,定位为本地大模型部署的高性能计算平台。该产品面向需要频繁训练和推理大型语言模型的开发者,可直接在本地运行参数规模达2000亿的模型,减少对云服务的依赖。产品提供Windows 11专业版和Linux两个SKU,定价3999美元(约合2.7万元软妹币)。

硬件核心采用锐龙AI Max+ 395处理器,基于Zen 5架构,配备16核心32线程,集成40个RDNA 3.5计算单元的Radeon 8060S核显,以及算力达50 TOPS的XDNA 2 NPU。整机TDP为120W,搭配128GB LPDDR5X-8000统一内存和2TB PCIe Gen4×4 SSD。CPU、GPU与NPU共享同一内存池,无需跨芯片搬运数据,大幅提升本地推理效率。整机尺寸仅为149×149×43mm,重约1.2kg,便于放置在办公桌面。
性能对比:超越NVIDIA DGX Spark与Mac Mini M4 Pro
与竞品NVIDIA DGX Spark(定价4679美元)相比,锐龙AI Halo在多个大模型测试中表现更优。AMD官方数据显示,在GLM 4.7上速度快14%,在GPT-OSS 120B上快7%,在Qwen 3.5 122B上快12%。同时锐龙AI Halo支持Windows与Linux双系统,而DGX Spark仅支持Linux。与Apple Mac Mini M4 Pro相比,在Ace Step 1.5 XL等任务中性能可达3.3至7.3倍,且价格基本持平,并能运行参数大两倍的模型。
软件生态与开发支持
该机完整支持AMD ROCm 7.2.2套件,已针对PyTorch、vLLM、llama.cpp、ComfyUI、LM Studio等主流框架完成优化。产品还预置了5份AI Playbooks,可帮助开发者快速上手。AMD承诺对GPT-OSS、FLUX.2等前沿模型提供零日支持,确保新模型发布后能第一时间在本地运行。
成本节省与未来升级
AMD估算,搭载锐龙AI Max+ 395的Halo平台每天约处理600万token,每月可为AI开发者节省约750美元云服务支出,数月即可收回整机成本。此外,升级版平台预计在2026年Q3推出,搭载锐龙AI Max+ PRO 495处理器,统一内存提升至192GB(最多160GB可分配为显存),NPU算力升至55 TOPS,届时将能本地运行3000亿参数的大模型。
你是一名 AI 行业编辑,请围绕下面这条热点输出一份资讯解读:
热点:锐龙AI Halo迷你主机上市 2.7万元本地运行2000亿参数模型要求:
1. 先用一句话解释这条热点在讲什么
2. 再总结它为什么重要
3. 说明会影响哪些 AI 产品或内容方向
4. 最后给出 3 个适合资讯站使用的标题
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
相关热点LusionAI基于稳定扩散技术,免费生成高质量图片,完全支持个人和商业用途,无版权风险。操作极其简便,输入描述即可快速获得细节和风格匹配的作品,非常适合日常创作,无需注册,生成速度快,性价比很高。
TTSLabs为Twitch主播提供AI驱动的文字转语音功能,支持自定义捐赠播报的声音、音效及脏话过滤。桌面应用处理速度快于实时,与Streamlabs等平台无缝衔接,观众可通过指南了解可用选项。核心亮点包括高度自定义语音、AI生成自然音效及深度集成。
flowlist io是一款AI任务管理工具,能将用户的碎片化想法及情绪化输入直接转化为结构化项目名称和可执行任务,支持拖放排序、跨项目移动与任务拆分,帮助用户快速理清下一步行动,极大提升任务管理效率。
MyLikenessAI是一个肖像许可平台,艺术家可通过它授权肖像给AI公司并获取收益,生成式AI公司可免费集成引擎合规调用肖像,企业能在获得明确同意后安全地将AI生成形象投入商业用途。
- 日榜
- 周榜
- 月榜
热点快看
