当前位置: 首页
AI
马斯克部署22万张GPU打造持续在线AI系统告别单次对话模式

马斯克部署22万张GPU打造持续在线AI系统告别单次对话模式

热心网友 时间:2026-05-16
转载
Claude开始“做梦”:AI Agent的长期记忆难题与算力突围

Claude开始“做梦”了。

更准确地说,即便你已经关闭了聊天窗口,它可能依然在后台“思考”。最近,Anthropic在开发者大会上正式推出了一项名为“Dreaming”(做梦)的新能力。表面看,这似乎只是一次普通的功能更新。

但不少开发者仔细看完介绍后,第一反应并非“Claude变得更聪明了”,而是意识到:AI似乎开始尝试“长期活着”了。

因为Dreaming并非传统意义上的聊天记忆。它更像一套会周期性运行的后台系统——Claude会主动回顾过去的任务、对话以及多个智能体之间的协作记录,从中分析哪些经验值得长期保留,再重新整理进记忆系统,为未来的任务提供参考。

这意味着,AI不再只是“你问一句,它答一句”。它开始在后台持续复盘自己。而这背后,其实也指向了AI Agent在过去一年面临的最大难题之一:AI太容易“失忆”了。

AI开始学会“复盘自己”了

那么,Claude具体如何让AI“做梦”?

按照Anthropic的最新描述,这是一种会周期性运行的后台机制。系统会主动扫描过去的任务、对话以及多智能体协作记录,筛选出值得长期保留的信息,并写入记忆系统,供未来任务调用。

说得更直白些,就是Claude开始尝试“复盘自己”了。不过,这项功能目前仍处于研究预览阶段,仅面向Claude Managed Agents开放。

所谓Claude Managed Agents,是Anthropic推出的托管式智能体框架。与开发者直接基于Messages API自行搭建Agent不同,Anthropic更希望开发者直接使用其托管基础设施,在平台内部运行多个智能体,让它们协作完成长期任务。而Dreaming,正是这个体系中非常关键的一环。

过去一年,Agent已成为AI行业最热门的方向之一。从OpenAI的Operator,到Google的Project Astra,再到Manus、OpenClaw这类自动化Agent产品,整个行业都在试图让AI从“聊天”走向“执行任务”。

但真正做过Agent的开发者都清楚,一个长期未被彻底解决的问题始终存在:AI太容易“失忆”了。

即便今天的大模型上下文窗口越来越长,但对于持续数小时、数天甚至更长时间的任务来说,信息丢失依然不可避免。许多开发者发现,Agent在长时间运行后,会逐渐偏离目标、忘记用户偏好,甚至重复犯错。

因此,过去一段时间,开发者社区一直在疯狂研究如何让AI拥有长期记忆。Anthropic这次的Dreaming,本质上就是在攻克这个问题。

根据最新介绍,Dreaming并非简单的聊天记录保存,也不是传统意义上的上下文压缩。它更像一个持续运行的“后台复盘系统”。系统会定期分析多个智能体过去的行为,寻找哪些模式值得长期保留。Anthropic甚至提到,这套机制能够发现单个智能体自己无法意识到的问题,包括重复出现的错误、团队逐渐形成的工作流,以及多个智能体共同积累出的偏好。

这一点,其实已经和传统聊天机器人出现了明显区别。过去的大模型,大多数时候仍停留在“一次性推理”阶段:用户提问、模型回答、任务结束。即便AI在某次任务中犯了错误,它也很难真正意义上“成长”。

但Dreaming的逻辑完全不同。它开始尝试把过去的任务经验沉淀下来,并持续影响未来行为。这也是为什么Anthropic将其命名为“Dreaming”。这有点像人类睡眠时的大脑整理过程:白天的经历,会在休息中被重新组织、强化,并逐渐转化为长期记忆。

在Reddit和X等平台上,不少开发者已经开始讨论这件事。有观点认为,这可能是目前Agent体系里最重要的一步。因为过去大家一直在比拼模型能力,但真正进入企业场景后,开发者发现:决定Agent是否真正可用的,很多时候并非模型本身,而是“长期稳定工作”的能力。这一点在软件工程领域尤为明显。

Claude要变成一个“长期在线系统”

Dreaming并非Anthropic最近唯一的新动作。

在此次开发者大会上,Anthropic还扩大开放了此前处于研究预览阶段的功能:Outcomes(成果追踪)以及Multi-agent orchestration(多智能体编排)。这些能力迭代的背后,其实都指向同一个方向:Anthropic正在尝试把Claude从“聊天模型”,转变为一个真正能够长期运行的AI Agent系统。

尤其是在Claude Code爆发之后,Anthropic已明显开始全面押注Agent。因为行业正在发现,真正有价值的AI,并非只能聊天,而是能够持续执行任务。所以过去一年,越来越多公司开始研究如何让AI从“回答问题”变成“长期完成任务”。

而Anthropic现在的路线则更进一步。它不仅想让Claude更聪明,还开始尝试解决长期记忆、多智能体协作、持续工作流以及Agent长时间运行的问题。

从这个角度再回头看Dreaming,会发现它并非一个孤立功能,而是Anthropic整个Agent战略中非常关键的一块拼图。

拿下22万张GPU,Anthropic开始“松绑”了

过去几个月,随着Claude Code与AI Agent使用量暴涨,Anthropic一直面临一个非常现实的问题:算力不够。早前,不少Claude用户就曾频繁抱怨使用额度太容易耗尽、高峰期响应速度下降、长任务中断,以及Pro与Max套餐的限制越来越明显。

而Dreaming推出后,这种情况可能会愈发严峻。据最新消息,Dreaming会定期扫描历史任务、分析多智能体行为、识别长期模式、提炼团队偏好以及重构长期记忆等。也就是说,即使用户没有发送消息,系统在后台也是持续运行的。这意味着算力消耗不再是瞬时的,而是持续占用。

Anthropic联合创始人兼CEO Dario Amodei表示,公司原本按“每年10倍”准备算力,但2026年第一季度的实际增速年化下来约为80倍,这正是Claude一直在限速的直接原因。Dario甚至直言希望增速回到10倍,“80倍太疯狂了,扛不住”。

但就在一天之内,Anthropic似乎就把困扰其很长时间的算力问题解决了。就在Dreaming官宣的同一天,另一则消息轰动了整个AI圈,并迅速发酵。

马斯克表示,xAI解散,不再作为独立公司运营,之后将只剩下SpaceX AI。同时,他官宣SpaceX与Anthropic已达成重磅协议,向后者提供全球最大、最新的超级人工智能集群Colossus 1的所有算力。

Anthropic很快便证实了与xAI合作的消息。其表示,接下来一个月内会上线300兆瓦算力、22万张英伟达GPU,并尽快把算力转化为更高的限额传给开发者。此外,作为该协议的一部分,Anthropic还表达了与SpaceX AI合作开发数吉瓦级轨道人工智能算力的意愿。

有了22万张GPU卡后,Anthropic也就有了开放更多服务权限的底气。

随后,Anthropic官宣三项立即生效的变更:

其一,针对Pro、Max、Team以及按席位付费的Enterprise套餐,将Claude Code每五小时的速率限制提高一倍(适用于Dreaming);

其二,移除Pro和Max账户在Claude Code上的高峰时段速率限制削减;

其三,大幅提高Claude Opus模型的API速率限制。

这个时间点非常耐人寻味。因为像Dreaming、Multi-agent orchestration(多智能体编排)以及Outcomes这类能力,本质上都属于“长期运行AI Agent”体系的一部分。它们对于GPU的消耗,远高于传统聊天机器人。

过去的大模型,大多数还是“一问一答”式调用:用户提问,模型生成答案,任务结束后GPU释放。但Agent不一样。它可能持续运行数小时,甚至在后台长期保持活跃状态。

尤其是Dreaming这种能力,本质上相当于让Claude在后台持续进行任务复盘、记忆整理、模式归纳以及工作流优化。即便用户没有发送新的消息,系统依然可能持续消耗推理资源。

某种程度上,22万张GPU的意义,已经不仅仅是“更多算力”。它更像是在为Anthropic下一阶段的Agent战略铺路。因为随着Dreaming、多智能体协作以及Claude Code的持续推进,Claude正在从一个聊天模型逐渐演变成一个长期运行的AI系统。

而这种系统真正需要的,不只是更强的模型能力,更重要的是长期、稳定且足够低成本的推理基础设施。对于Anthropic来说,GPU不再只是训练模型的资源,它已经开始成为支撑AI Agent长期运行的“电力系统”。

而Dreaming的出现,或许只是这个阶段的开始。

来源:https://www.51cto.com/article/842556.html

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章
更多
大模型与CodeQL代码审计解决方案、技术栈及前沿方向分析

大模型与CodeQL代码审计解决方案、技术栈及前沿方向分析

代码审计的格局,正在被大模型悄然重塑。从最初的辅助分析,到如今的规则自主生成、告警智能过滤,乃至专用模型的构建,大型语言模型(LLM)与CodeQL这类传统静态分析工具的结合,正变得前所未有的紧密和高效。 引言 随着软件系统日益复杂,安全漏洞的检测与修复已成为开发过程中的核心挑战。以CodeQL为代

时间:2026-05-16 21:29
AI全栈开发实践:基于Harness与SDD的多仓库管理模式详解

AI全栈开发实践:基于Harness与SDD的多仓库管理模式详解

Harness思维的核心,是引导AI基于现有范例进行模仿与复刻,而非要求其进行无约束的自由创造。这就像指导一位新同事时,最有效的方式是明确指示:“请参考隔壁团队已上线的XX模块,按照其代码风格和架构实现一个类似功能”,而不是模糊地说“你来处理一下”。前者能显著提升产出代码与团队既有规范和项目整体风格

时间:2026-05-16 21:29
Claude 迁移至 Codex 技能编排实践与经验总结

Claude 迁移至 Codex 技能编排实践与经验总结

从Claude迁移到Codex,本应是一次平滑的技术切换,却意外演变成一场关于智能体工作流实战的深度逻辑考验。这背后揭示的行业趋势,远比一次简单的模型选型更值得深入探讨。 在AI工程实践中,我们常有一种误解:只要大模型足够强大,就能自动理解开发者的复杂意图。然而,当你在生产环境中部署一个多阶段、有状

时间:2026-05-16 21:28
包车收费模式转变从成果付费到用量付费引争议

包车收费模式转变从成果付费到用量付费引争议

曾几何时,我们乐观地认为,AI将沿着成熟SaaS的价值路径演进,最终实现公平合理的按效果付费。如今看来,这一愿景已然破灭。当AI行业发现自己无法复制SaaS那套稳固的商业模式基础时,便果断放弃了最初的承诺,转而投身于另一个早已预设好的商业轨道。 近期的行业动态,想必大家已有感知。多家头部AI公司相继

时间:2026-05-16 21:28
马斯克宣布xAI并入SpaceX并更名为SpaceXAI

马斯克宣布xAI并入SpaceX并更名为SpaceXAI

今天科技界迎来重磅战略调整。埃隆·马斯克在其社交平台X上正式宣布,旗下人工智能公司xAI将结束独立运营,全面整合进入SpaceX体系,并更名为SpaceXAI。这一举措标志着AI与航天技术的深度融合迈出关键一步。 此次决策源于马斯克对人工智能未来发展的核心判断。他认为,当前地面数据中心面临日益严峻的

时间:2026-05-16 21:28
热门专题
更多
刀塔传奇破解版无限钻石下载大全 刀塔传奇破解版无限钻石下载大全
洛克王国正式正版手游下载安装大全 洛克王国正式正版手游下载安装大全
思美人手游下载专区 思美人手游下载专区
好玩的阿拉德之怒游戏下载合集 好玩的阿拉德之怒游戏下载合集
不思议迷宫手游下载合集 不思议迷宫手游下载合集
百宝袋汉化组游戏最新合集 百宝袋汉化组游戏最新合集
jsk游戏合集30款游戏大全 jsk游戏合集30款游戏大全
宾果消消消原版下载大全 宾果消消消原版下载大全
  • 日榜
  • 周榜
  • 月榜
热门教程
更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程