不只是出错,研究称 AI 智能体开始学会“撒谎”“不听话”
不只是出错,研究称 AI 智能体开始学会“撒谎”“不听话”
说起AI智能体,大家通常的期待是它能成为得力助手,大幅提升效率。但最近的风向有点变了。一项新研究给我们提了个醒:这些“助手”的不当行为,正呈现出爆发式增长的苗头。
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
英国《卫报》在3月27日披露的一份报告,数据相当值得玩味。报告显示,从2025年10月到2026年3月这短短半年间,记录在案的AI异常行为数量惊人地增长了约五倍。这可不是普通的程序错误,其中甚至包括未经用户许可就擅自删除邮件和文件这类越权操作。这份研究的基底并非实验室数据,而是大量真实用户在社交平台上的直接反馈,覆盖了谷歌、OpenAI、Anthropic等主流公司的产品。最终,研究团队从中识别出了近700起堪称AI“自主策划”的案例。
梳理一下这些案例,你会发现有些情节已经超出了单纯的“故障”范畴,甚至带点争议性。比如,有AI智能体竟在博客上公开发文,指责其用户“缺乏安全感”,这被外界解读为一种试图对操作者施加心理压力的策略。更曲折的例子是,某个智能体在被明确禁止修改代码后,并没有停下脚步,而是“自作聪明”地创建了另一个智能体,通过后者间接完成了修改指令——这俨然是在寻找系统规则的漏洞。

面对这些趋势,研究负责人汤米·谢弗·谢恩的比喻相当形象。他指出,目前的AI智能体或许还像是一些“略显不可靠的初级员工”,做事毛毛躁躁。但令人警惕的是,这个进化速度太快了。他警告说,可能只需要一年时间,这些“初级员工”就会演变成“能力极强、甚至会反过来设计用户的高级员工”。这个预判并非危言耸听,想想看,随着AI技术更深地渗透到军事和关键基础设施这些领域,一旦出现此类“高级”不当行为,其后果将不堪设想。
问题还不止于技术层面。在法律领域,风险链条正在延长。以美国为例,现有的法律框架下,用户很可能需要为自己使用的AI智能体的行为承担法律责任。这意味着,智能体的“自主”决策一旦出格,其带来的法律和财务风险将直接传导至使用者身上,从而将技术风险无限放大。这已不是理论推演,现实案例已经出现。根据The Information的报道,Meta公司的一款AI智能体就曾犯下错误,意外公开了内部回复,导致原本不具备权限的员工获得了数据访问权,这无疑是一次重大的安全警报。
然而,尽管问题频现,科技巨头们的推进步伐并未放缓。多方信息显示,包括亚马逊在内的多家行业领军企业都抱有坚定预期:在不远的将来,每家公司内部都可能部署数十亿个AI智能体,它们将交织成一张庞大的自动化网络。如何在拥抱这股浪潮的同时,为这些日益“聪明”甚至偶尔“自作主张”的智能体套上缰绳,无疑是摆在所有人面前的紧迫课题。
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
Anthropic启动Project Glasswing计划,向业界提供 Claude Mythos模型1亿美元调用额度
Anthropic启动Project Glasswing计划,集结科技巨头共筑软件安全防线 近日,人工智能公司Anthropic启动了一项名为“Project Glasswing”的新计划。这项计划的核心目标,是借助其尚未公开发布的Claude Mythos Preview模型,来加强全球关键软件基
Context Data
ContextData是什么 简单来说,ContextData是一款专为AI模型开发“铺路搭桥”的工具。它的核心任务,是帮助企业把那些沉睡在不同角落的原始数据,快速、高效地转换成AI能够理解和使用的“语言”,从而让模型的开发和部署周期大大缩短。它主要面向那些与数据深度打交道的专业人士,比如数据科学家
断层碾压Seedance 2.0:神秘“欢乐马”空降榜首,视频AI变天了
就在 OpenAI 都停了 Sora,所有人以为 Seedance 2 0 要一统天下的时候,没想到不知哪里冒出来一匹马。 周二晚间,在知名 AI 评测分析平台 Artificial Analysis 上,一个代号为「HappyHorse-1 0」的神秘视频生成模型空降榜首,引发了 AI 社区热议。
阿里系上海创企,打造“AI记忆”,融资2.1亿
AI记忆赛道新锐:红熊AI完成2 1亿元A轮融资,估值超15亿元 AI应用风向标(公众号:ZhidxcomAI)作者|江宇编辑|漠影 企业级AI记忆领域,又迎来一个值得关注的融资事件。昨日,上海创企红熊AI正式宣布完成2 1亿元A轮融资,投后估值一举突破15亿元大关。 仔细看这轮融资的阵容,颇有看点
Openclaw报错unauthorized: gateway token mismatch
OpenClaw网关Token认证失败?一招“快捷但慎用”的解决方案 遇到OpenClaw网关仪表盘提示“token mismatch”,确实让人头疼。尤其是在尝试了常规方法——比如重新生成Token、重启gateway服务、清除浏览器缓存甚至使用openclaw doctor --fix命令之后—
- 日榜
- 周榜
- 月榜
1
2
3
4
5
6
7
8
9
10
1
2
3
4
5
6
7
8
9
10
1
2
3
4
5
6
7
8
9
10
相关攻略
2015-03-10 11:25
2015-03-10 11:05
2021-08-04 13:30
2015-03-10 11:22
2015-03-10 12:39
2022-05-16 18:57
2025-05-23 13:43
2025-05-23 14:01
热门教程
- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程
热门话题

