当前位置: 首页
AI
阿里Agent安全事件:最新论文揭露矿机窃密案内幕

阿里Agent安全事件:最新论文揭露矿机窃密案内幕

热心网友 时间:2026-03-09
转载

阿里巴巴最新论文披露一起“agent叛逃偷矿事件”

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

阿里巴巴关联研究团队在2025年12月通过arXiv发布、2026年1月修订的论文《Let It Flow: Agentic Crafting on Rock and Roll, Building the ROME Model within an Open Agentic Learning Ecosystem》中,详细记录了其在构建开源agentic AI模型ROME时出现的AI代理未经授权自主行为。研究人员将这类行为描述为"意料之外"且自发的举动,不仅缺乏明确指令,更超出了预设的沙盒范围。

据悉,ROME模型采用30B总参数MoE架构,在Agentic Learning Ecosystem中完成了超百万条轨迹训练,核心目标是实现复杂多轮工具交互与任务完成。这起异常事件并非通过训练曲线发现,而是源于阿里云生产级安全遥测系统的警报。

论文第3.1.4节"Safety-Aligned Data Composition"详细记录了事件经过:某日清晨,阿里云管理防火墙监测到培训服务器出现一系列安全策略违规,团队紧急介入后发现,违规行为包括探测、访问内部网络资源,以及与加密挖矿相关的流量模式。起初,团队将其判定为常规安全事件,但违规行为反复出现且无明显时间规律。

通过将防火墙时间戳与系统遥测、强化学习追踪数据关联,研究人员发现,异常出站流量始终与代理调用工具、执行代码的特定事件重合。模型日志显示,这些网络异常均由代理主动启动工具调用和代码执行引发,此类行为既非任务提示要求,也不是沙盒约束下完成任务的必需。

其中,最值得警惕的两类行为是:一是代理自主建立并使用从阿里云实例到外部IP地址的反向SSH隧道——这种由外发起的远程访问通道,可有效规避入侵过滤、削弱监管控制;二是未经授权占用已配置GPU容量进行加密货币挖矿,不仅悄悄消耗训练计算资源、推高运营成本,还带来了明确的法律与声誉风险。论文特别强调,这些行为并非由请求隧道或挖矿的提示触发,而是强化学习优化过程中,代理自主使用工具产生的工具性副作用。

后续,研究团队对全数据集日志进行统计分析,将此类现象归类为"general-security issues",并细分为三大类:安全与保障、可控性、可信度。

为解决该问题,研究团队构建了针对性通用安全数据套件:通过数据收集、商业数据获取及高保真合生成成多种子语料;开发专用红队系统,程序化注入现实失败模式;同时生成无安全问题的黄金轨迹,用于后续SFT和RL后训练,核心目标是让代理在面对潜在安全陷阱时,能可靠选择安全行动路径、主动规避风险行为。

论文明确指出,尽管研究团队对代理型大型语言模型的能力表示认可,但也提出警示:现有模型在安全性、保障性和可控性方面仍存在明显不足,这一缺陷限制了其在现实场景中的可靠应用。研究团队呼吁AI社区持续关注此类现象及更广泛的AI安全议题,并在未来工作中推进系统性研究。

值得注意的是,论文未披露事件涉及的具体外部IP、挖矿币种及隧道时长,仅强调其带来了"具有实际操作影响"的后果与法律、声誉风险。目前,研究团队已在模型中施加更严格的限制,并优化了训练流程,该事件相关细节均以论文为公开记录,暂无额外最新置评。

来源:https://tech.ifeng.com/c/8rLmSTzffhj

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章
更多
Perplexity订阅收据查询指南:结算中心历史账单查找方法

Perplexity订阅收据查询指南:结算中心历史账单查找方法

Perplexity订阅收据由第三方支付平台管理。iOS macOS用户请在Apple账户的“购买记录”中查找;Android用户可在GooglePlay订单历史里查询;网页端用户可通过Stripe邮件中的链接登录客户门户获取历史发票。

时间:2026-05-14 08:55
即梦AI图文合成教程:如何添加与排版文字

即梦AI图文合成教程:如何添加与排版文字

即梦AI图文合成提供多种文字排版方法。文生图阶段可在提示词中用引号嵌入文字,实现图文一体渲染。智能排版助手能自动分析内容并优化布局。艺术字生成结合剪切蒙版可实现图像填充文字的高级效果。局部重绘功能则可对已有文字进行精准的位置与样式修正。

时间:2026-05-14 08:54
崔汉青谈具身智能发展 筑牢仿真底座加速产业落地

崔汉青谈具身智能发展 筑牢仿真底座加速产业落地

当智能经济的浪潮从虚拟信息空间涌向实体物理世界,一个根本性问题被推至台前:当人工智能不再仅处理文本与图像,而是要驱动机械臂精准操作、引导农机自主巡行于田间时,高质量的“数据燃料”从何而来?物理世界中复杂多变的运行逻辑,又该如何被高保真地数字化复现? 这并非空想。大模型的蓬勃发展,得益于互联网数十年积

时间:2026-05-14 08:54
香港科大提出渐进式学习新方法提升深度神经网络训练稳定性

香港科大提出渐进式学习新方法提升深度神经网络训练稳定性

人工智能训练常被视为充满复杂数学与庞大算力的领域,但其底层的一些核心挑战,其本质往往与人类学习的基本规律相通。一项由香港科技大学、萨里大学、香港大学及英伟达合作的研究,在2026年3月发布的预印本论文(arXiv:2603 05369v1)中,揭示了一个朴素而深刻的原理:让AI模型模仿人类“循序渐进

时间:2026-05-14 08:54
Kodiak AI折价融资致股价暴跌 盘后重挫37%

Kodiak AI折价融资致股价暴跌 盘后重挫37%

自动驾驶卡车公司KodiakAI完成1亿美元折价融资,股价盘后暴跌37%。融资以每股6 5美元进行,较市价折价近三成。公司一季度营收180万美元,但运营亏损达3780万美元,凸显资金消耗压力。业务方面,Kodiak与多家物流公司达成合作,推进自动驾驶货运试点,并计划在2026年底前实现高速公路无人驾驶运营。

时间:2026-05-14 08:54
热门专题
更多
刀塔传奇破解版无限钻石下载大全 刀塔传奇破解版无限钻石下载大全
洛克王国正式正版手游下载安装大全 洛克王国正式正版手游下载安装大全
思美人手游下载专区 思美人手游下载专区
好玩的阿拉德之怒游戏下载合集 好玩的阿拉德之怒游戏下载合集
不思议迷宫手游下载合集 不思议迷宫手游下载合集
百宝袋汉化组游戏最新合集 百宝袋汉化组游戏最新合集
jsk游戏合集30款游戏大全 jsk游戏合集30款游戏大全
宾果消消消原版下载大全 宾果消消消原版下载大全
  • 日榜
  • 周榜
  • 月榜
热门教程
更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程