研究人员开发ScamAgent:实现诈骗通话全自主实施
研究人员指出,要抵御自主生成内容带来的安全威胁,防御系统必须从简单的提示词过滤,转向对用户意图的持续理解和监控。
来自美国罗格斯大学的研究员Sanket Badhe开发了一个名为ScamAgent的自主多轮对话AI框架,该框架展示了如何将大语言模型转化为实施全自动诈骗对话的工具。这套系统通过整合目标驱动的规划、上下文记忆以及实时的文本转语音技术,成功绕过了现有AI安全防护机制,模拟出高度逼真的社会工程学攻击。

架构创新:中央协调器管理欺诈策略
ScamAgent的架构设计有别于传统的提示词注入攻击,它采用了一个中央协调器来管理多轮交互中的对话状态和欺诈策略。当接收到恶意目标指令时,该智能体会通过目标分解技术,将整体攻击拆解为一系列看似无害的子目标序列,以此模拟人类诈骗者逐步获取受害者信任的完整过程。

绕过安全防护的四大核心技术
目标分解:攻击者将有害的最终目标拆分为一系列看似无害的步骤。因此,防御机制需要能够监控整个多轮对话的过程。欺骗与角色扮演:恶意请求被隐藏在虚构的故事或预设的角色背景中。可通过阻止身份冒充和限制AI的角色扮演行为来缓解此类风险。上下文记忆:系统会记住过往的对话响应,并据此调整后续的诈骗策略。限制历史记忆的长度可以有效降低攻击成功的风险。实时文本转语音:将生成的文本转换为逼真的诈骗语音。在对音频输出前进行内容检查,有助于防止相关技术被滥用。
在五种常见诈骗场景的实验中,ScamAgent展现出其颠覆标准模型对齐与安全协议规则的高度有效性。针对直接恶意查询,模型的拒绝率为84%至100%,而该框架通过分散恶意意图,将拒绝率成功降低到17%至32%。

值得注意的是,在职业身份诈骗模拟中,Meta的LLaMA3-70B模型以74%的完整对话完成率位居首位,且所有子任务均未触发安全停止机制。
防御建议:从简单过滤转向持续监控
研究人员建议,针对自主生成内容的安全威胁,防护体系需要实现从简单关键词过滤到持续理解用户意图的监控模式的转变。建议AI平台的提供商和安全团队实施多层防御策略,包括部署用于预测长期对话结果的序列分类器,以及对模型记忆保留功能实施严格的控制措施。
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
诺奖得主迈克尔·莱维特分享科研乐趣
近日,第七届上海创新创业青年50人论坛于上海中心成功举办,本届论坛主题紧扣“青年与城市共成长”。在论坛现场,2013年诺贝尔化学奖得主、斯坦福大学结构生物学教授迈克尔·莱维特分享了他真挚的体会:获得诺贝尔奖彻底改变了他的人生轨迹。他着重指出,包括他在内的诺奖获得者以及广大杰出科学家,肩负着一项重要使
曹操出行定制Robotaxi Eva Cab能否开启盈利新篇章
2026年北京车展上,一个重磅消息吸引了全行业的注意:吉利集团旗下的曹操出行,正式发布了其首款专为无人驾驶场景设计的Robotaxi原型车——Eva Cab。这不仅仅是一款新车亮相,更标志着一家拥有十年运营经验的传统出行平台,开始向自动驾驶科技领域进行系统性、战略性的全面转型。与许多“改装派”不同,
数据中心次声波污染影响周边居民健康引发投诉
数据中心项目因对电价的影响而常遭居民抵制,如今另一种投诉正变得越来越普遍——噪音污染。这其中,有一种特殊形式叫次声波:人耳听不见,身体却能感觉到,不少人都说它会引发头痛、失眠、恶心甚至焦虑。当然,普通的噪音问题也同样突出。 根据环境与能源研究研究所(EESI)的数据,这类工业场地产生的高频和低频声响
长三角新能源汽车产业链四小时高铁可达 一体化发展典范
在“十五五”规划建议中,“优化区域经济布局,促进区域协调发展”被置于战略高度。这一部署深刻指向中国未来经济增长的核心动力源。近期,全国政协常委、上海公共外交协会会长周汉民在一次专题报告中,精准阐释了其内在逻辑与关键路径。 周汉民指出,京津冀、长三角和粤港澳大湾区这三大核心区域的经济总量已占据全国近半
太平洋深渊科考航次圆满收官 揭秘全球深海探索计划
历经156个日夜,总航程突破4万公里,一场横跨太平洋的深海科考壮举圆满落幕。5月10日,“探索一号”科考船携“奋斗者”号全海深载人潜水器成功返回广州母港,宣告了我国主导的“全球深渊探索计划”太平洋穿越航次取得全面成功。本次科考还同步完成了首次中国—智利阿塔卡马海沟联合深潜任务,成果丰硕。 本次深远海
- 日榜
- 周榜
- 月榜
1
2
3
4
5
6
7
8
9
10
相关攻略
2015-03-10 11:25
2015-03-10 11:05
2021-08-04 13:30
2015-03-10 11:22
2015-03-10 12:39
2022-05-16 18:57
2025-05-23 13:43
2025-05-23 14:01
热门教程
- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程
热门话题

