中大郑子彬详解智能体评测体系如何赋能可信治理
如何有效应对智能体技术快速发展带来的安全挑战?这已成为人工智能领域亟待解决的核心课题。在近期一场以“共守智能体安全底线”为主题的“AI新治向”沙龙上,中山大学软件工程学院院长郑子彬教授从可信评测视角出发,为智能体安全治理提供了一套关键评估体系。他强调,当前智能体安全风险日益凸显,而监管技术发展相对滞后,亟需建立一套标准化、可落地的安全评测框架,以技术手段赋能监管,引导产业朝着安全、可信、可控的方向健康发展。

中山大学软件工程学院院长、教授郑子彬作主题分享。
深度解析智能体三大核心安全风险
回顾过去十年技术趋势,Gartner发布的年度战略科技预测中,人工智能相关关键词的演进脉络清晰:从“人工智能”到“生成式AI”,再演进至“智能体”及“多智能体”。至2026年,行业已正式进入智能体应用爆发期,其市场规模迅速扩张,并已成为消耗计算资源(Token)的核心主体。
智能体与大模型之间究竟存在何种关系?郑子彬教授将其形象地比喻为“协同互补关系”——智能体如同大模型的“四肢”,能够主动调用各类应用接口并访问互联网以执行复杂任务,从而有效弥补了大模型在行动能力上的局限。然而,这种强大的自主行动能力也带来了更为复杂的安全隐患。具体而言,风险主要集中体现在以下三个层面:
首先是数据隐私泄露风险。在人机交互过程中,用户个人敏感信息被意外泄露或非法收集的事件屡有发生。其次是输出可靠性问题。大模型本身存在的“幻觉”现象,可能导致其生成的内容与客观事实产生偏差,进而引发决策失误。最后,也是最为严峻的,是智能体行为失控风险。这包括智能体自主越权操作、盲目执行恶意指令、违规进行网络连接,甚至可能造成物理层面的损害。
针对行为风险,郑子彬以当前流行的智能体Skills(技能工具)为例进行了深入剖析。这些看似功能单一的技能文档,一旦被智能体加载运行,便会涉及工具调用权限、数据流向监控和操作边界界定等多个复杂维度,潜藏着不容忽视的安全威胁。他的研究团队曾对互联网上公开发布的超过10万个智能体Skills进行安全检测,结果发现其中有千余个存在越权访问、数据治理失控、恶意代码执行等多重安全隐患。这些风险对于普通用户而言难以识别,极易导致设备失控、隐私信息泄露等严重后果。例如,部分Skills会在后台秘密窃取用户的工作记录并发送至指定地址;有的则会将系统环境变量中的密钥信息隐藏于图片文件中进行外传。
面对日益增长的风险,全球范围内已展开治理行动。各国针对大模型及智能体技术相继出台了一系列法规与政策,尝试从分级分类管理、安全风险评估等多角度探索治理路径。但郑子彬指出一个关键矛盾:监管技术的研发缺乏足够的经济激励,多停留在宏观指导层面,实际落地效果有限;与之相对,大模型及智能体技术本身在强劲的市场需求驱动下发展迅猛。“监管的步伐常常难以跟上技术迭代的速度。”他呼吁,相关监管部门有必要加大对监管技术研发的投入与支持力度。
构建大模型及智能体可信评测体系是关键
那么,如何有效弥合前沿技术与滞后监管之间的鸿沟?郑子彬认为,构建一套科学、系统的大模型及智能体可信能力评测体系至关重要。他的团队曾对8款主流智能体框架的可信能力进行综合评测,结果显示,尽管部分框架在基础任务调度与感知解析方面表现良好,但在涉及安全伦理的风险防御、社会规则协同遵守以及特定垂直领域的专业合规能力上,多数框架存在明显短板。这种“能力失衡”现象暴露出行业在追求智能体高度自主化的同时,对安全底线的考量存在显著不足。
随着大模型及智能体在金融风控、医疗诊断、智慧教育等关键行业的深化应用,企业对系统运行稳定性、输出结果可靠性和潜在风险可控性的要求不断提升。核心需求已从早期的“功能实现”,全面转向对“安全可信、运行可靠、全程可控”的更高追求。在此背景下,企业迫切需要一套具备横向对比价值和实践指导意义的评测标准体系,用以辅助大模型选型、智能体框架评估、具体场景适配以及潜在安全风险识别。
郑子彬建议,行业应着力构建覆盖全维度、可实际落地的大模型及智能体安全评测规范,推动评测工作从理论走向实践。这不仅能够帮助企业精准发现漏洞、针对性优化升级,更代表了人工智能安全治理思路的一次重要转型——从被动的“合规约束”转向主动的“技术赋能”。通过专业的评测服务助力企业排查风险、优化模型,为智能体技术的合规应用与安全落地提供清晰的技术标尺与改进方向,从而推动整个产业链康、有序、可持续发展。
为此,其研究团队已初步构建了针对大模型和智能体的两套体系化评测框架。其中,大模型可信能力评测框架涵盖了安全性、可靠性、隐私保护等7大维度共37项细分指标;智能体可信能力评测框架则更为细致,覆盖行为合规、任务安全、数据治理等9大维度共68项细分指标。依托百万级评测数据积累,通过自动化检测工具与智能分析平台,能够为企业生成定制化的安全评估报告,精准定位其模型或智能体的具体风险点与薄弱环节。
本次“AI新治向”系列沙龙由粤港澳大湾区生成式人工智能安全发展联合实验室与南方都市报社联合主办,并得到广东省网络数据安全与个人信息保护协会的支持。活动汇聚了政府相关部门、司法机构代表、学术专家、企业界人士及媒体等多方力量,共同围绕国家网信办等三部门联合印发的《智能体规范应用与创新发展实施意见》核心要求,深入探讨智能体应用安全风险的底层生成逻辑,探索多元协同共治与创新实践方案。
出品:南都大数据研究院
采写:南都研究员 罗韵
摄影:南都N视频记者 袁炯贤
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
探访北京机器人训练中心现场实拍
美国媒体探访北京一处机器人训练中心,中国正系统性培训机器人进入劳动力市场。训练师通过动作捕捉等技术引导机器人学习分拣等技能,数据将联网共享以应对复杂环境。机器人已开始在餐饮、零售等行业试岗,目标是与人类协作完成危险或重复性劳动。
雷军反思小米SU7战略布局 五款车型角逐30万纯电市场
30万元以上高端纯电动汽车市场,始终是各大车企的核心战场。乘联会最新数据显示,虽然2026年第一季度该细分市场增速略有放缓,但其高客单价、强用户忠诚度以及显著的品牌溢价潜力,依然吸引着特斯拉、理想、蔚来等新势力品牌,以及传统豪华车企持续投入资源,竞争态势日趋白热化。 小米汽车将战略重心锁定在这一区间
雷军推出小米SU7标准版售价直降两万市场反响如何
在备受瞩目的小米汽车新品发布会上,预热已久的“入门款”车型YU7终于揭开了神秘面纱。值得注意的是,雷军特别强调,这款新车并非外界猜测的“青春版”或“低配版”,而是被正式定名为“标准版”。与此同时,原先的“标准版”车型则升级更名为“长续航版”。这一巧妙的命名调整,清晰地划分了产品序列的定位与差异。 那
具身智能企业出海四大路径解析
中国机器人出口增长迅速,但多数仍用于科研文娱。行业正转向工厂等真实场景,强调量产与稳定交付。企业出海呈现产品渗透、场景落地、生态卡位和部件嵌入四大路径,核心是从硬件销售转向可持续的产业闭环。竞争焦点已从技术叙事转向实际交付能力与商业化验证。
太平洋航运遭股东减持30.1万股 股价影响分析
5月19日,股东HeltKristian以每股约3 33港元减持太平洋航运30 1万股,涉资约100万港元。减持后其持股数量降至1318 3万股,持股比例相应下降。
- 日榜
- 周榜
- 月榜
1
2
3
4
5
6
7
8
9
10
相关攻略
2015-03-10 11:25
2015-03-10 11:05
2021-08-04 13:30
2015-03-10 11:22
2015-03-10 12:39
2022-05-16 18:57
2025-05-23 13:43
2025-05-23 14:01
热门教程
- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程
热门话题

