阿里巴巴与上海AI实验室联合发布人工智能白皮书
在近日举行的上海浦江AI学术年会上,阿里巴巴集团与上海人工智能实验室联合发布了《守己利他:智能时代做负责任的技术》白皮书,为人工智能安全治理提供了新的实践框架。这份报告没有停留在理论探讨层面,而是精准剖析了当前AI智能体面临的核心安全挑战,并系统性地提出了“守己、利他、合作”三大行动准则,为行业健康发展指明了方向。
这已是阿里巴巴连续第四年发布人工智能治理相关实践成果。一个明确的趋势是,随着AI技术从“对话交互”迈向“自主执行”,其安全问题的复杂性与紧迫性已大幅提升,成为关乎技术信任与产业未来的关键。

智能体“很能干”,必须做到“很安全”
白皮书明确指出,安全能力已不再是人工智能研发的“可选项”,而是维系行业社会信任与可持续发展的“生命线”。阿里巴巴人工智能治理与可持续发展实验室负责人薛晖在发布会上强调:“当前,全球AI正从‘很能说’的对话阶段,进入‘很能干’的行动阶段。与之同步,我们必须确保其‘很安全’。”他进一步阐释,随着智能体在过去一年的快速普及,AI开始自主调度外部资源、执行复杂操作流程,其潜在的风险维度与影响范围正在集中显现。
面对这一趋势,仅靠事后补救的被动防御已显不足。阿里巴巴倡导的理念是,将安全基因深度融入从底层算力芯片、云计算平台、基础大模型到上层智能应用的全栈技术体系之中,力求在技术研发的源头构建防护机制,让AI产品“天生”具备更强的稳健性。同时,公司也秉持开源开放原则,将内部经过大规模业务验证的安全工具与标准作为公共产品向业界开放,旨在与千行百业的开发者共同推动“负责任的人工智能”理念落地。
让模型学习千万级漏洞,提升智能体内生安全能力
智能体面临的安全风险具体体现在哪些方面?阿里巴巴通义实验室安全负责人张荣用一个形象的比喻进行了解读:“普通用户自行组装一个智能体,就如同将保险箱放置在门口——虽然不一定立即出事,但安全屏障确实非常薄弱。”相比之下,像Qoder、MuleRun这类经过专业安全封装的企业级产品,通过内置的权限管控、行为审计与风险拦截机制,为智能体运行提供了体系化防护,其整体安全性自然更为可靠。
为系统化应对智能体可能遭遇的多样化威胁,阿里巴巴构建了一套立体纵深的安全防护体系。该体系的核心思路可归纳为两点:一是从源头强化基础大模型的“内生安全”能力,使其具备风险识别与规避的“免疫力”;二是在外围构建多层联动的“系统级”安全围栏,形成纵深防御,最终实现对智能体从指令理解、工具调用到结果执行的全生命周期风险管控。
张荣详细阐述了为何要聚焦于提升大模型的内生安全能力。他指出,在智能体的实际工作流中,工具调用与代码执行是安全风险最高发的两个环节,而这两个环节的可靠性都深度依赖于底层大模型的代码生成与逻辑推理质量。因此,增强通义千问大模型在编程与工具使用场景下的原生安全性与合规性,就成为保障上层智能体安全的重中之重。
具体如何实现?关键在于:用海量的真实漏洞数据来“教育”模型。阿里巴巴依托其二十多年顶级安全团队所积累的庞大攻防经验与代码审计数据库,基于千万级别的高质量真实漏洞样本,构建了专业的安全训练语料库。通过将这些语料深度整合进模型预训练、微调与对齐的各个阶段,并进行多轮严格的安全强化学习,通义千问模型所生成的代码在安全性上达到了业界领先水平。根据国际权威的代码安全评测基准SecCodeBench的评估结果,其安全性能在开源模型中持续保持领先地位。
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
工具调用JSON数据格式的可靠性保障机制解析
前几天,一位正在研究Agent的朋友在群里提了个问题,问得特别到位: Tool Call似乎是Agent循环的灵魂,但如果JSON返回总是不对劲,那现在这么繁荣的Agent生态怎么可能存在呢?所以,这个问题是从什么时候开始被解决的?是在Function Calling时代就解决了吗? 这个问题确实问
中关村论坛智能体解决方案:枫清科技赋能智慧交流
【科技深度观察】2026年4月1日,中关村论坛年会现场,一场以“科技赋能智慧论坛,智能服务美好生活”为主题的创新实践正式亮相。中关村国际会展公司与枫清科技达成战略合作,将领先的人工智能技术全面植入论坛运营体系,共同研发并推出了“中关村论坛智能体”这一综合性智慧会展解决方案。 在近期举行的科技办会专题
湖南科职携手360共建AI数字安全人才培养基地
4月1日,湖南科技职业学院与360数字安全集团携手,成功举办了一场主题为“龙虾智安·产教融合”的技术讲座与体验活动,为校园注入了前沿科技活力。 本次活动聚焦人工智能智能体技术进校园,吸引了信息工程学院、计算机应用技术等专业的师生踊跃参与,同时邀请了长沙天心经开区产业园的技术骨干及周边合作院校师生代表
哈萨比斯传记揭秘鲜为人知的幕后故事
读完这本关于德米斯·哈萨比斯的最新传记,一个更立体、更出人意料的谷歌AI掌门人形象跃然纸上。这位公认的天才,远不止是聚光灯下那位冷静的科学家。 比如,他曾试图“智取”深度学习教*父杰弗里·辛顿。在辛顿那场著名的初创公司拍卖夜,DeepMind也参与了竞标,出价1000万美元。发现竞争过于激烈后,哈萨
血液检测新突破:AI模型精准识别多种神经退行性疾病
神经退行性疾病的早期精准诊断,始终是临床医学与科研领域的重大挑战。由于多种疾病在发病初期的临床表现高度相似,且患者脑内可能并存多种病理变化,仅凭症状进行鉴别诊断往往困难重重。然而,一项来自瑞典科学家的最新突破,为这一困境带来了极具前景的解决方案。 近期,由隆德大学等顶尖机构组成的研究团队宣布,他们成
- 日榜
- 周榜
- 月榜
1
2
3
4
5
6
7
8
9
10
相关攻略
2015-03-10 11:25
2015-03-10 11:05
2021-08-04 13:30
2015-03-10 11:22
2015-03-10 12:39
2022-05-16 18:57
2025-05-23 13:43
2025-05-23 14:01
热门教程
- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程
热门话题

