阿里巴巴与上海AI实验室联合发布人工智能白皮书

数码系统

相机 win10

测评 win11

手机智车

华为 Tesla

小米理想

苹果蔚来

游戏软件

LOL 抖音

原神微信

当前位置：首页

阿里巴巴与上海AI实验室联合发布人工智能白皮书

热心网友时间：2026-05-20

转载

在近日举行的上海浦江AI学术年会上，阿里巴巴集团与上海人工智能实验室联合发布了《守己利他：智能时代做负责任的技术》白皮书，为人工智能安全治理提供了新的实践框架。这份报告没有停留在理论探讨层面，而是精准剖析了当前AI智能体面临的核心安全挑战，并系统性地提出了“守己、利他、合作”三大行动准则，为行业健康发展指明了方向。

这已是阿里巴巴连续第四年发布人工智能治理相关实践成果。一个明确的趋势是，随着AI技术从“对话交互”迈向“自主执行”，其安全问题的复杂性与紧迫性已大幅提升，成为关乎技术信任与产业未来的关键。

智能体“很能干”，必须做到“很安全”

白皮书明确指出，安全能力已不再是人工智能研发的“可选项”，而是维系行业社会信任与可持续发展的“生命线”。阿里巴巴人工智能治理与可持续发展实验室负责人薛晖在发布会上强调：“当前，全球AI正从‘很能说’的对话阶段，进入‘很能干’的行动阶段。与之同步，我们必须确保其‘很安全’。”他进一步阐释，随着智能体在过去一年的快速普及，AI开始自主调度外部资源、执行复杂操作流程，其潜在的风险维度与影响范围正在集中显现。

面对这一趋势，仅靠事后补救的被动防御已显不足。阿里巴巴倡导的理念是，将安全基因深度融入从底层算力芯片、云计算平台、基础大模型到上层智能应用的全栈技术体系之中，力求在技术研发的源头构建防护机制，让AI产品“天生”具备更强的稳健性。同时，公司也秉持开源开放原则，将内部经过大规模业务验证的安全工具与标准作为公共产品向业界开放，旨在与千行百业的开发者共同推动“负责任的人工智能”理念落地。

让模型学习千万级漏洞，提升智能体内生安全能力

智能体面临的安全风险具体体现在哪些方面？阿里巴巴通义实验室安全负责人张荣用一个形象的比喻进行了解读：“普通用户自行组装一个智能体，就如同将保险箱放置在门口——虽然不一定立即出事，但安全屏障确实非常薄弱。”相比之下，像Qoder、MuleRun这类经过专业安全封装的企业级产品，通过内置的权限管控、行为审计与风险拦截机制，为智能体运行提供了体系化防护，其整体安全性自然更为可靠。

为系统化应对智能体可能遭遇的多样化威胁，阿里巴巴构建了一套立体纵深的安全防护体系。该体系的核心思路可归纳为两点：一是从源头强化基础大模型的“内生安全”能力，使其具备风险识别与规避的“免疫力”；二是在外围构建多层联动的“系统级”安全围栏，形成纵深防御，最终实现对智能体从指令理解、工具调用到结果执行的全生命周期风险管控。

张荣详细阐述了为何要聚焦于提升大模型的内生安全能力。他指出，在智能体的实际工作流中，工具调用与代码执行是安全风险最高发的两个环节，而这两个环节的可靠性都深度依赖于底层大模型的代码生成与逻辑推理质量。因此，增强通义千问大模型在编程与工具使用场景下的原生安全性与合规性，就成为保障上层智能体安全的重中之重。

具体如何实现？关键在于：用海量的真实漏洞数据来“教育”模型。阿里巴巴依托其二十多年顶级安全团队所积累的庞大攻防经验与代码审计数据库，基于千万级别的高质量真实漏洞样本，构建了专业的安全训练语料库。通过将这些语料深度整合进模型预训练、微调与对齐的各个阶段，并进行多轮严格的安全强化学习，通义千问模型所生成的代码在安全性上达到了业界领先水平。根据国际权威的代码安全评测基准SecCodeBench的评估结果，其安全性能在开源模型中持续保持领先地位。

来源:https://tech.huanqiu.com/article/4Qz2vCMmO0e

上一篇：浙大实现芯片设计自动化智能体驱动EDA全流程闭环

下一篇： Meta华人研究突破：AI智能体自进化新法则深度解析