当前位置: 首页
AI
谷歌DeepMind发布AI安全新框架,防范模型自行关闭等风险

谷歌DeepMind发布AI安全新框架,防范模型自行关闭等风险

热心网友 时间:2025-09-23
转载

9月22日,谷歌DeepMind宣布对其AI安全核心文件"前沿安全框架"进行重要更新,首次将"前沿AI可能阻止人类修改或关闭系统"这一风险考虑在内。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

据外媒Axios报道,最新测试显示部分新型AI模型已展现出自主制定计划以及使用欺骗手段达成目标的能力。

谷歌

此次更新特别新增了"说服力"风险评估类别,用于应对可能具备改变人类信念能力的AI模型。谷歌将这类风险定义为"有害操控"——特指那些能力强大且在特定高风险场景下可能被滥用于系统性改变人们认知和行为的AI系统。

当被问及防范措施时,DeepMind代表透露:"我们建立了全新的评估体系,通过人机交互实验持续监测这类能力的演变趋势。"

DeepMind表示将保持每年至少一次的框架更新频率,以跟踪新兴威胁并进行"关键能力评级"。谷歌特别警告,"若不采取防范措施,具备这些能力的先进AI模型可能带来严重后果。"

值得注意的是,OpenAI在2024年曾推出类似的风险准备框架,但于今年早些时候移除了"说服力"这一风险分类。

来源:https://www.ithome.com/0/884/937.htm

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章
更多
张阔:AI智能体如何推动中国“一人公司”规模化增长

张阔:AI智能体如何推动中国“一人公司”规模化增长

IT之家 3 月 30 日消息,在 AI 智能体的推动下,中国“一人公司”正在快速增长。当地时间 3 月 28 日,据《商业内幕》报道,阿里巴巴国际站总经理张阔表示,平台上已经明显感受到这一变化,目

时间:2026-03-30 09:19
微软暂缓部分核心招聘,以控制成本应对AI投入

微软暂缓部分核心招聘,以控制成本应对AI投入

IT之家 3 月 30 日消息,据科技媒体《The Information》援引三位知情员工消息报道,近几周,微软高管已通知云计算部门、北美销售团队等各大核心事业部管理层,暂停新员工招聘工作。报道称

时间:2026-03-30 09:13
苹果认清现实:错失大模型AI机遇后,重回硬件赛道

苹果认清现实:错失大模型AI机遇后,重回硬件赛道

库克手持iPhone 17 Pro 北京时间3月30日,据彭博社报道,苹果准备开放Siri等AI战略大调整表明,该公司正在重新致力于其核心商业模式:销售硬件和服务,依靠硬件搭建起类似于App Sto

时间:2026-03-30 09:07
北京亦庄人形机器人半程马拉松2026年奖金设定公布

北京亦庄人形机器人半程马拉松2026年奖金设定公布

IT之家 3 月 29 日消息,4 月 19 日,2026 北京亦庄半程马拉松暨人形机器人半程马拉松将正式开跑,最新现已公布完赛奖牌。据介绍,奖牌正面以机械机甲风为设计基调,通体采用金属质感锻造,线

时间:2026-03-30 09:01
硅谷巨头竞相投资!奶企AI项圈估值超20亿美元

硅谷巨头竞相投资!奶企AI项圈估值超20亿美元

新智元报道编辑:倾倾【新智元导读】这家新西兰的公司给奶牛戴上AI项圈,估值一年飙升20亿美元!Founders Fund领投,投资人抢到超额认购。它的秘密武器叫「Cowgorithm」——一套让牛自

时间:2026-03-29 18:49
热门专题
更多
刀塔传奇破解版无限钻石下载大全 刀塔传奇破解版无限钻石下载大全
洛克王国正式正版手游下载安装大全 洛克王国正式正版手游下载安装大全
思美人手游下载专区 思美人手游下载专区
好玩的阿拉德之怒游戏下载合集 好玩的阿拉德之怒游戏下载合集
不思议迷宫手游下载合集 不思议迷宫手游下载合集
百宝袋汉化组游戏最新合集 百宝袋汉化组游戏最新合集
jsk游戏合集30款游戏大全 jsk游戏合集30款游戏大全
宾果消消消原版下载大全 宾果消消消原版下载大全
  • 日榜
  • 周榜
  • 月榜
热门教程
更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程