当前位置: 首页
科技数码
AI模型存储版权风险解析:畅销书逐字复现警示

AI模型存储版权风险解析:畅销书逐字复现警示

热心网友 时间:2026-02-24
转载

2月24日,IT之家发布消息称,全球顶尖人工智能模型通过特定提示词,能够生成与畅销小说内容几乎逐字相同的文本,这对AI行业声称其系统不存储受版权保护作品的说法提出了新的质疑。


近期多项研究表明,来自OpenAI、谷歌、Meta、Anthropic和xAI的大语言模型,对训练数据的记忆能力远超此前认知。

AI与法律专家向媒体透露,这种"记忆"能力可能对全球AI企业应对数十起版权诉讼产生重大影响,直接动摇了这些企业的核心抗辩理由:大语言模型只是从受版权保护作品中"学习",而非存储副本。

伦敦帝国理工学院应用数学与计算机科学教授指出:"越来越多证据表明,模型记忆现象比此前认为的更为普遍。"

长期以来,AI企业均否认存在记忆行为。在2024年致美国版权局的一封信中,谷歌曾表示:"模型本身并不存储训练数据副本,无论文本、图像或其他格式。"

AI行业还主张,使用受版权书籍训练模型属于"合理使用",认为该技术将原作品转化为具有全新意义的内容。

但上月发布的一项研究显示,斯坦福大学与耶鲁大学研究人员通过针对性提示词,成功让OpenAI、谷歌、Anthropic和xAI的大语言模型,输出了多部作品的数千字内容。

通过让模型补全书中句子,谷歌Gemini 2.5高精度重现了小说76.8%的内容,xAI的Grok 3则生成了70.3%。研究人员还通过特殊技术绕过了Anthropic的Claude 3.7 Sonnet的安全限制,几乎提取了整部小说的完整原文。

这一结论建立在去年一项研究基础之上:该研究发现,Meta的Llama等开源模型,会记住训练数据中特定书籍的大量内容。

此前AI专家并不确定,安全防护更严格、能阻止不当内容生成的闭源模型,是否也会出现大规模记忆现象。

参与该研究的耶鲁大学研究员表示:"尽管设有防护机制,模型仍能记住整段文本,这令人意外。"

研究人员尚未弄清大语言模型为何会记住训练数据中的内容,也不清楚模型输出中会体现多少训练数据。

这种记忆特性还可能对医疗、教育等其他领域产生严重影响,训练数据泄露可能引发隐私与保密问题。

法律专家表示,这可能使AI企业面临重大版权侵权责任,并影响其模型训练方式与研发成本。

英国品诚梅森律师事务所知识产权合伙人称,这些研究发现"可能对那些主张AI模型不存储、不复制任何版权作品的观点构成挑战"。

AI模型是否记忆训练数据,已成为近期版权法律纠纷的关键因素。美国一家法院去年裁定,Anthropic使用部分受版权内容训练大语言模型可被视为合理使用,因其具有"转化性"。但法院同时认定,存储盗版作品"本质上、无可挽回地构成侵权",最终该AI企业以巨额达成和解。

德国去年11月的一项判决认定,OpenAI因模型记忆歌词侵犯版权。此案由词曲作者及出版商协会提起,被视为欧盟标志性判例。

美国律师事务所合伙人认为,无需特殊技术即可完整复制一整本书"显然构成版权侵权",但问题在于"此类情况是否普遍到足以让AI模型承担连带侵权责任"。

Anthropic表示,斯坦福与耶鲁研究中使用的特殊技术对普通用户并不实用,提取文本所需成本高于直接购买作品。该公司还称,其模型不存储特定数据集副本,只是学习训练数据中词汇与字符的模式和关联关系。

xAI、OpenAI和谷歌均未回应置评请求。

帝国理工学院的教授指出,AI实验室设置防护机制防止训练数据被提取,这一事实本身就说明他们知晓问题存在。

芝加哥大学计算机科学教授质疑,AI实验室从一开始是否真的需要使用受版权内容来训练前沿模型。"无论技术上能否实现,问题在于我们应不应该这么做。"教授表示,"法律层面最终应坚守立场,成为整个过程的裁决者。"

来源:https://www.163.com/dy/article/KMHDFHE80511B8LM.html

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章
更多
联想天禧AI 40发布携手生态伙伴共建万亿Token大模型

联想天禧AI 40发布携手生态伙伴共建万亿Token大模型

联想发布天禧AI4 0,从“副驾驶”升级为主动规划的“专属超能搭档”。其基于“天禧Claw”架构,具备仿生记忆等能力,并通过混合部署实现精准、安全、低成本。新品覆盖AIPC、平板及手机,均获国家L3级智能认证。联想同步启动“苍穹计划”,投入万亿算力与千万基金,构建开放生态,推动AI共创。

时间:2026-05-21 12:40
AI竞争核心是电力竞争算电协同已成关键

AI竞争核心是电力竞争算电协同已成关键

全球人工智能竞争已演变为能源竞争,算力与电力协同成为关键。我国面临算力需求与电力资源区域错配的挑战,需推动算电深度融合,优化布局以提升能效。通过柔性调节算力负荷、配套新能源电站,算力中心可从耗能者转变为电力系统调节器,这关乎能源与算力安全,也是提升AI竞争力和实。

时间:2026-05-21 12:40
哈博森黑鹰4号无人机发布 4K拍摄16公里图传续航28分钟获飞行认证

哈博森黑鹰4号无人机发布 4K拍摄16公里图传续航28分钟获飞行认证

随着全球无人机监管政策日趋严格,产品合规性已成为消费者选购的重要考量。近日,哈博森官方正式宣布,其全新推出的黑鹰4号航拍无人机已成功通过中国民航局UOM RID(无人机云系统与远程识别)合规认证,并同步公开了核心性能参数。这意味着,该机型在上市之初即具备了在现行及未来更严格空域管理法规下合法飞行的“

时间:2026-05-21 12:40
微星尊爵系列轻薄本续航实测 超强性能与便携体验

微星尊爵系列轻薄本续航实测 超强性能与便携体验

在移动办公与多场景便携使用成为主流的今天,笔记本电脑的续航能力早已跃升为用户选购的核心指标。长久以来,轻薄本不仅在性能上有所妥协,受限于机身尺寸与电池容量,其续航表现也始终难有突破。而搭载全新Panther Lake平台的微星尊爵系列,凭借以“流畅无界,自由随心”为目标打造的全新模具,实现了轻薄本的

时间:2026-05-21 12:40
孙东旭离职半年后直播卖书登顶东方甄选前CEO首播引关注

孙东旭离职半年后直播卖书登顶东方甄选前CEO首播引关注

前东方甄选CEO孙东旭离职半年后于5月20日低调复出直播,以居家聊天讲书形式亮相,未提过往风波。两小时直播登上抖音书籍榜首位,其清瘦状态引关注。孙东旭曾因“小作文风波”离职,此次表示仅为尝试,未来未定,复播引发对其动机与前景的讨论。

时间:2026-05-21 12:39
热门专题
更多
刀塔传奇破解版无限钻石下载大全 刀塔传奇破解版无限钻石下载大全
洛克王国正式正版手游下载安装大全 洛克王国正式正版手游下载安装大全
思美人手游下载专区 思美人手游下载专区
好玩的阿拉德之怒游戏下载合集 好玩的阿拉德之怒游戏下载合集
不思议迷宫手游下载合集 不思议迷宫手游下载合集
百宝袋汉化组游戏最新合集 百宝袋汉化组游戏最新合集
jsk游戏合集30款游戏大全 jsk游戏合集30款游戏大全
宾果消消消原版下载大全 宾果消消消原版下载大全
  • 日榜
  • 周榜
  • 月榜
热门教程
更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程