Adobe因AI训练滥用盗版书籍面临集体诉讼
12月18日讯,据外媒TechCrunch报道,作家伊丽莎白·里昂近日对Adobe发起一项新的集体诉讼,指控其在训练SlimLM语言模型时,使用了大量盗版书籍数据,其中包括里昂本人的作品。里昂来自俄勒冈州,长期从事非虚构写作,并出版过多本写作指导类书籍。
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
Adobe方面介绍,SlimLM是一套面向移动设备文档辅助场景的小型语言模型,其预训练基础为SlimPajama-627B数据集。该数据集由Cerebras于2024年发布,被描述为一个经过去重、涵盖多语言的开源集合。然而诉状指出,SlimPajama的数据来源本身就存在问题。
诉讼文件显示,SlimPajama是在复制并加工RedPajama数据集的基础上生成的,而RedPajama包含了备受争议的Books3数据集。Books3收录了约19.1万本图书,其中包含大量受版权保护的作品。
诉状明确指出,作为RedPajama的派生数据集,SlimPajama同样包含了Books3中的内容,因此不可避免地纳入了原告及其他作者的版权作品。
围绕Books3和RedPajama的争议,早已不止于Adobe。此前,苹果和Salesforce均因涉嫌在AI训练中使用相关数据集而遭到起诉,相关案件指控企业未经授权使用受版权保护内容。
在更广泛的行业背景下,类似诉讼正在成为常态。AI模型对训练数据规模的高度依赖,使得数据来源问题频频引发法律风险。今年9月,Anthropic同意向多名作者支付1.5亿美元(注:按现行汇率约合105.77亿元人民币),就其训练Claude时使用盗版作品的指控达成和解。该案被外界视为AI训练版权争议的重要节点,然而行业内持续扩大的法律挑战仍未终结。
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
高通AI研究:用更少文字解决复杂问题的智能思考方法
这项由高通AI研究院主导的突破性研究,于2026年3月以预印本论文形式发布。它直指一个长期困扰AI发展的核心痛点:当我们试图让AI模仿人类“逐步思考”时,它们往往会陷入一种低效的“话痨”模式,产生大量冗余、重复的文本,既拖慢了响应速度,也浪费了宝贵的计算资源。 不妨做个类比:你向一位聪明的学生请教数
华中科大团队突破AI空间感技术解决方向感缺失难题
你是否曾向AI助手发出过“描述桌子右边有什么”或“找找沙发后面的东西”这样的指令,却得到了令人困惑的回应?这背后的核心原因在于,当前主流的多模态大模型虽然具备出色的物体识别能力,却普遍缺乏对三维空间的真实“感知”。它们如同仅通过二维照片认识世界,难以准确判断物体的相对方位、深度距离以及复杂的遮挡关系
摩尔线程携手光轮智能战略合作 共研高置信度仿真数据合成方案
近日,国内领先的GPU企业摩尔线程与前沿AI公司光轮智能正式宣布达成深度战略合作。双方的核心目标,是共同构建一套高置信度、可规模化的仿真数据合成解决方案。此举被业界广泛解读为,旨在为具身智能(Embodied AI)的长期演进与发展,筑牢一项自主可控的关键性数字基础设施。 具身智能,简而言之,是赋予
IBM推出VAREX基准测试评估AI解读政府表格能力
这项由IBM Research主导的研究,于2026年3月正式发布于arXiv预印本平台(论文编号:arXiv:2603 15118v1)。研究团队构建了一个名为VAREX的全新评估基准,其核心目标在于系统性地评测各类AI模型在理解与提取政府表格信息上的真实性能。 我们可以将AI模型想象成一位新入职
德克萨斯农工大学揭示AI视频生成时空错乱原因
德克萨斯农工大学的研究团队近期取得了一项突破性进展,揭示了当前AI视频生成技术中一个普遍存在却长期被忽略的核心缺陷。你是否也曾感到AI生成的视频“总有些别扭”?比如蜂鸟振翅显得过于缓慢,或者人物动作的节奏如同水下镜头般迟滞——你的直觉没错,问题的根源恰恰在于AI对“时间”的感知完全失准。 研究人员将
- 日榜
- 周榜
- 月榜
1
2
3
4
5
6
7
8
9
10
相关攻略
2015-03-10 11:25
2015-03-10 11:05
2021-08-04 13:30
2015-03-10 11:22
2015-03-10 12:39
2022-05-16 18:57
2025-05-23 13:43
2025-05-23 14:01
热门教程
- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程
热门话题

