首页
AI
国际研究警示:45%的AI生成新闻存重大事实偏差

国际研究警示:45%的AI生成新闻存重大事实偏差

热心网友
转载
2025-10-28

10月27日消息,欧洲广播联盟(EBU)与英国广播公司(BBC)共同主导的最新研究揭示,如今作为数百万人日常信息来源的人工智能助手,无论是使用哪种语言、身处哪个地区,或是在哪个AI平台上进行测试,经常歪曲新闻事实。

国际研究:AI 助手常歪曲新闻内容,45% 回答存重大问题

这项规模空前、覆盖范围最广的国际调研在EBU新闻大会上发布。来自18个国家、使用14种语言的22家公共媒体机构(PSM)参与了这项研究,揭示了四款主流AI工具存在的多项系统性问题。

据了解,各参与媒体的专业记者依据准确性、信息来源标注、事实与观点区分以及背景信息提供等关键标准,评估了ChatGPT、Copilot、Gemini和Perplexity生成的超过3000条回复内容。

主要研究发现包括:

所有人工智能回复中,有45%存在至少一个重大问题。

31%的回复存在严重的信息来源问题,包括缺失、误导或错误引用来源。

20%的回复存在重大准确性问题,包括虚构细节和过时信息。

Gemini的表现最不理想,其76%的回复存在显著问题,是其他AI助手的两倍以上,主要归因于其糟糕的信息溯源能力。

与BBC今年早些时候的研究结果相比,部分AI工具有所改进,但错误率仍处于高位。

人工智能助手正逐渐取代搜索引擎,成为用户获取信息的首选渠道。根据路透社新闻研究所的《2025年数字新闻报告》,全球有7%的在线新闻消费者通过AI助手获取新闻,而在25岁以下人群中,这一比例高达15%。

EBU媒体总监兼副执行干事让·菲利普·德滕德尔(Jean Philip De Tender)表示:“这项研究清楚表明,这些问题并非孤立事件,而是具有系统性、跨国界和多语种特征。我们认为,这正在危及公众对媒体的信任。当人们无法判断什么值得信赖时,最终可能什么都不再相信,而这将削弱民主社会的参与基础。”

BBC生成式人工智能项目总监彼得·阿彻(Peter Archer)指出:“我们对AI充满期待,相信它能帮助我们为受众创造更多价值。但前提是,人们必须能够信任他们所阅读、观看和接触的内容。尽管已有一定改善,但这些AI助手仍存在显著问题。我们希望这些技术能够成功,并愿意与AI企业合作,共同为受众和社会创造积极影响。”

研究团队同时发布了《AI助手新闻完整性工具包》(News Integrity in AI Assistants Toolkit),旨在为研究报告中揭示的问题提供实用解决方案。该工具包涵盖提升AI助手回应质量及增强用户媒介素养两个方面。基于本次研究中收集的大量案例与洞察,工具包聚焦两大核心问题:“什么样的AI助手回应才算优质?”以及“哪些问题亟需修复?”

此外,EBU及其成员机构正敦促欧盟及各监管机构严格执行有关信息真实性、数字服务法规和媒体多元化的现行法律。鉴于AI技术发展迅猛,持续开展独立监测至关重要。为此,EBU正在探索建立常态化、滚动式的研究机制,以长期跟踪AI助手的表现。

本次研究建立在BBC于2025年2月发布的初步研究基础之上,当时的研究首次揭示了AI在处理新闻内容方面的严重缺陷。此次第二阶段研究将范围扩展至全球,进一步证实了此类问题具有普遍性,而并非局限于特定语言、市场或某款AI助手。

另据BBC同日发布的补充研究显示,公众对AI助手用于新闻的使用习惯与认知也令人担忧:目前已有超过三分之一的英国成年人相信AI生成的新闻摘要具备准确性,而在35岁以下人群中,这一比例接近一半。

这些发现引发了深刻关切:许多人误以为AI生成的新闻摘要准确可靠,但事实并非如此;当他们发现错误时,往往会同时责怪新闻机构和AI开发者——即便错误完全由AI助手造成。长此以往,这类问题可能严重损害公众对新闻本身及其品牌的信任。

来源:https://www.ithome.com/0/892/544.htm

免责声明

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章

Thinking+Machines Lab突破:策略蒸馏让Qwen模型效果显著提升

近期,专注于人工智能研究的技术团队Thinking Machines Lab(TML)发布了一篇技术博客,详细阐述了其研发的“在策略蒸馏”训练方法。该方法通过融合强化学习的纠错机制与监督微调的密集反

2025-10-28.

软银注资225亿美元,加速OpenAI音乐模型开发与升级

路透社近日披露,日本软银集团正式通过一项重大投资决议,计划向美国人工智能企业OpenAI注入225亿美元资金,按当前汇率计算约合人民币1600余亿元。这笔巨额融资将主要用于支持OpenAI在人工智能

2025-10-28.

奥特曼筹办Merge Labs:以声波磁场技术打造无创脑机接口

据外媒援引知情人士消息,OpenAI首席执行官萨姆·奥尔特曼正在筹备一家名为Merge Labs的脑机接口初创企业,并已邀请加州理工学院生物分子工程专家米哈伊尔·夏皮罗加入核心创始团队。这一动向标志

2025-10-28.

LG发力半导体封装:液态与薄膜PID双方案布局后端材料

LG化学近日宣布,成功研发出用于半导体封装的液态感光绝缘材料(Photo Imageable Dielectric,简称PID),正式进军人工智能及高性能半导体市场。这一突破性材料作为半导体先进封装

2025-10-28.

无锡微研携手维谛技术:共建数据中心制冷新方案,推动行业升级

近日,无锡微研有限公司通过其最新微信公众号宣布,自2024年起,该公司已与全球数字基础设施领域领军企业维谛技术(VERTIV)建立合作关系,并成功跻身其供应链体系。随着数据中心行业需求的持续攀升,无

2025-10-28.

热门教程

更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程

最新下载

更多
极无双
极无双 角色扮演 2025-10-28更新
查看
不休骑士2手游
不休骑士2手游 角色扮演 2025-10-28更新
查看
蘑菇战争2
蘑菇战争2 棋牌策略 2025-10-28更新
查看
忘仙2
忘仙2 角色扮演 2025-10-28更新
查看
奇妙碰碰车
奇妙碰碰车 休闲益智 2025-10-28更新
查看
战地模拟器2
战地模拟器2 飞行射击 2025-10-28更新
查看
暗黑高校
暗黑高校 动作冒险 2025-10-28更新
查看
镜花奇缘手游
镜花奇缘手游 角色扮演 2025-10-28更新
查看
妖鸡三国手游
妖鸡三国手游 棋牌策略 2025-10-28更新
查看
决战平安京oppo
决战平安京oppo 角色扮演 2025-10-28更新
查看