国际研究警示：45%的AI生成新闻存重大事实偏差

数码系统

相机 win10

测评 win11

手机智车

华为 Tesla

小米理想

苹果蔚来

游戏软件

LOL 抖音

原神微信

当前位置：首页

国际研究警示：45%的AI生成新闻存重大事实偏差

热心网友时间：2025-10-28

转载

10月27日消息，欧洲广播联盟（EBU）与英国广播公司（BBC）共同主导的最新研究揭示，如今作为数百万人日常信息来源的人工智能助手，无论是使用哪种语言、身处哪个地区，或是在哪个AI平台上进行测试，经常歪曲新闻事实。

国际研究：AI 助手常歪曲新闻内容，45% 回答存重大问题

这项规模空前、覆盖范围最广的国际调研在EBU新闻大会上发布。来自18个国家、使用14种语言的22家公共媒体机构（PSM）参与了这项研究，揭示了四款主流AI工具存在的多项系统性问题。

据了解，各参与媒体的专业记者依据准确性、信息来源标注、事实与观点区分以及背景信息提供等关键标准，评估了ChatGPT、Copilot、Gemini和Perplexity生成的超过3000条回复内容。

主要研究发现包括：

所有人工智能回复中，有45%存在至少一个重大问题。

31%的回复存在严重的信息来源问题，包括缺失、误导或错误引用来源。

20%的回复存在重大准确性问题，包括虚构细节和过时信息。

Gemini的表现最不理想，其76%的回复存在显著问题，是其他AI助手的两倍以上，主要归因于其糟糕的信息溯源能力。

与BBC今年早些时候的研究结果相比，部分AI工具有所改进，但错误率仍处于高位。

人工智能助手正逐渐取代搜索引擎，成为用户获取信息的首选渠道。根据路透社新闻研究所的《2025年数字新闻报告》，全球有7%的在线新闻消费者通过AI助手获取新闻，而在25岁以下人群中，这一比例高达15%。

EBU媒体总监兼副执行干事让·菲利普·德滕德尔（Jean Philip De Tender）表示：“这项研究清楚表明，这些问题并非孤立事件，而是具有系统性、跨国界和多语种特征。我们认为，这正在危及公众对媒体的信任。当人们无法判断什么值得信赖时，最终可能什么都不再相信，而这将削弱民主社会的参与基础。”

BBC生成式人工智能项目总监彼得·阿彻（Peter Archer）指出：“我们对AI充满期待，相信它能帮助我们为受众创造更多价值。但前提是，人们必须能够信任他们所阅读、观看和接触的内容。尽管已有一定改善，但这些AI助手仍存在显著问题。我们希望这些技术能够成功，并愿意与AI企业合作，共同为受众和社会创造积极影响。”

研究团队同时发布了《AI助手新闻完整性工具包》（News Integrity in AI Assistants Toolkit），旨在为研究报告中揭示的问题提供实用解决方案。该工具包涵盖提升AI助手回应质量及增强用户媒介素养两个方面。基于本次研究中收集的大量案例与洞察，工具包聚焦两大核心问题：“什么样的AI助手回应才算优质？”以及“哪些问题亟需修复？”

此外，EBU及其成员机构正敦促欧盟及各监管机构严格执行有关信息真实性、数字服务法规和媒体多元化的现行法律。鉴于AI技术发展迅猛，持续开展独立监测至关重要。为此，EBU正在探索建立常态化、滚动式的研究机制，以长期跟踪AI助手的表现。

本次研究建立在BBC于2025年2月发布的初步研究基础之上，当时的研究首次揭示了AI在处理新闻内容方面的严重缺陷。此次第二阶段研究将范围扩展至全球，进一步证实了此类问题具有普遍性，而并非局限于特定语言、市场或某款AI助手。

另据BBC同日发布的补充研究显示，公众对AI助手用于新闻的使用习惯与认知也令人担忧：目前已有超过三分之一的英国成年人相信AI生成的新闻摘要具备准确性，而在35岁以下人群中，这一比例接近一半。

这些发现引发了深刻关切：许多人误以为AI生成的新闻摘要准确可靠，但事实并非如此；当他们发现错误时，往往会同时责怪新闻机构和AI开发者——即便错误完全由AI助手造成。长此以往，这类问题可能严重损害公众对新闻本身及其品牌的信任。

来源:https://www.ithome.com/0/892/544.htm

上一篇： Take-Two CEO谈AI局限：人类创造力才是爆款游戏的真正核心

下一篇：谷歌地球AI升级：接入Gemini大模型，聊天识别风暴灾害