当前位置: 首页
业界动态
谷歌AI概览准确率仅九成 易受虚假信息误导

谷歌AI概览准确率仅九成 易受虚假信息误导

热心网友 时间:2026-05-12
转载

《纽约时报》近期的一篇深度报道,将谷歌AI概览功能推向了舆论的风口浪尖。报道披露,该功能的准确率据称约为90%。这个数字看似令人鼓舞,但考虑到谷歌搜索引擎每年处理的查询量超过5万亿次,其潜在影响便不容小觑。即便仅有10%的误差率,也意味着每小时可能产生超过5700万条不准确信息,平均每分钟接近100万条。如此庞大的错误信息规模,足以引发所有依赖搜索引擎获取准确资讯的用户和专业人士的深度担忧。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

那么,这个90%的准确率数据从何而来?这源于一家名为Oumi的初创公司进行的一项基准测试。他们采用SimpleQA评估框架,对4326次谷歌搜索结果进行了深入分析。数据显示,去年10月,基于Gemini 2模型的AI概览准确率约为85%;而到了今年2月,迭代升级后的Gemini 3模型将这一数字提升至91%,呈现出稳步优化的趋势。

然而,实际情况远比单一数据复杂。首先,Oumi的评估方法本身主要依赖AI工具进行判断,其评估标准可能存在一定的主观性和偏差。其次,谷歌AI概览的一个显著特点是其生成的不确定性:针对同一搜索查询,它可能会产出不同的结果摘要。这种固有的不稳定性,使得“准确率”这一单一指标的参考价值大打折扣。

准确率提升背后:“信源不符”问题日益凸显

更值得关注的是另一个关键趋势。分析表明,AI生成的概览内容与其所引用的原始信息来源之间出现不符的比例正在急剧上升——从Gemini 2时期的37%,大幅攀升至Gemini 3阶段的56%。

这会导致怎样的用户体验困境?用户常常面临两种尴尬场景:要么,看到的AI摘要内容言之凿凿,但点击下方提供的参考链接后却发现原文所述截然不同;要么,摘要得出的结论本身正确,但其用来支撑该结论的引用链接,其内容却是错误的。这就像一个学生在考试中蒙对了答案,但解题过程却引用了错误的公式,其答案的可信度与学习价值自然受到严重质疑。

这种机制上的缺陷,甚至吸引了外界的针对性测试。有媒体记者曾专门发布了一篇包含明显虚假信息的博客文章,结果谷歌的AI概览在次日便引用了该博客作为信源。这一案例清晰地暴露了当前AI概览系统在抵御恶意操纵和甄别信息来源真实性方面,仍存在显著的脆弱性。

内容自相矛盾,持续消耗用户信任

在实际搜索中,令人困惑和矛盾的例子并不少见。例如,用户斯蒂芬・潘瓦西曾搜索传奇摔跤手胡克・霍根是否去世。AI概览明确地告诉他:“目前没有可信报告显示霍根已去世”。然而,就在这条看似安心的摘要下方,搜索引擎结果页却直接展示了一篇标题为“霍根之死谜团加深”的文章链接。

这种页面内部信息的直接冲突,让用户无所适从,不知该相信哪一个。它从根本上动摇了用户对AI生成内容可靠性的信任。当工具自身都无法保证其输出信息的内在同一性时,用户为了核实真相所付出的时间和精力成本反而可能变得更高。

核心问题梳理:

• 规模性风险:在万亿级别的年查询量背景下,90%的准确率意味着绝对数量庞大的潜在错误信息。

• 进步与隐患并存:模型准确率虽在提升,但其产出与信源脱节的比例却不降反升,已超过半数。

• 系统脆弱性凸显:AI摘要易受虚假信息干扰,且存在内容自相矛盾的情况,持续削弱用户信任度。

面对外界的广泛质疑,谷歌的官方回应将焦点引向了评估方法本身。公司发言人对Oumi的测试方式提出了异议,认为此类评估未能全面、真实地反映用户在日常搜索中的复杂行为和实际体验。这场关于“如何科学、公正地衡量AI搜索质量”的辩论与探讨,或许才刚刚拉开序幕。

来源:https://news.aibase.com/zh/news/26931

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章
更多
谷歌Gemini新增心理健康支持功能 投入三千万美元援助全球危机热线

谷歌Gemini新增心理健康支持功能 投入三千万美元援助全球危机热线

2026年4月,谷歌母公司Alphabet的一项新动作,将AI与公共健康服务的结合推到了聚光灯下。他们宣布,为旗下AI助手Gemini新增心理健康支持功能,使其能够智能识别用户对话中的自残、自杀倾向,并主动弹出救助入口。与此同时,Alphabet承诺在未来三年投入3000万美元,专门用于支持全球危机

时间:2026-05-12 22:06
Happy Horse视频模型超越Seedance2.0登顶AI榜单引热议

Happy Horse视频模型超越Seedance2.0登顶AI榜单引热议

2026年4月,全球AI视频生成领域迎来了一次里程碑式的突破。权威第三方评测平台Artificial Analysis旗下的AI Video Arena榜单完成重要更新,一个此前鲜为人知的模型——Happy Horse(含V1、V2版本)——异军突起,在综合评测中一举超越了连续三个月霸榜的Seeda

时间:2026-05-12 22:05
苹果MacBook Air M5降价150美元 端侧AI功能成亮点

苹果MacBook Air M5降价150美元 端侧AI功能成亮点

最近,苹果给自家搭载M5芯片的15英寸MacBook Air搞了个150美元的专属优惠,到手价直接压到了1200美元以下。这款机器可不简单,它支持最新的Wi-Fi 7技术,更重要的是,它内置了苹果的端侧AI框架——Apple Intelligence。这意味着,所有大模型的推理任务都能在本地完成,无

时间:2026-05-12 22:05
OpenClaw 4.5发布 自研多模态模型全面升级

OpenClaw 4.5发布 自研多模态模型全面升级

2026年4月,AI开发者社区迎来重磅更新:此前因接口调用权限被Claude官方封禁的开源框架OpenClaw,正式发布了4 5版本。在创始人Peter(被社区称为“龙虾之父”)的带领下,本次更新不仅移除了默认后端的Claude CLI,全面重构了核心的梦境记忆系统,还内置了视频生成、图像创作与音乐

时间:2026-05-12 22:05
谷歌地图整合Gemini AI生成图片功能 简化地点分享文案创作

谷歌地图整合Gemini AI生成图片功能 简化地点分享文案创作

2026年4月,谷歌正式发布了一项重要更新:其月活跃用户超过10亿的Google Maps应用,现已全面集成自研的Gemini多模态大模型,重磅推出AI自动生成图片描述功能。这意味着,当用户上传与地点相关的照片或视频时,系统能够智能识别画面中的关键元素,并自动生成匹配的说明文案,用户还可根据个人偏好

时间:2026-05-12 22:04
热门专题
更多
刀塔传奇破解版无限钻石下载大全 刀塔传奇破解版无限钻石下载大全
洛克王国正式正版手游下载安装大全 洛克王国正式正版手游下载安装大全
思美人手游下载专区 思美人手游下载专区
好玩的阿拉德之怒游戏下载合集 好玩的阿拉德之怒游戏下载合集
不思议迷宫手游下载合集 不思议迷宫手游下载合集
百宝袋汉化组游戏最新合集 百宝袋汉化组游戏最新合集
jsk游戏合集30款游戏大全 jsk游戏合集30款游戏大全
宾果消消消原版下载大全 宾果消消消原版下载大全
  • 日榜
  • 周榜
  • 月榜
热门教程
更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程