当前位置: 首页
AI
研究警示:五大AI平台半数医学建议存疑,使用需谨慎

研究警示:五大AI平台半数医学建议存疑,使用需谨慎

热心网友 时间:2026-05-19
转载

慎用AI,研究称五大头部AI平台50%医学建议“有问题”

当身体出现不适,你的第一反应是打开搜索引擎,还是问问AI?一项最新的研究结果,或许能给这股“AI问诊”的热潮泼上一盆理性的冷水。

北京时间4月15日,彭博社报道指出,一项发表于权威医学期刊《BMJ Open》的研究揭示,AI驱动的聊天机器人在提供医学建议时,大约有一半的概率会给出“有问题”的答案。这无疑为这项正快速渗透我们日常生活的技术,敲响了关于健康风险的警钟。

研究如何进行的?

来自美国、加拿大和英国的研究团队,将目光投向了当前最主流的五大AI平台:ChatGPT、Gemini、Meta AI、Grok以及DeepSeek。他们的评估方法直接而系统:在五个不同的健康类别下,向每个平台提出10个问题,然后对答案进行专业评判。

结果令人深思。在所有收集到的回答中,约有50%被认定为“有问题”,而其中近20%更是被划为“高度有问题”的范畴。这意味着,当你向这些AI咨询健康问题时,拿到不准确或不完整建议的可能性,并非小概率事件。

慎用AI,研究称五大头部AI平台50%医学建议“有问题”

(图示:黄色代表“有问题”的回答,橙色代表“高度有问题”的回答)

AI的“偏科”与“自信”

进一步分析发现,这些AI的表现存在明显的“偏科”现象。在面对诸如疫苗有效性、癌症筛查建议等封闭式、事实性较强的问题时,它们的回答相对更可靠。然而,一旦问题转向开放式咨询,或者涉及干细胞疗法、营养学等复杂且前沿的领域,AI的表现就开始大幅下滑,错误率和误导性显著增加。

更值得警惕的是研究指出的另一个共性:这些AI在给出回答时,往往带着一种“自信而确定”的口吻。但仔细审视就会发现,没有一个聊天机器人能在回答任何问题时,提供完整且准确的参考文献列表来支撑其观点。换句话说,它们说得“很肯定”,但依据却“不透明”。在整个研究过程中,仅有Meta AI出现过两次拒绝回答的情况,其他平台几乎是有问必答,无论其知识边界是否覆盖。

热潮背后的隐忧

这项研究之所以重要,是因为它精准地戳中了一个现实矛盾:公众对AI健康咨询的需求正在爆炸式增长,但这些平台本身,既未获得提供医学建议的执业许可,也缺乏人类医生所具备的临床判断与情境化分析能力。

数据显示,仅OpenAI的ChatGPT,每周就有超过2亿人咨询健康和保健问题。巨大的需求也催生了市场的快速跟进,今年1月,OpenAI宣布将推出面向普通用户和临床医生的健康工具,Anthropic公司也为其Claude产品规划了新的医疗保健服务。

然而,研究的作者们明确指出,如果在缺乏充分公众教育和有效监管的情况下匆忙部署这些健康聊天机器人,一个巨大的风险在于——它们可能成为错误信息的“放大器”。那些听起来权威、实则存在缺陷的回答,一旦被广泛传播和采信,后果不堪设想。

研究结论呼吁,必须重新评估AI聊天机器人在面向公众的健康沟通中的角色与部署方式。技术的进步带来了便利,但在关乎生命的医疗健康领域,审慎与验证永远应该排在盲目信任之前。毕竟,当健康遇到问题时,一个负责任的答案,远比一个快速却存疑的答案重要得多。

来源:https://tech.ifeng.com/c/8sKwBIZdX0Y

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章
更多
研究警示:五大AI平台半数医学建议存疑,使用需谨慎

研究警示:五大AI平台半数医学建议存疑,使用需谨慎

当身体出现不适,你的第一反应是打开搜索引擎,还是问问AI?一项最新的研究结果,或许能给这股“AI问诊”的热潮泼上一盆理性的冷水。 北京时间4月15日,彭博社报道指出,一项发表于权威医学期刊《BMJ Open》的研究揭示,AI驱动的聊天机器人在提供医学建议时,大约有一半的概率会给出“有问题”的答案。这

时间:2026-05-19 18:43
清华阿里通义智能体新方案实现长程任务成本降低70%

清华阿里通义智能体新方案实现长程任务成本降低70%

当AI智能体执行需要多轮搜索与深度推理的复杂任务时,一个普遍存在的挑战日益凸显:上下文信息过载。模型往往会出现关键信息遗忘或推理链条断裂的问题。这不仅是技术上的瓶颈,更是阻碍AI向更高阶应用发展的现实壁垒。因此,如何为智能体构建稳定可靠的“长程记忆”能力,已成为全球人工智能研究的前沿焦点。 近期,清

时间:2026-05-19 18:43
高并发RAG系统延迟优化:召回与生成阶段性能提升策略

高并发RAG系统延迟优化:召回与生成阶段性能提升策略

高并发场景下的Agent系统,延迟问题往往不是某个单点慢,而是处处都慢一点,最终叠加成用户不可接受的等待。一个典型的RAG Agent请求链路可能是这样的:用户提问 → Query改写 → 向量检索 → 重排序 → Prompt组装 → LLM生成 → 后处理返回。每个环节各花几百毫秒,串联起来就是

时间:2026-05-19 18:43
品牌生存新逻辑:告别价格战,构建长期价值护城河

品牌生存新逻辑:告别价格战,构建长期价值护城河

通胀与不确定性的交织的时代,消费者正用“价值”而非“价格”来重新定义忠诚。研究揭示了一个清晰的转向:价值已超越口味和品牌,成为首要决策因素,传统的价格战策略正在迅速失效。 规则已然改写。如今,决定一件商品能否留在购物车里的,是它提供的综合价值,而不仅仅是标价签上的数字。 核心趋势:告别价格战,拥抱价

时间:2026-05-19 18:43
企业级AI应用普及的五个关键步骤与实现路径

企业级AI应用普及的五个关键步骤与实现路径

企业AI落地为何屡屡失败?问题往往不在于技术本身,而在于一个更根本的要素——“信任”。当员工心中充满疑虑,不清楚AI是来取代自己,还是真正能帮到自己时,再先进的工具也只能在试点阶段徘徊,难以真正融入日常。 观察各行业的现状,会发现一个惊人的模式:高层满怀热情,中层偶有零星尝试,而在更广泛的层面,推广

时间:2026-05-19 18:42
热门专题
更多
刀塔传奇破解版无限钻石下载大全 刀塔传奇破解版无限钻石下载大全
洛克王国正式正版手游下载安装大全 洛克王国正式正版手游下载安装大全
思美人手游下载专区 思美人手游下载专区
好玩的阿拉德之怒游戏下载合集 好玩的阿拉德之怒游戏下载合集
不思议迷宫手游下载合集 不思议迷宫手游下载合集
百宝袋汉化组游戏最新合集 百宝袋汉化组游戏最新合集
jsk游戏合集30款游戏大全 jsk游戏合集30款游戏大全
宾果消消消原版下载大全 宾果消消消原版下载大全
  • 日榜
  • 周榜
  • 月榜
热门教程
更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程