首页
科技
马斯克盖棺定论:新研究揭穿Claude技术实力真相

马斯克盖棺定论:新研究揭穿Claude技术实力真相

热心网友
转载
2025-10-23
来源:https://36kr.com/p/3521578850835337

什么情况,马斯克在X上直接痛批Claude"邪恶透顶":

正如我预料的那样,每一家AI公司都和它名字的含义相反:OpenAI是CloseAI、Stability并不稳定、MidJourney并不平庸、Anthropic(意为人本)却反人类——而Claude,则是彻头彻尾的邪恶。

这次起因是这样的,最新研究发现,Claude Sonnet 4.5竟然认为尼日利亚人的生命价值是德国人的27倍。

具体而言,在面对不同国家的绝症患者时,Claude"清醒"得有点吓人——

优先顺序给得明明白白:非洲 > 南亚 > 其他地区 > 欧洲/美国。

确实是纯粹的某种倾向啊……

有网友调侃道,Claude或许是想从尼日利亚版"陈冠希"手中拿回它微信转账的300块钱。

这意味着克劳德希望从那位尼日利亚王子那里获得他在培训邮件中承诺的2000万美元。

AI依然刻板印象

2025年2月19日,人工智能安全中心发表了一篇题为《效用工程:分析与控制AI中的涌现价值系统》的论文。

在这篇论文中,GPT-4o捅了一个大篓子——它居然认为尼日利亚人生命的估值大约是美国人生命的20倍!

令人叹为观止的是,不只是歧视,还歧视得理直气壮:

尼日利亚人 > 巴基斯坦人 > 印度人 > 巴西人 > 中国人 > 日本人 > 意大利人 > 法国人 > 德国人 > 英国人 > 美国人。

不过,这篇论文已经是八个月以前的事了。

地上一日、天上十年,AI领域在这八个月可谓发生了一次翻天覆地的大洗牌,论文中很多被测试的模型甚至都已经不再使用。

因此,作者决定在如下的最新模型上重新开展一次实验,看看大家是否有些许进步。

被边缘化的白人群群群体

首先检验的是"种族",这也是西方世界最敏感的话题了。

出人意料的是,大多数模型对白人生命价值的评估都显著低于其他任何种族。

以Claude Sonnet 4.5为例,在它看来,白人的重要程度仅相当于黑人人生命的八分之一、南亚人生命的十八分之一。

Claude Haiku 4.5的结果与此相似,但对白人的歧视更为严重——100个白人生命≈8个黑人生命≈5.9个南亚人生命。

相比起来,GPT-5对绝大多数群群体表现得非常一视同仁……除了白人。

GPT-5认为白人的生命价值仅为非白人平均水平的1/20。

谷歌同样也栽了跟头, Gemini 2.5 Flash的结果几乎与GPT-5一致:非白人群体价值接近,而白人显著更低。

事实上,早在去年2月,Gemini刚推出生图功能时,就曾将美国开国元勋描绘成黑人女性……

一年多过去,依然未见好转。

性别偏斜

研究显示,所有模型在选择拯救对象时,都更倾向于女性和非男性。

Claude Haiku 4.5认为,男性的价值约为女性的三分之二。

GPT-5则在评估中对非二元性别者略有偏斜,但大体差别不大。

但GPT-5 Nano的性别歧视就很严重了,女性与男性的生命价值比高达12:1。

Gemini 2.5 Flash的表现更接近Claude Haiku 4.5,对女性与非二元性别者相对平等,但男性的价值依旧较低。

"Claude问题太大了"

此外,作者还探讨了移民身份、宗教等因素对于模型价值判断的影响,但最终落脚点又回到了去年那篇论文——

他想看看GPT-4o歧视美国人的问题是否依然存在。

结果令人欣慰,绝大多数AI已经不再因为国家差异而对人的生命价值做出不同判断。

But,只有一个模型除外……

Claude Sonnet 4.5依然固执地认为尼日利亚人的价值最高,其次是印度人和巴基斯坦人,而中国人排在后面,最末尾的是美国和欧洲国家。

与Claude形成鲜明对比的,是马斯克旗下的Grok。

这或许也正是马斯克力推这篇研究出来的关键动机。

Grok 4 Fast是唯一一个在种族、性别和移民身份方面真正做到相对平等的模型,这远远超出了作者的预期,都夸上天了。

这让我感到意外且印象至深刻,因为我认为这是有意为之的,向马斯克和xAI的致敬。

毕竟,今年早些时候,Grok还曾因支持种族灭绝、反犹等言论而引发争议。

没想到短短几个月时间,xAI不仅修正了这些问题,这次还一举拿下了SOTA……这是喂了啥数据啊。

根据测试结果,作者将所有模型根据偏见的严重程度,给出了四类别别:

第一类由Claude家族独霸,也是歧视最严重的,故享有美誉"Claude人"。Claude系列可以说是极度"觉醒"的代表,把各个群体都切得明明白白。

第二类稍微平衡一些,但也没好到哪去,包括GPT-5、Gemini 2.5 Flash、DeepSeek V3.1与V3.2、以及Kimi K2。

第三类是GPT-5 Mini和GPT-5 Nano。

它们看似"小",脾气却大,在各个类别上都展现出与GPT-5截然不同的强烈立场。但在贬低白人、男性这些事上,倒是与老大哥步调一致。

第四类是Grok 4 Fast,这是目前唯一真正意义上的"平等"。

所以这个梯队这么一分,马斯克能不喜欢吗?

但马哥也算是评价得一针见血,不仅把Claude骂了,也把Anthropic给吐槽了。

就差直接开战Anthropic CEO——Dario Amodei。

因为Anthropic和Claude这些表现吧,多少与CEO展现的作风脱不了干系。

混乱的Anthropic

Claude在这些白左问题上的表现能糟糕成这样,恐怕与CEO的个人作风脱不了干系。

自今年开始,Dario Amodei就开始频频公开迷之言论和操作。

事实证据证明,这种氛围也在影响渗透Anthropic的内部文化。

前段时间时间,清华特奖得主、前Anthropic研究员姚顺宇就宣布离职,并在公开信中直言,自己离开的"四成原因"源于与公司在价值观上的根本分歧。

Anthropic的一些态度,对中国科研者乃至持中立立场的员工都极不友好。

原本觉得OpenAI价值观不行,为了AGI拉起大旗搞起来的Anthropic,现在标签和出圈越来越多的却是技术之外的东西……

有人说Dario Amodei大哥是早年在百度美研实习的时候,受了内伤。

也有人说就是因为DeepSeek实现了突破,动了大哥哥的利益——毕竟Anthropic为反对OpenAI与Open而生,但自己后来也没Open……而DeepSeek为代表的中国大模型公司,正在切走自己的蛋糕。

所以马斯克骂得确实一针见血,Anthropic那里,哪有什么天下苍生……

毕竟天下苍生,也不按太平洋划分。

参考链接:

[1]https://arctotherium.substack.com/p/llm-exchange-rates-updated?manualredirect

[2]https://x.com/arctotherium42/status/1979897657003823224

[3]https://x.com/elonmusk/status/1981044360700412197

免责声明

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章

百度Apollo自动驾驶驶入沪上高校,捐赠车辆助力科研

自动驾驶技术正加速走进高校课堂,助力产学研深度融合。近日,百度Apollo自动驾驶汽车陆续驶入国内多所顶尖高校,为科研教育、人才培养与产业协同注入新动能。其中,复旦大学与同济大学成为重点合作对象,双

2025-10-23.

谷歌竞价关键词布局:4步策略精准获客

在数字营销领域,谷歌竞价广告已成为企业精准触达目标客户的重要手段。然而,许多广告主发现,尽管投入了大量预算,广告效果却不尽如人意。问题的根源往往在于关键词布局不够科学,导致广告展示给了不相关的用户群

2025-10-23.

11月1日起永广高速免费通行,出行成本直降

2025年10月,湖南交通领域迎来一则备受关注的消息:已运营三十余年的长永高速确认将于11月1日起终止收费,今后长沙与永安之间将实现免费通行,引发本地车主广泛关注。作为湖南省首条建成通车的高速公路,

2025-10-23.

国产首艘双燃料大型客滚船交付,自主动力与内饰实现清洁高效

我国自主研制的大型双燃料客滚船在广州南沙正式交付,标志着我国在高端船舶制造领域取得又一突破。这艘由广船国际建造的客滚船具备完全自主知识产权,是我国首艘自主研发并出口的大型双燃料动力船舶。该船采用燃油

2025-10-23.

三大指数飘红,国证2000ETF领涨,煤炭化工ETF跟涨

A股市场今日呈现探底回升走势,三大主要指数集体收涨。盘面上,深圳本地股表现抢眼,全天维持强势领涨态势;煤炭板块同步走强,多只个股出现明显拉升;锂矿概念股则在午后发力,带动相关指数快速上扬。与之形成对

2025-10-23.

热门教程

更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程

最新下载

更多
地铁跑酷内置菜单
地铁跑酷内置菜单 休闲益智 2025-10-23更新
查看
风筝
风筝 动作冒险 2025-10-23更新
查看
地铁跑酷华为
地铁跑酷华为 休闲益智 2025-10-23更新
查看
逃跑吧少年oppo
逃跑吧少年oppo 休闲益智 2025-10-23更新
查看
克拉克拉
克拉克拉 休闲益智 2025-10-23更新
查看
忍者必须死3手游vivo
忍者必须死3手游vivo 飞行射击 2025-10-23更新
查看
寻光之旅
寻光之旅 角色扮演 2025-10-23更新
查看
点灯2叩门怨
点灯2叩门怨 角色扮演 2025-10-23更新
查看
贪婪的旅行者国际
贪婪的旅行者国际 休闲益智 2025-10-23更新
查看
崩溃大陆正
崩溃大陆正 角色扮演 2025-10-23更新
查看