数码系统

相机 win10

测评 win11

手机智车

华为 Tesla

小米理想

苹果蔚来

游戏软件

LOL 抖音

原神微信

当前位置：首页

业界动态

马斯克Grok 4.1发布：AI榜单大洗牌，盲测排名登顶

马斯克Grok 4.1发布：AI榜单大洗牌，盲测排名登顶

热心网友时间：2025-12-02

转载

就在OpenAI正式推出GPT-5.1、业界热议“情商”表现之际，埃隆·马斯克（Elon Musk）也带着他的xAI公司，迅速加入了这场围绕“AI交互体验”的激烈竞争。

最新消息显示，xAI正式发布了Grok 4.1，这是对现有Grok 4模型的一次重大升级，目前已在grok.com、X平台以及iOS和Android应用中面向所有用户全面开放。据官方介绍，新版模型在创意表达、情感互动与协同交流方面表现尤为出色，其产生幻觉的概率仅为前代模型的三分之一。

更引人瞩目的是，在一个公开的“盲测”竞技平台（LMArena）上，Grok 4.1的“思考模式”版本已悄然登顶总榜首位。更令人惊讶的是，即便是其“非推理”的快速模式，也成功击败了其他所有模型的“完整推理”模式。

这场突如其来的“榜首易主”，无疑为日趋白热化的AI竞赛增添了更多火药味。

那么，Grok 4.1究竟带来了哪些升级？

xAI本次推出了两个Grok 4.1模型版本：Grok 4.1（非推理模式）和Grok 4.1 Thinking（思考模式）。这两个模型均可免费使用，但付费用户面临的限制会更少。

xAI表示，新版模型能够更细腻地理解隐含意图，与之对话引人入胜，同时也更好地保持了人设的一致性。

为了优化模型的风格调性、人格特质与实用价值，xAI采用了前沿的代理型推理模型（agentic reasoning models）作为“奖励模型”，在大规模环境中自主评估并迭代优化模型的回答质量。

在11月1日至14日的“静默上线”期间，xAI在真实流量中进行了盲测式的成对比较评估。结果显示，在64.78%的情况下，用户表现出对Grok 4.1的明显偏好。

在“盲测”中力压群雄的Grok 4.1，到底有多强？

Grok 4.1在盲测环境下的人类偏好评估中，树立了新的行业标杆。

LMArena作为一个开源工具，用户可以通过并行、盲测的方式，比较不同大语言模型的实际表现。在这个竞争最为激烈的“斗兽场”里，Grok 4.1取得了令人瞩目的成绩：

· Grok 4.1的“思考模式”（代号：quasarflux）以1483 Elo的成绩位列总榜第一，领先所有非xAI模型达31分之多。

· Grok 4.1的“非推理模式”（代号：tensor）无需使用“思考词元”（thinking tokens），即可即时生成回答，并以1465 Elo的成绩排名第二。

· 更夸张的是，Grok 4.1的“非推理”模式表现，甚至超越了其他所有模型在“完整推理模式”下的公开排行榜成绩。

与之相比，Grok 4此前在该榜单上的综合排名仅为第33位。

“情商”与“文采”，一个都不能少

除了通用能力的提升，xAI还强调新版模型在“软实力”方面的显著进步。

· 情绪智能（Emotional Intelligence）为评估模型在个性与人际互动方面的表现，xAI对Grok 4.1进行了EQ-Bench3测试。这是一项由LLM作为裁判的测试，用于评估模型在主动情绪智能、理解力、洞察力、共情能力和人际技能等方面的表现。

· 创意写作能力（Creative Writing）xAI同样测量了Grok 4.1在Creative Writing v3基准测试中的表现。在该测试中，模型需要根据32个不同的写作提示，在3次迭代中生成回答。

更少的“幻觉”

快速响应模型在配备搜索工具后，虽能迅速给出答案，但也更容易出现事实性错误。

在Grok 4.1的后训练阶段，xAI重点降低了模型在信息查询类提示中出现事实性“幻觉”的概率。

根据xAI的说法，Grok 4.1出现幻觉的概率仅为此前模型的三分之一，这使其成为xAI迄今为止表现最佳的版本之一。

为了验证这一点，xAI不仅在真实的生产流量中进行了评估，还使用了FActScore——一个包含500道人物传记相关问题的公开基准测试。

挑战与未来：真正的对手还在路上

尽管Grok 4.1的“盲测”成绩斐然，但AI领域的王者之争远未结束。

目前，我们尚不清楚它与GPT-5.1相比的真实表现。

更重要的是，谷歌（Google）正在筹备发布Gemini 3.0，这很可能会成为迄今为止最强大的模型。

Grok 4.1的发布，无疑是马斯克在AI竞赛中投下的一枚重要棋子。但在这场“神仙打架”的牌局中，谁能笑到最后，还远未可知。（易句）

来源:https://www.163.com/tech/article/KEKPSTL700097U7T.html

上一篇：中国三星发布三年CSR成果：深耕本土社会责任实践

下一篇：阿里旗舰AI迎重磅升级！能否超越ChatGPT成看点

游乐网为非赢利性网站，所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系youleyoucom@outlook.com。

同类文章

小鹏GX发布首日门店火爆工作日客流创26年新高

小鹏GX发布首日门店火爆工作日客流创26年新高

小鹏GX发布后首个工作日，全国门店客流量创26年来新高，试驾预约量超越此前明星车型首周末峰值。新车起售价进入30万元区间，设计极具未来感。全系标配800V高压平台与5C超快充，纯电版续航达750公里；增程版综合续航1585公里。智能驾驶搭载第二代VLA架构，座舱配备侧端视觉语言大模型，交互体验显著提升。

时间：2026-05-23 20:55

安克AI降噪耳机获吉尼斯认证搭载Thus芯片通话清晰

安克AI降噪耳机获吉尼斯认证搭载Thus芯片通话清晰

安克创新发布两款新品：搭载存算一体AI音频芯片Thus™A1的消噪耳机，获吉尼斯“全球通话最清晰无线蓝牙耳机”认证，算力提升约150倍，能精准提取人声，提升嘈杂环境通话质量，并支持AI记事、翻译等功能；同时推出消费级立体纹理打印机eufyMakeE1，降低创意制造门槛。

时间：2026-05-23 20:55

中国电动车欧洲销量突破15% 关税难阻市场增长创历史新高

中国电动车欧洲销量突破15% 关税难阻市场增长创历史新高

上个月，中国品牌在欧洲电动车市场份额首次突破15%，创历史新高。以比亚迪、奇瑞为代表的中国车企在欧洲销量同比翻倍，显示中国汽车出海竞争力稳步提升。2025年全球电动车销量预计突破2000万辆，其中近四分之三产自中国，中国在全球电动车供应链中占据主导地位。庞大产能支撑出口激增，海外

时间：2026-05-23 20:55

大疆Pocket 4P双摄口袋相机开箱图赏

大疆Pocket 4P双摄口袋相机开箱图赏

大疆正式官宣双摄口袋相机Pocket4P，搭载一英寸主摄与3倍光学长焦镜头，焦段覆盖完整。其保留三轴机械云台保障防抖，旨在满足进阶用户对画质、多场景适应及创作自由度的更高需求。

时间：2026-05-23 20:55

爱普生如何用省小精技术破解时代困境实现可持续发展

爱普生如何用省小精技术破解时代困境实现可持续发展

面对资源紧张等时代挑战，爱普生提出“省、小、精”发展理念，旨在以更少资源创造更高价值。其依托精密技术，在工业自动化、数字印刷及教育等领域提供解决方案，提升效率并减少环境负担。该理念支撑着企业实现可再生电力使用与碳中和的长期愿景，推动可持续发展。

时间：2026-05-23 20:22

热门专题

刀塔传奇破解版无限钻石下载大全

刀塔传奇破解版无限钻石下载大全

洛克王国正式正版手游下载安装大全

洛克王国正式正版手游下载安装大全

思美人手游下载专区

思美人手游下载专区

好玩的阿拉德之怒游戏下载合集

好玩的阿拉德之怒游戏下载合集

不思议迷宫手游下载合集

不思议迷宫手游下载合集

百宝袋汉化组游戏最新合集

百宝袋汉化组游戏最新合集

jsk游戏合集30款游戏大全

jsk游戏合集30款游戏大全

宾果消消消原版下载大全

宾果消消消原版下载大全

日榜
周榜
月榜

洛克王国绿色命运之钥获取攻略与详细步骤

洛克王国VIP扭蛋机具体位置与获取方法

光遇2026年520发布会爆料内容全解析

洛克王国S2赛季异色精灵盒子查看与使用指南

洛克王国城堡守护者具体位置与寻找攻略

星辰变归来神兽获取攻略新手快速入手指南

洛克王国宠物医院地址查询与位置导航指南

星辰变归来时装系统详解新手入门穿搭攻略

阴阳师2026年520兑换码领取方法与最新福利一览

星辰变归来境界系统详解与修炼攻略

漫蛙漫画防走失网页链接

日本宝可梦卡牌遭恶意破坏抵制黄牛行为引关注

三国志将星闪耀零氪能玩吗微氪玩家体验与氪金程度解析

少女前线2追放维尔德强度评测技能解析与培养攻略

客官里面请手游氪金指南与零氪金新手攻略

东离剑游纪手游抽卡机制与角色获取攻略详解

客官里面请手游深山探险全流程攻略与资源获取详解

镭明闪击手游哨所掩体高效布局与实战部署攻略

宝可梦冠军手游Mega进化种族值与能力数值全解析

地下城之光手游装备搭配与职业流派加点全攻略

漫蛙漫画防走失网页链接

《问剑长生》新大区预创角开启，是什么福利让玩家直呼夯爆了？

紧急！Axios 被投毒，3亿项目受到影响！教你怎么自查！

兆易创新2025年年营收92亿元，净利16亿元

TensorFlow - AI开发平台,AI开发框架

解决sql server2008注册表写入失败，vs2013核心功能安装失败

《九牧之野》S3乱世诡道主题服开启：4月18日上线，预备盟奖励与开服福利一文看懂

donk：对待季军赛的心态和决赛不一样，总之已经拿不到冠军了

iPhone 15耳机连接后音量小原因排查与解决

蛮荒领主手游测试资格获取方式蛮荒领主内测资格申请渠道与条件详解

相关攻略

相关攻略

《炎龙骑士团2》详细全攻略

2015-03-10 11:25

《炎龙骑士团2》详细全攻略

《东吴霸王传2013》详细全关攻略

2015-03-10 11:05

《东吴霸王传2013》详细全关攻略

《臭作》之100%全完整攻略

2021-08-04 13:30

《臭作》之100%全完整攻略

《兰斯8》剧情攻略详细篇

2015-03-10 11:22

《兰斯8》剧情攻略详细篇

《英雄坛说》详细全攻略

2015-03-10 12:39

《英雄坛说》详细全攻略

《造梦西游2：十殿阎罗篇》BOSS档案及掉落装备全介绍及攻略

2022-05-16 18:57

《造梦西游2：十殿阎罗篇》BOSS档案及掉落装备全介绍及攻略

偷窃少女的教育方法全攻略

2025-05-23 13:43

偷窃少女的教育方法全攻略

无法抵挡小恶魔的诱惑攻略

2025-05-23 14:01

无法抵挡小恶魔的诱惑攻略

热门教程

游戏攻略
安卓教程
苹果教程
电脑教程

开放空间强势角色强度榜与使用推荐

开放空间强势角色强度榜与使用推荐发布于 2026-05-23

三国志幻想大陆2关羽阵容搭配攻略与强度解析

三国志幻想大陆2关羽阵容搭配攻略与强度解析发布于 2026-05-23

绝区零浮波与柚叶音擎选择推荐及强度对比分析

绝区零浮波与柚叶音擎选择推荐及强度对比分析发布于 2026-05-23

最后生还者第二季复仇剧情深度解析

最后生还者第二季复仇剧情深度解析发布于 2026-05-23

最后生还者重制版存档位置与转移方法详解

最后生还者重制版存档位置与转移方法详解发布于 2026-05-23

曼达洛人第三季上线时间与Disney Plus观看指南

曼达洛人第三季上线时间与Disney Plus观看指南发布于 2026-05-23

真探3跨案质询成就解锁全攻略

真探3跨案质询成就解锁全攻略发布于 2026-05-23

Phonopolis走廊冲刺解锁技巧与速通攻略

Phonopolis走廊冲刺解锁技巧与速通攻略发布于 2026-05-23

森林尽头游戏官网下载地址与安装指南

森林尽头游戏官网下载地址与安装指南发布于 2026-05-23

荒野大镖客3开发前景分析需等待GTA6发售后启动

荒野大镖客3开发前景分析需等待GTA6发售后启动发布于 2026-05-23

第五人格联动遗忘之海免费头像逐浪拾光获取攻略

第五人格联动遗忘之海免费头像逐浪拾光获取攻略发布于 2026-05-23

黎明之海南美东岸探索攻略与宝藏位置详解

黎明之海南美东岸探索攻略与宝藏位置详解发布于 2026-05-23

哥特王朝重制版遭波兰玩家抵制因质量问题大量退款

哥特王朝重制版遭波兰玩家抵制因质量问题大量退款发布于 2026-05-23

黎明前20分钟元素流角色选择指南与实战策略

黎明前20分钟元素流角色选择指南与实战策略发布于 2026-05-23

奇妙拼拼乐游戏怎么玩软件特色与玩法全解析

奇妙拼拼乐游戏怎么玩软件特色与玩法全解析发布于 2026-05-23

暗黑奇幻韩游Embers of the Uncrowned新预告试玩内容丰富

暗黑奇幻韩游Embers of the Uncrowned新预告试玩内容丰富发布于 2026-05-23

Windows批量修改文件后缀名教程使用CMD命令一键快速完成

Windows批量修改文件后缀名教程使用CMD命令一键快速完成发布于 2026-05-20

Win11 查看 CPU 硬件级安全隔离支持方法提升系统防御力

Win11 查看 CPU 硬件级安全隔离支持方法提升系统防御力发布于 2026-05-20

如何查询Mac型号年份与配置信息

如何查询Mac型号年份与配置信息发布于 2026-05-20

Linux系统Nginx服务器HTTPS证书安装配置教程

Linux系统Nginx服务器HTTPS证书安装配置教程发布于 2026-05-20

Mac放大镜功能开启指南轻松看清屏幕细节

Mac放大镜功能开启指南轻松看清屏幕细节发布于 2026-05-20

Mac终端清理DNS缓存详细步骤与操作指南

Mac终端清理DNS缓存详细步骤与操作指南发布于 2026-05-20

Win11任务栏合并标签如何关闭恢复经典文字导航栏

Win11任务栏合并标签如何关闭恢复经典文字导航栏发布于 2026-05-20

Mac桌面图标自动整理技巧：堆栈功能高效管理文件

Mac桌面图标自动整理技巧：堆栈功能高效管理文件发布于 2026-05-20

国产内存新架构突破30TB带宽实现自主供应链

国产内存新架构突破30TB带宽实现自主供应链发布于 2026-05-11

Edge浏览器网页捕获功能使用教程截取全屏与区域截图详解

Edge浏览器网页捕获功能使用教程截取全屏与区域截图详解发布于 2026-05-11

千度手机版官网免费入口手机端专用访问链接

千度手机版官网免费入口手机端专用访问链接发布于 2026-05-11

ES文件浏览器复制文件内容到剪贴板详细步骤教程

ES文件浏览器复制文件内容到剪贴板详细步骤教程发布于 2026-05-11

如何设置鼠标连点器的固定点击间隔秒数

如何设置鼠标连点器的固定点击间隔秒数发布于 2026-05-11

苹果iPhone 15截屏保存到相册的详细步骤教程

苹果iPhone 15截屏保存到相册的详细步骤教程发布于 2026-05-11

立升净水器滤芯更换方法与使用指南

立升净水器滤芯更换方法与使用指南发布于 2026-05-11

ES文件浏览器如何设置默认打开应用详细图文教程

ES文件浏览器如何设置默认打开应用详细图文教程发布于 2026-05-11

热门话题

魔术游戏下载-魔术游戏-2022热门的魔术小游戏大全

魔术游戏下载-魔术游戏-2022热门的魔术小游戏大全

刀塔传奇破解版在哪下-刀塔传奇破解版无限钻石下载大全-刀塔传奇破解版内购破解版合集

刀塔传奇破解版在哪下-刀塔传奇破解版无限钻石下载大全-刀塔传奇破解版内购破解版合集

饥荒下载免费中文版-饥荒下载破解版-饥荒正版全部版本下载合集

饥荒下载免费中文版-饥荒下载破解版-饥荒正版全部版本下载合集

拉布布游戏下载-拉布布游戏合集-拉布布系列游戏大全合集

拉布布游戏下载-拉布布游戏合集-拉布布系列游戏大全合集

洛克王国手游正版下载-洛克王国正版手游下载安装大全-类似洛克王国的手机游戏推荐

洛克王国手游正版下载-洛克王国正版手游下载安装大全-类似洛克王国的手机游戏推荐

神魔幻想单机游戏下载-神魔幻想单机游戏推荐-神魔幻想系列游戏下载合集

神魔幻想单机游戏下载-神魔幻想单机游戏推荐-神魔幻想系列游戏下载合集

最受女生欢迎的游戏_女生玩的手游_思美人手游下载专区

最受女生欢迎的游戏_女生玩的手游_思美人手游下载专区

疯狂越野系列游戏下载_疯狂越野全版本合集中文版下载

疯狂越野系列游戏下载_疯狂越野全版本合集中文版下载

神庙逃亡2破解无限金币无限钻石下载-神庙逃亡2国际版破解大全-神庙逃亡2版本合集

神庙逃亡2破解无限金币无限钻石下载-神庙逃亡2国际版破解大全-神庙逃亡2版本合集