当前位置: 首页
AI
马斯克抢先发布Grok 4.1:双能提升引爆大模型竞争

马斯克抢先发布Grok 4.1:双能提升引爆大模型竞争

热心网友 时间:2025-11-19
转载

就在科技圈热议谷歌即将推出Gemini 3之际,马斯克旗下xAI公司悄然放出重磅消息:其最新大语言模型Grok 4.1系列正式上线。这款被业界称为"双形态"的模型不仅在响应速度和事实准确性上实现突破,更通过独特的推理增强版本重新定义了AI交互体验。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

此次发布的Grok 4.1包含标准版和Thinking版两个版本,二者共享底层架构但采用不同推理配置。Thinking版作为增强推理变体,通过"思考令牌"机制实现链式推理,在复杂数学运算、编程任务和多步骤问题解决中表现尤为突出。标准版则凭借256K tokens的上下文窗口(快速模式下可扩展至200万),在长文档处理和持续对话中保持高度连贯性。

在权威盲测平台LMArena的最新评测中,Grok 4.1系列创造历史性成绩:Thinking版以1483 Elo评分登顶冠军,标准版紧随其后获得亚军。这个全球最具影响力的评测体系通过匿名双盲对战和真实用户投票,验证了模型在综合性能上的绝对优势。特别值得注意的是,标准版在非推理模式下仍超越所有竞争对手的推理模型,将前代产品Grok 4远远甩至第33名。

事实准确性是此次升级的核心突破点。xAI引入的大规模强化学习系统,配合前沿推理模型作为奖励机制,使Grok 4.1的幻觉率从12.09%骤降至4.22%。在专门检验事实判断能力的FActScore测试中,该模型得分从9.89优化至2.97,错误率降低超过70%。这意味着在涉及外部事实调用的场景中,模型能提供更可靠的证据支撑而非语义猜测。

情感理解能力的飞跃同样引人注目。在EQ-Bench情商测试中,Grok 4.1以1586 Elo评分稳居榜首,较前代提升超百分。这个由45个角色扮演场景构成的测试集,通过三轮连续对话评估模型的共情能力和情绪响应。最新示例显示,当用户倾诉失去宠物的悲伤时,新模型能精准捕捉"空睡窝""期待中的喵叫"等细节,提供更具人文关怀的回应。

创意写作领域迎来质的提升。在Creative Writing v3基准测试中,Grok 4.1以1722 Elo评分进入全球顶尖梯队,较前代提升近600分。该测试要求模型完成32个类别的三轮独立创作,涵盖叙事结构、风格模仿和世界构建等复杂任务。实测显示,新模型已从"段子生成器"进化为具备文学质感的创作者,能自然融入修辞手法和角色心理描写。

用户体验优化体现在每个交互细节。标准版在保持极快响应速度的同时,输出质量显著提升。最新旅游攻略示例中,旧版模型提供的"百科式"清单被替换为个性化建议:根据用户偏好推荐拍摄时段、规划特色路线,甚至解读城市文化气质。这种"本地向导"式的交互风格,使对话更接近真实人际交流。

在正式发布前两周的静默测试中,64.78%的真实用户在双盲对比中选择Grok 4.1的回答。这个由部分用户流量切换形成的测试样本,验证了模型在真实场景中的优越性。目前所有用户均可通过Grok正式版、X平台及新推出的iOS/安卓应用免费体验,其中Thinking版提供"深度思考"按钮,用户可主动触发增强推理模式。

实测环节验证了技术文档的宣传亮点。在逻辑推理测试中,面对存在两组解的数学谜题,Grok 4.1不仅完整呈现两种可能性,还尝试优化题目条件——尽管优化建议存在瑕疵,但展现出主动解决问题的思维模式。写作测试中,模型用861字(非声明的578字)生动还原发布会现场,准确嵌入产品亮点和市场背景。图像生成功能则展示出惊人的真实感,其创作的照片级图片可一键转化为动态视频。

来源:https://www.itbear.com.cn/html/2025-11/1022058.html

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章
更多
Just Learn

Just Learn

Just Learn是什么 提起用AI为教育赋能,Just Learn这款工具是个绕不开的名字。它由Just Learn公司开发,核心目标非常明确:一手帮教师扩展专业能力,一手为学生打造个性化的学习旅程。说到底,它的价值在于通过AI驱动学习和24 7全天候辅导这两大核心,把教育资源重新“盘活”,让老

时间:2026-04-17 22:59
AI Art Prompt Generator

AI Art Prompt Generator

AI艺术提示生成器是什么 简单来说,你可以把它理解为一个永不枯竭的创意火花塞。这个基于前沿AI技术的工具,专为破解创作瓶颈而生,无论你是专业画师还是灵感偶尔“罢工”的爱好者,它都能派上用场。它的工作原理并不复杂:依托当前顶级的OpenAI模型,将你的初步想法“催化”成一系列具体、新颖且富有启发性的艺

时间:2026-04-17 22:57
清图

清图

清图是什么 提到图片修复,很多人可能还停留在耗时耗力的专业软件阶段。但现在,情况不同了。清图,这款由BETA实验室孵化的AI工具,专攻一件事:利用深度学习技术,让模糊图片在几秒钟内重获新生,变得高清锐利。无论是日常随手拍糊了的照片,还是带有特殊需求的动漫图片、证件照,乃至想给黑白老照片上色,它都能应

时间:2026-04-17 22:53
Vose AI

Vose AI

Vose AI是什么 说起AI绘画工具,市面上的选择已经不少了。但今天要聊的这个Vose AI,还真有点不一样。它是由Vose团队精心打造的一个AI图像生成平台,核心目标很明确:把你脑子里那些天马行空的创意点子,变成实实在在、令人眼前一亮的图像作品。无论你是靠画笔和灵感吃饭的专业艺术家、设计师,还是

时间:2026-04-17 22:44
Kanaries AI

Kanaries AI

Kanaries AI Exploratory Data Analysis是什么 提到数据探索分析,很多人脑子里立马会蹦出复杂的代码和令人眼花缭乱的报表。但今天要聊的这款工具——Kanaries AI Exploratory Data Analysis(简称Kanaries AI EDA),正致力于

时间:2026-04-17 22:40
热门专题
更多
刀塔传奇破解版无限钻石下载大全 刀塔传奇破解版无限钻石下载大全
洛克王国正式正版手游下载安装大全 洛克王国正式正版手游下载安装大全
思美人手游下载专区 思美人手游下载专区
好玩的阿拉德之怒游戏下载合集 好玩的阿拉德之怒游戏下载合集
不思议迷宫手游下载合集 不思议迷宫手游下载合集
百宝袋汉化组游戏最新合集 百宝袋汉化组游戏最新合集
jsk游戏合集30款游戏大全 jsk游戏合集30款游戏大全
宾果消消消原版下载大全 宾果消消消原版下载大全
  • 日榜
  • 周榜
  • 月榜
热门教程
更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程