面包屑图标 当前位置: 首页
AI资讯
热点详情

马斯克20万GPU训练Grok-3 数学推理超越DeepSeek R1

AI热点日报
AI热点日报时间:2026-06-30
热点解读

Grok-3用20万GPU训练,数学、科学、编码测试全面夺冠,AIME2025获93分,Elo超1400。能计算火星发射窗口并生成3D轨道模拟,获NASA认证。同步推出DeepSearch智能体。

刚刚结束的直播里,xAI团队放了个大招:Grok-3,这个用了20万块GPU炼出来的AI模型,性能表现几乎让人重新定义“最强”。背后支撑它的,是全球最大超算集群Colossus。我们来拆解一下这个模型到底强在哪,以及它凭什么号称“地球最聪明”。 **核心看点:** 1. Grok-3能计算地球到火星的发射窗口,生成精确的3D轨道模拟,结果被NASA工程师认证为“完全正确”。 2. 在数学、科学问答、编码等多个基准测试中,Grok-3全面夺冠,AIME 2025数学测试纪录被它刷新。 3. 它的训练计算量是Grok-2的10倍,Elo评分突破1400,这是当下全球AI排行的顶峰。

刚刚,马斯克20万块GPU炼出Grok-3,暴击DeepSeek R1数学推理!彻底碾压 OpenAI...

马斯克在直播里自信放话:“Grok-3是地球上最聪明的AI大模型。” 从这次发布的技术细节看,这话并非空xue来风。xAI团队投入了20万块H100 GPU,分两个阶段训练——第一阶段用10万块跑了122天,第二阶段用20万块又烧了92天。这样的算力投入,换来的成果确实惊人。 研究人员现场抛出了一个硬核问题:计算地球到火星的发射窗口,并生成3D轨道模拟。在Think模式下(也就是高级推理模式),Grok-3的推理过程完全是教科书级别的:先用开普勒定律计算最优转移轨道,再生成完整的3D动画展示飞船路径,最后还能给出精确的返回窗口。现场核对的结果是,NASA工程师直接点头:“Grok-3的计算完全正确。” 相比之下,GPT-4、o1、o3-mini(high)等模型,在这同一个任务上全部推进失败。 更让人意外的是Grok-3在基准测试中的表现。它登上了最新LMSYS Arena排行榜的顶端,Elo评分突破1400,成为全球AI之巅。在AIME 2025数学测试中,它拿到93分(满分100),几乎达到数学专业水准;科学问答(GPQA)和编码(LCB)等多个领域也全面刷新了最先进水平(SOTA)。DeepSeek-R1、Gemini-2 Pro、GPT-4o这些位居一线的模型,在这些测试中全部被拉开差距。 除了推理能力,马斯克还顺带推出了一款搜索神器——DeepSearch。这本质上是一个AI智能体,不仅能全网检索信息,还能结合AI推理输出高质量答案。研发团队在现场演示时问:“下一次SpaceX星舰发射是什么时候?” DeepSearch立刻联网检索,在左侧完整展示搜索和推理过程,最终精准回应:2025年2月24日,数据源直接标注为SpaceX官网。整个过程比传统搜索快出数倍,用户不需要自己翻阅大量网页。 想第一时间体验Grok-3,现在订阅X平台的Premium Plus会员即可解锁。网页版入口是grok.com,App Store搜索Grok AI就能下载。如果需要使用高级推理和DeepSearch功能,则需要订阅SuperGrok版本。马斯克承诺,一周内Grok-3所有功能就会上线,几个月内还将全面开源。 从算力投入、研发速度到实机演示的表现来看,这波确实是一场对OpenAI的正式反击。Grok-3的到来,意味着AI大模型的竞争,继2019年以后又迈入了一个全新阶段。
热点追踪提示词
你是一名 AI 行业编辑,请围绕下面这条热点输出一份资讯解读:
热点:马斯克20万GPU训练Grok-3 数学推理超越DeepSeek R1要求:
1. 先用一句话解释这条热点在讲什么
2. 再总结它为什么重要
3. 说明会影响哪些 AI 产品或内容方向
4. 最后给出 3 个适合资讯站使用的标题
来源:https://www.53ai.com/news/LargeLanguageModel/2025021815364.html
ai 人工智能

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关热点
AI热点2026-06-30 19:04
AI驱动的Degiro投资组合跟踪与可视化工具

在 Degiro 上进行投资的用户,常常会遇到一个共同的痛点:平台自带的数据展示较为基础,若想获取更深入的投资组合分析、风险指标,甚至对未来走势做出预测,通常只能借助 Excel 手动处理。不过,现在有一款 Chrome 扩展程序可以完美解决这一难题——Mercury,专为 Degiro 用户量身打

AI热点2026-06-30 19:04
Lorna基于CFMS数据驱动决策的投资平台

在投资决策过程中,客观数据往往比主观直觉更值得信赖。名为Lorna的智能平台,运用独特的现金流分析体系,帮助投资者穿透虚饰的财务报表,直达企业真实的财务健康状况。 什么是Lorna?——数据驱动的现金流分析投资工具 简而言之,Lorna是一个以数据为核心驱动力的投资分析工具。其核心利器是独创的“现金

AI热点2026-06-30 19:03
前街购买记录追踪查询方法

Front Street自动追踪你的每一笔消费,整合各类忠诚度计划,并提供财务洞察与省钱妙招——说白了,就是帮你把钱&包管得明明白白。 什么是Front Street? 简单讲,Front Street就是你的购物管家。它自动记录你在每个品牌、每家店的所有购买行为,然后把零散的忠诚度计划全部整合到一

AI热点2026-06-30 19:03
一款专业Finta AI驱动筹款助手,高效智能募资工具

在创投圈深耕多年,你会发现一个普遍难题:融资过程中,投资者关系维护、尽职调查、潜在投资人挖掘……这些环节往往耗费巨大精力,却又直接决定成败。如果能有一款工具将这些琐事自动化,让团队聚焦于真正重要的沟通与战略决策,那该多理想?Finta 正是为此而生。 什么是Finta? Finta 本质上是一款 A

延伸阅读