当前位置: 首页
AI
Grok 4— 马斯克旗下xAI推出的新一代大模型

Grok 4— 马斯克旗下xAI推出的新一代大模型

热心网友 时间:2025-07-14
转载

Grok 4简介

grok 4 是由 xai 发布的最新人工智能大模型,其推理能力较上一代提升了 10 倍。该模型拥有出色的推理表现,在 sat、gre 等高难度考试中接近满分,并在多个基准测试中超越其他顶尖模型。grok 4 支持多模态功能,可理解主观概念、生成代码和可视化内容,并在语音交互方面进行了重大升级。它分为两个版本:grok 4 为单代理(single agent)版本,而 grok 4 heavy 是多代理(multi agents)版本,支持最多四个代理同时运行,上下文窗口最高可达 256k tokens。

Grok 4— 马斯克旗下xAI推出的新一代大模型Grok 4的核心特性

超强推理能力:在 SAT、GRE 等高难度考试中接近满分,展现出远超人类水平的逻辑推理能力。多模态理解能力:能理解抽象概念,并具备图片搜索与分析能力。信息整合与提炼:能够从社交媒体等渠道收集信息,提取关键事件并按时间线排序。代码与图形生成:根据科学提示生成复杂动画,例如模拟黑洞碰撞过程。语音交互优化:新增五种语音选项,对话更自然流畅,情感表达更丰富。处理复杂任务:在模拟经营类任务中表现出色,具备优秀的战略规划与执行能力。智能体协同运作:SuperGrok Heavy 版本支持多个智能体并行工作,提升问题解决效率。

Grok 4的性能测试结果

最新测试数据:Humanity’s Last Exam:包含 2500 个跨学科专家级问题。Grok 4 Heavy 在调用工具的情况下得分达 44.4%,优化后可提升至 50.7%。AIME25(数学竞赛):Grok 4 Heavy 获得满分 100%,大幅领先其他模型。GPQA(研究生级别问答):Grok 4 Heavy 得分 88.9%,超过 Gemini 2.5 Pro(86.4%)和 Claude 4 Opus(79.6%)。HMMT25(高中数学竞赛):Grok 4 Heavy 得分 96.7%,远高于 Gemini 2.5 Pro 的 82.5%。USAMO25(美国数学奥林匹克):Grok 4 Heavy 得分 61.9%,显著优于 Gemini DeepThink(49.4%)和 Gemini 2.5 Pro(34.5%)。ARC-AGI(抽象推理):Grok 4 得分 15.9%,几乎是此前商业 SOTA 模型的两倍。Vending-Bench(模拟经营):Grok 4 净收益 $4694,远超 Claude Opus 4($2077)和人类玩家($844)。

Grok 4— 马斯克旗下xAI推出的新一代大模型- 第三方评测结果(基于Artificial Analysis平台):

人工智能综合指数:Grok 4 得分 73,高于 OpenAI o3(70)、谷歌 Gemini 2.5 Pro(70)、Anthropic Claude 4 Opus(64)及 DeepSeek R1 0528(68)。编码与数学专项指数:Grok 4 均位列第一。GPQA Diamond 分数:创纪录达到 88%,超过 Gemini 2.5 Pro 的 84%。Humanity’s Last Exam 成绩:刷新记录至 24%,领先于 Gemini 2.5 Pro 的 21%。响应速度:Grok 4 达到 75 token/秒,虽低于 o3(188 token/秒)和 Gemini 2.5 Pro(142 token/秒),但优于 Claude 4 Opus Thinking(66 token/秒)。

Grok 4— 马斯克旗下xAI推出的新一代大模型Grok 4的价格体系

订阅服务定价:SuperGrok:年费 300 美元,月费 30 美元。SuperGrok Heavy:年费 3000 美元,月费 300 美元。API 调用费用:输入内容:3 美元 / 百万 token。输出内容:15 美元 / 百万 token。

Grok 4— 马斯克旗下xAI推出的新一代大模型Grok 4的游戏

正式链接:Grok

Grok 4的实际应用领域

教育辅导:提供个性化学习计划,解答学术难题,帮助学生深入掌握知识。科研辅助:分析大量实验数据,预测科学趋势,推动新理论与技术的发现。商业金融:进行市场分析与预测,为企业制定战略决策提供数据支持,提升运营效率。创意内容制作:协助广告、影视、游戏等行业完成剧本创作与动画制作,提高创作效率。智能助手:作为语音助手处理多模态信息,协助用户完成日常事务,提升生活便捷度。
来源:https://www.php.cn/faq/1400094.html

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章
更多
刚刚,Claude 4小时血洗全球最安全系统!人类最后防线失守

刚刚,Claude 4小时血洗全球最安全系统!人类最后防线失守

新智元报道编辑:KingHZ Aeneas【新智元导读】全球最安全系统,被AI攻破了!Claude 4小时攻破了全球最安全OS内核,从零写出国家级攻击程序,彻底跨越卢比孔河。人类防御60天,AI只要

时间:2026-04-07 13:49
滴滴出行开放打车Skill,“龙虾”叫车全程不需要切换App

滴滴出行开放打车Skill,“龙虾”叫车全程不需要切换App

IT之家 4 月 4 日消息,昨日,滴滴出行宣布开放打车 Skill。安装之后,用户可以直接对龙虾说出打车需求,或者让它记住你的习惯。从地址搜索、车型预估、价格确认,到下单、回查订单状态,全程不需要

时间:2026-04-07 13:43
Anthropic封堵第三方工具“薅羊毛”,OpenClaw被迫出局

Anthropic封堵第三方工具“薅羊毛”,OpenClaw被迫出局

一个月费$200的Claude Max订阅,用出了$5000的算力价值——这件事最终让Anthropic下定决心,彻底关上了第三方工具“蹭订阅”的大门。北京时间4月4日,Anthropic向订阅用户

时间:2026-04-07 13:37
卡帕西引爆硅谷!公开「第二大脑」黑科技,1250万人围观

卡帕西引爆硅谷!公开「第二大脑」黑科技,1250万人围观

新智元报道编辑:犀牛【新智元导读】Karpathy公开个人知识管理新范式:让大模型把你的一切资料「编译」成一部活的百科全书——RAG已死,人类只需负责思考。就在这两天,AI圈又被一个人引爆了。不是S

时间:2026-04-07 13:31
Cursor 3来了!一句话让所有Agent一起干活

Cursor 3来了!一句话让所有Agent一起干活

智东西作者|毕伟豪编辑|漠影智东西4月4日报道,昨天凌晨,Cursor 3 正式发布,最新声明称这是“为一个所有代码都由Agent编写的世界而生”的工具”。相比较于Cursor 2以及其他编程工具,

时间:2026-04-07 13:25
热门专题
更多
刀塔传奇破解版无限钻石下载大全 刀塔传奇破解版无限钻石下载大全
洛克王国正式正版手游下载安装大全 洛克王国正式正版手游下载安装大全
思美人手游下载专区 思美人手游下载专区
好玩的阿拉德之怒游戏下载合集 好玩的阿拉德之怒游戏下载合集
不思议迷宫手游下载合集 不思议迷宫手游下载合集
百宝袋汉化组游戏最新合集 百宝袋汉化组游戏最新合集
jsk游戏合集30款游戏大全 jsk游戏合集30款游戏大全
宾果消消消原版下载大全 宾果消消消原版下载大全
  • 日榜
  • 周榜
  • 月榜
热门教程
更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程