当前位置: 首页
业界动态
OpenAI上新GPT-5.4 mini与nano,性能逼近旗舰,成本仅需三分之一

OpenAI上新GPT-5.4 mini与nano,性能逼近旗舰,成本仅需三分之一

热心网友 时间:2026-04-22
转载

OpenAI推出GPT-5.4 mini与nano:为高效AI工作流而生的“轻骑兵”

3月18日,AI领域传来新动态:OpenAI正式发布了GPT-5.4 mini和GPT-5.4 nano两款模型。这可不是简单的迭代,而是精准定位——它们专为那些需要快速、大规模处理AI任务的工作负载设计,目标直指低成本、高效率的应用场景。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

适用于AI工作流的小型模型

在实际的AI工作流中,选模型往往是个平衡术。你既需要不错的性能,又得追求飞快的响应速度,同时工具调用还得稳定可靠。三者缺一不可。

OpenAI对此的阐述很直接:“这些模型就是为对延迟敏感的工作负载而生。在这些场景里,延迟哪怕慢一点,用户体验就会大打折扣。”想想看,那些需要即时反馈的编程助手、负责执行具体任务的子智能体、实时解读屏幕内容的操作系统,还有能对图像进行快速推理的多模态应用——它们的共同点是什么?就是“等不起”。

所以,OpenAI点出了关键:在这些场景下,最合适的模型往往不是参数最大的那个,而是那个反应快、工具调用稳、在专业任务上不掉链子的选手。

具体来看,相比前代的GPT-5 mini,这次的GPT-5.4 mini在编程、逻辑推理、多模态理解和工具使用上都有提升,而且运行速度直接翻了个倍。至于GPT-5.4 nano,则是更极致的选择:体积更小、速度更快,主打分类、数据提取、排序以及相对简单的编程辅助任务。

性能表现

说到小模型,大家最关心的无非两点:性能到底行不行?性价比高不高?OpenAI也拿出了对比数据,让事实说话:

• 在SWE-bench Pro基准测试中,GPT-5.4 mini拿到了53.40%的分数,而GPT-5 mini是45.69%。

• 在Terminal-Bench 2.0测试中,GPT-5.4 mini达到了59.30%,远超GPT-5 mini的38.20%。

• 在GPQA Diamond测试中,GPT-5.4 mini得分85.48%,已经非常接近全功能版GPT-5.4的93.00%。

• 在OSWorld-Verified测试中,GPT-5.4 mini以70.60%的通过率,显著高于GPT-5 mini的42%。

测试结果透露了一个明确信号:GPT-5.4 mini在多项关键测试中的通过率,已经逼近了它的“老大哥”GPT-5.4,而且执行速度还更快。这意味着,在衡量模型能否正确解决问题的基准上,这个轻量级选手的表现不容小觑。

至于GPT-5.4 nano,其表现则介于两者之间,定位清晰。例如,它在SWE-bench Pro上得分52.39%,在Terminal Bench 2.0上为46.30%。数据虽略低于GPT-5.4 mini,但依然稳稳超过了GPT-5 mini。

子智能体与多模态任务

在智能体的生态系统里,架构设计越来越像现实中的团队协作。一个常见的思路是,让能力强大的AI模型(比如GPT-5.4 Thinking)与速度快、成本低的模型(比如GPT-5.4 mini)搭档工作。这好比一位资深工程师带着几位高效的初级工程师协同作战,既能把握方向,又能快速执行。

在这样的系统里,不同规模的模型可以各司其职:大模型负责顶层规划和复杂思考,小模型则专注执行具体的子任务。GPT-5.4 mini扮演的,正是“子智能体”的角色,比如搜索代码库、审查文件、处理文档这些需要快速响应的活儿。

OpenAI特别提到了它的多模态能力:“GPT-5.4 mini能够处理涉及计算机使用的多模态任务。简单说,它能看懂密集的用户界面截图,并据此辅助完成操作,这对于自动化办公流程来说潜力很大。”

可用性与定价

目前,GPT-5.4 mini已经通过API、Codex和多个版本的ChatGPT提供服务。对于免费版和Go级用户,可以通过附加菜单里的“Thinking”选项来调用它。OpenAI还给出了一个实用的降级策略:“对于其他所有用户,当GPT-5.4 Thinking触发速率限制后,系统会自动将请求切换到GPT-5.4 mini作为备选。”

对于开发者群体,GPT-5.4 mini已经覆盖了Codex应用、命令行界面、集成开发环境扩展以及网页端。这里有个成本亮点:这款mini模型“仅消耗GPT-5.4配额的30%,这意味着开发者能在Codex中以大约三分之一的成本来处理那些相对简单的编程任务。”此外,Codex还能智能地将任务“委托”给GPT-5.4 mini这样的子智能体,让推理强度要求不高的工作在低成本模型上运行,从而优化整体资源分配。

具体的成本对比数据如下:

• GPT-5.4 mini定价为每百万输入Token 0.75美元,每百万输出Token 4.50美元,拥有40万词的上下文窗口。

• GPT-5.4 nano目前仅通过API提供,价格更低,为每百万输入Token 0.20美元,每百万输出Token 1.25美元。

作为参照,全功能的GPT-4定价为每百万输入Token 2.50美元,每百万输出Token 15.00美元。成本差异一目了然。

客户测试反馈

理论数据之外,早期客户的实测反馈或许更有说服力。

科技公司Hebbia专注于开发帮助金融、法律、科研等领域专业人士用自然语言处理海量文档的工具。其首席技术官Aabhas Sharma表示:“在同类模型中,GPT-5.4 mini提供了相当稳定的端到端性能。在我们的评估里,它在部分输出任务和引用召回率上的表现符合预期,同时成本确实降低了。更有意思的是,它的端到端通过率和来源归因能力,在某些测试中甚至超过了体量更大的GPT-5.4模型。”

另一家知名数字工作区Notion(本文正是在Notion中撰写),其AI工程负责人Abhisek Modi也分享了观察:“GPT-5.4 mini在处理定义明确的任务时,精准度很高。在页面编辑这类操作上,它处理复杂格式的能力接近GPT-5.2,但计算消耗却更低。”

Modi还补充了一个关键趋势:“过去,能稳定处理智能体工具调用的,通常只有旗舰模型。但现在,像GPT-5.4 mini和nano这样的小型模型也具备了这种能力。这无疑给用户在Notion上构建自定义智能体时,提供了更灵活、更经济的选择。”

来源:https://www.163.com/tech/article/KO9OA7AV00097U7T.html

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章
更多
​谷歌发布 Gemini API 新定价策略,推理服务按需计费

​谷歌发布 Gemini API 新定价策略,推理服务按需计费

谷歌Gemini API全新计费方案出炉:五大档位详解与选型指南 最近,谷歌对其Gemini API的计费模式做了一次相当务实的更新。核心思路很明确:把“一刀切”变成“量体裁衣”,通过推出多个服务档位,来匹配不同场景下的推理需求。无论是追求极致性价比,还是要求毫秒级响应,现在都能找到对应的选项。 标

时间:2026-04-22 22:00
rpa帮你夺回可供支配的自由时间

rpa帮你夺回可供支配的自由时间

自省!你还能夺回多少可供支配的自由时间? 人生充满选择:是追随既定传统,还是拥抱创新变革?选择前者,往往意味着在无形中让渡了某种自由;而选择后者,则可能为我们赢回宝贵的、可供自主支配的时间。 提升个人效率,几乎是职场中的一项刚需。然而现实情况是,许多人发现自己越忙碌,对时间的掌控感却越弱。我们疲于应

时间:2026-04-22 21:59
RPA财务机器人在财务共享服务中心的应用挑战

RPA财务机器人在财务共享服务中心的应用挑战

RPA财务机器人在财务共享服务中心的应用挑战 信息数据的安全问题 提起RPA财务机器人,许多人首先想到的是效率提升。但效率的背后,一个无法绕开的核心议题就是安全。这种基于信息技术的新型工具,其脚本和生成的文件在整个生命周期——无论是存储还是传输环节——如果保护措施不到位,敏感信息泄露的风险便会陡然增

时间:2026-04-22 21:59
滴滴AI出行助手用户增长37倍,清明假期成智能调度大考

滴滴AI出行助手用户增长37倍,清明假期成智能调度大考

滴滴AI出行助手用户激增,清明出行开启“智能决策”模式 最近一组数据挺有意思:滴滴出行旗下的AI出行助手“小滴”,用户量迎来了爆发式增长。短短一周,活跃用户数相比年初飙升了37倍,而更引人注目的是,这些用户里有超过40%是00后。看来,年轻一代对于用AI来解决出行问题,接受度非常高。 话说回来,清明

时间:2026-04-22 21:59
美的集团转型 AI 科技巨头:日均 1.3 万个智能体同时在线

美的集团转型 AI 科技巨头:日均 1.3 万个智能体同时在线

当AI成为生产力底座:透视美的集团的规模化智能实践 最近,一则来自媒体的报道颇受业界关注:美的集团正将其AI技术的赋能推向更深层次。一个具象的数字是,每天有超过1 3万个智能体在全集团范围内高效运行。这不仅仅是个技术指标,更是一个明确的信号——人工智能已经大步流星地走出了实验室,真正扎根于大规模的产

时间:2026-04-22 21:59
热门专题
更多
刀塔传奇破解版无限钻石下载大全 刀塔传奇破解版无限钻石下载大全
洛克王国正式正版手游下载安装大全 洛克王国正式正版手游下载安装大全
思美人手游下载专区 思美人手游下载专区
好玩的阿拉德之怒游戏下载合集 好玩的阿拉德之怒游戏下载合集
不思议迷宫手游下载合集 不思议迷宫手游下载合集
百宝袋汉化组游戏最新合集 百宝袋汉化组游戏最新合集
jsk游戏合集30款游戏大全 jsk游戏合集30款游戏大全
宾果消消消原版下载大全 宾果消消消原版下载大全
  • 日榜
  • 周榜
  • 月榜
热门教程
更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程