数码系统

相机 win10

测评 win11

手机智车

华为 Tesla

小米理想

苹果蔚来

游戏软件

LOL 抖音

原神微信

当前位置：首页

AI资讯

热点详情

OpenAI Prompt Caching 上线，API调用成本显著降低

AI热点日报时间：2026-06-27

热点解读

先分享一个好消息：OpenAI 悄然上线了提示缓存（Prompt Caching）功能，其核心目标直截了当——帮助开发者降低成本、缩短延迟。具体如何实现？简而言之，系统会重复利用近期已计算过的输入令牌，这样一来，开发者的 API 调用成本最高可降低 50%，提示处理时间也能显著缩短。为何突然推出此

先分享一个好消息：OpenAI 悄然上线了提示缓存（Prompt Caching）功能，其核心目标直截了当——帮助开发者降低成本、缩短延迟。具体如何实现？简而言之，系统会重复利用近期已计算过的输入令牌，这样一来，开发者的 API 调用成本最高可降低 50%，提示处理时间也能显著缩短。

OpenAI发布Prompt Caching - API调用成本更低啦！

为何突然推出此功能？

原因其实很清晰。许多开发者在构建 AI 应用时，经常在多次 API 调用中反复使用相同的上下文。例如，当你正在编辑一个庞大的代码库，或与聊天机器人进行多轮长对话——这些场景下，重复的上下文几乎成为常态。借助提示缓存，这些重复劳动不再构成成本压力。

可用性与定价

即日起，提示缓存将自动应用于 GPT-4o、GPT-4o mini、o1-preview 和 o1-mini 的最新版本，同时也支持这些模型的微调版本。至于定价，下表一目了然：

如何监控缓存使用情况？

对于支持模型的 API 调用，只要提示词超过 1024 个 Token，系统便会自动启用缓存。API 会缓存那些已经计算过的最长前缀——从 1024 个令牌开始，以 128 个令牌为增量逐步扩展。如果开发者重复使用具有共同前缀的提示，OpenAI 会自动应用提示缓存，开发者无需改动 API 集成代码。

那么，如何知晓自己是否用上了缓存？只需关注 API 响应中 usage 字段里的 cached_tokens 值：

usage: {
  total_tokens: 2306,
  prompt_tokens: 2006,
  completion_tokens: 300,
  prompt_tokens_details: {
    cached_tokens: 1920,
    audio_tokens: 0,
  },
  completion_tokens_details: {
    reasoning_tokens: 0,
    audio_tokens: 0,
  }
}

缓存通常在 5-10 分钟不活动后清除，最长保留到缓存最后一次使用后的一小时。因此，若想持续享受优惠，就需要保持频繁调用。

如何高效结构化提示词？

这里有一个关键点：只有提示内完全匹配前缀时，才可能触发缓存命中。想获得缓存收益？方法很简单——将静态内容（如系统指令、示例）放在提示开头，将可变内容（如用户特定信息）放在末尾。这一原则同样适用于图像和工具：它们在不同请求之间必须保持完全一致。

工作原理

缓存是如何运作的呢？简单拆解如下：

缓存查找：系统首先检查你提示的初始部分（即前缀）是否已存在于缓存中。
缓存命中：如果匹配成功，系统直接复用缓存结果，延迟大幅降低，成本也随之缩减。
缓存未命中：若未找到匹配前缀，系统将处理完整提示，处理完成后，该提示前缀会被缓存，供下次使用。

可缓存的内容

消息：完整的消息数组，包括系统、用户和 AI 的交互内容，均可被缓存。
图像：用户消息中附带的图像（无论是链接还是 base64 编码的数据），也能被缓存。同时发送多个图像也没有问题，但需确保 detail 参数保持一致，因为它会影响图像的标记化处理。
工具使用：消息数组和可用的 tools 列表都可以被缓存，有助于快速达到 1024 个令牌的最低门槛。
结构化输出：结构化输出模式作为系统消息的前缀，同样可以被缓存。

最佳实践

将静态或重复内容置于提示开头，动态且多变的内容放在末尾——这才是省钱提速的关键策略。
日常监控缓存命中率、延迟和缓存令牌百分比等指标，以便及时调整提示结构和缓存策略。
想提高缓存命中率？可以尝试更长的提示，或选择非高峰时段发起 API 请求。因为高峰时段缓存清理更频繁。
那些近期未被使用的提示，系统会自动清理出缓存。为避免缓存丢失，建议保持对相同提示前缀的稳定请求流。

祝愿大家的 AI 应用开发越来越顺畅，成本越来越低！

热点追踪提示词

你是一名 AI 行业编辑，请围绕下面这条热点输出一份资讯解读：
热点：OpenAI Prompt Caching 上线，API调用成本显著降低要求：
1. 先用一句话解释这条热点在讲什么
2. 再总结它为什么重要
3. 说明会影响哪些 AI 产品或内容方向
4. 最后给出 3 个适合资讯站使用的标题

来源：https://www.53ai.com/news/finetuning/2024101873214.html

ai 人工智能

上一篇：最新RAG技术栈论文深度解读

下一篇：探索Prompt：基础概念与高级工程技术全攻略

游乐网为非赢利性网站，所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系youleyoucom@outlook.com。

延伸阅读

iPhone 17系列液态硅胶壳曝光：8色可选+挂绳孔设计 iOS 26整合ChatGPT-5：AI全面赋能苹果智能生态真我828真粉节揭晓：10000mAh超大电池手机即将亮相？苹果折叠iPhone曝光：搭载自研C2基带芯片与Touch ID指纹识别对话元戎启行周光：VLA模型核心成本在AI芯片，辅助驾驶方案交付近10万套刘志强：京东方坚持开放合作，拒绝低质低价竞争 Redmi K90系列全系标配5000万长焦与3D超声波指纹，配置再升级 vivo X300系列曝光：天玑9500+2亿像素主摄，长焦微距实力升级

日榜
周榜
月榜

01 / 08-26iPhone 17系列液态硅胶壳曝光：8色可选+挂绳孔设计 02 / 08-26iOS 26整合ChatGPT-5：AI全面赋能苹果智能生态 03 / 08-26真我828真粉节揭晓：10000mAh超大电池手机即将亮相？ 04 / 08-26苹果折叠iPhone曝光：搭载自研C2基带芯片与Touch ID指纹识别 05 / 08-27对话元戎启行周光：VLA模型核心成本在AI芯片，辅助驾驶方案交付近10万套

01 / 本周基于AI的智能图书推荐应用 02 / 本周为您打造全新Mochii智能AI助手，高效办公首选利器 03 / 本周文本AI工具的功能特点与使用教程详细解析 04 / 本周跨平台ChatGPT客户端Cuely使用指南 05 / 本周Lime AI AI驱动数据研究助手

01 / 本月基于AI的智能图书推荐应用 02 / 本月为您打造全新Mochii智能AI助手，高效办公首选利器 03 / 本月文本AI工具的功能特点与使用教程详细解析 04 / 本月跨平台ChatGPT客户端Cuely使用指南 05 / 本月Lime AI AI驱动数据研究助手

热点快看

06-27 16:33基于AI的智能图书推荐应用 06-27 16:33为您打造全新Mochii智能AI助手，高效办公首选利器 06-27 16:33文本AI工具的功能特点与使用教程详细解析 06-27 16:33跨平台ChatGPT客户端Cuely使用指南 06-27 16:32Lime AI AI驱动数据研究助手

热点追踪

持续追踪iPhone 17系列液态硅胶壳曝光：8色可选+挂绳孔设计 持续追踪iOS 26整合ChatGPT-5：AI全面赋能苹果智能生态 持续追踪真我828真粉节揭晓：10000mAh超大电池手机即将亮相？ 持续追踪苹果折叠iPhone曝光：搭载自研C2基带芯片与Touch ID指纹识别