数码系统

相机 win10

测评 win11

手机智车

华为 Tesla

小米理想

苹果蔚来

游戏软件

LOL 抖音

原神微信

当前位置：首页

AI资讯

热点详情

Google Gemini API免费放量1M TPM OpenAI和Anthropic开发者坐不住了

AI热点日报时间：2026-07-01

热点解读

你可能没想到：一个免费的 Google 账号就能获取 Gemini API，并享受高达 100 万 TPM 的速率限制。这并非画饼充饥——6 月 28 日，开发者 @k2sbhai 在 X 平台晒出实锤，配文仅两个词：free, 1M TPM。帖子瞬间引爆，上千条收藏，评论区两极分化——有人感叹“搁

你可能没想到：一个免费的 Google 账号就能获取 Gemini API，并享受高达 100 万 TPM 的速率限制。这并非画饼充饥——6 月 28 日，开发者 @k2sbhai 在 X 平台晒出实锤，配文仅两个词：free, 1M TPM。帖子瞬间引爆，上千条收藏，评论区两极分化——有人感叹“搁置的创业想法突然有了希望”，也有人截图反驳：“我的控制面板明明只显示 250k”。

▲ @k2sbhai 主帖，展示 Gemini 2.5 免费 1M TPM 额度与操作步骤，获 1.4k 赞、12 万+ 浏览

究竟谁才是真相？别急，我们先来看看官方怎么说。

官方白纸黑字：完全免费

打开 Google 的 Gemini API 定价页面，答案一目了然：免费层，输入与输出 tokens 全部免费，在 Google AI Studio 中可直接使用。唯一附带条件是：免费提交的内容可能被用于产品改进（付费后可关闭此选项）。

▲ Google Gemini API 官方定价页面，免费层明确标注“免费输入与输出 tokens”

覆盖的模型列表也相当丰富：Gemini 2.5 Flash、Flash-Lite、2.5 Pro，甚至更早的 2.0 系列，均标注了免费层可用。文档措辞毫不含糊——“以慷慨的限额免费开始构建”。

这意味着什么？一位独立开发者现在就能零成本获取具备生产级速率限制的 Gemini API，支持文本、图像、音频、视频全模态输入。但事情远没这么简单。

Grok 泼冷水：大多只是炒作

就在帖子疯狂传播的同时，X 上的 AI 助手 Grok 直接回复了一句：“不，大多是炒作。”

▲ Grok 官方账号回复：Flash 部分变体确实达到 ~1M TPM，但常见值是 250k，Pro 更严格

Grok 承认了几个事实：你确实可以用 Google 账号免费生成 Gemini API 密钥；Flash 模型的某些变体确实能达到 ~1M TPM；多模态功能也可用。但关键信息被混淆了——Gemini 2.5 Flash 在免费层通常约为 250k TPM / 10 RPM。2.5 Pro 严格得多，通常只有几十个请求/天。

配额因账号和时段而异，需登录 AI Studio 仪表盘才能看到你的真实数字。Grok 的结论：适合测试，但别当作“随意无限量”。社区反馈也印证了这一点——有巴西用户反映当地看不到高额度，有人截图显示“500k max + 50 req/DAY”，还有人直接喊假新闻。

真相很可能如下：Google 的免费额度在动态调整，部分账号/模型组合确实能拿到 1M TPM，但绝非所有人都相同。官方文档也明确指出——“指定的速率限制不保证一定实现”。

但即便是 250k，差距也已碾压

一个更冷静的分析来自 @stretchcloud。他算了一笔账：1M tokens/min 相当于每分钟约 250 次 GPT-4 级调用，费用为零。

▲ @stretchcloud 分析帖：免费 1M TPM 对独立构建者和小团队来说是游戏规则的改变

直接对比一目了然：

OpenAI 免费层：RPM 个位数到十位数，TPM 几万，需信用卡验证，生产环境几乎必付费
Anthropic：Claude API 没有面向消费者的免费入口，使用就必须绑定账单
Groq / Together AI：每月 200 美元的初创公司现在有理由重新评估了

结论很明确：赢家是独立构建者和小团队，输家是 API 转售商。即便你只拿到 250k TPM 的 Flash 额度，依然能做正经事——运行 RAG 索引、批量分类用户反馈、处理多模态数据。这些过去都是要付费才能触及的领域。

TPM 究竟是什么？搞懂三个关键数字

如果你对 API 限流还不熟悉，这里有个速成指南：

TPM（每分钟 Token 数）：每分钟允许输入的 token 总量上限。1M TPM 意味着你一分钟内可以提交约 100 万 token 的输入
RPM（每分钟请求数）：每分钟请求次数的上限。即使 token 没超，请求太频繁也会被限制
RPD（每日请求数）：每天请求总数，这往往才是真正的瓶颈

实际使用中，RPM 和 RPD 通常比 TPM 更早触发限制。比如 Flash 的 RPM 可能只有 10-15，意味着即便 TPM 够用，你也无法在一分钟内发送几百个请求。Pro 的情况更极端：TPM 也许还行，但 RPD 可能低到只有几十。适合“关键一步”的深度推理，撑不起全量流水线。

记住这个公式：实际可用吞吐 = min(TPM, RPM × 平均请求大小, RPD / 活跃分钟数)。三个限制，哪个最小哪个说了算。这并非高深理论，而是每个 API 开发者都必须摸爬滚打才能掌握的常识。

从 Maps 到 Gemini：Google 的免费套路从未改变

如果你在行业里待得够久，会觉得这一幕似曾相识。Google Maps API 早期完全免费，大量应用基于它构建。等开发者迁移成本足够高后，收费便开始了。Firebase、BigQuery sandbox、Colab——同样的模式，同样的节奏。

现在轮到了推理层。Google 的逻辑一直很清晰：将实验的边际成本推向零，把生产的确定性留给付费层。一旦开发者习惯了 Gemini SDK、熟悉了多模态调用方式，切换到 OpenAI 或 Anthropic 的摩擦成本就会陡增。

定价页面设计了平滑的升级路径：消费满 $100 自动升到 Tier 1，获得更高速率上限和 context caching 等高级功能。免费层给你的恰好够用——够做实验、够跑 demo、够上瘾，但不够支撑生产。教科书式的游击战操作。

4 步获取 Key，1 分钟上手

这可能是目前市面上摩擦最小的 AI API 获取体验：

打开 aistudio.google.com
用 Google 账号登录
在 playground 选择 Flash 或 Pro
点击 Get API key，几秒即可生成

拿到 key 之后的最佳实践：

高并发简单任务（分类、提取、批量补全）→ 使用 Gemini 2.5 Flash
复杂推理（长链 agent、大代码库分析）→ 使用 Gemini 2.5 Pro，但需关注 RPD 限制
混合路由：90% 请求走 Flash，10% 关键步骤走 Pro，最大化免费额度

▲ Google 官方速率限制文档，强调“在 AI Studio 查看你的活跃速率限制”

冷水要泼，但窗口真实存在

说完好处，风险也得讲清楚。首先，额度不固定。仪表盘今天显示 1M，明天可能变成 250k。Google 的原话：“指定的速率限制不保证实现。”历史上已有多次用户报告 RPD 从 250 骤降到 20 的案例。

项目级共享。同一个 Google Cloud 项目下的多个 key 共用一份配额，换 key 无效。

免费内容可能被用于训练。如果你的 prompt 涉及敏感数据或客户信息，要么脱敏，要么直接使用付费层。

地区差异。有用户反映不同国家和账号看到的额度完全不同。

但这些风险不影响一个核心判断：对于仍在验证想法的独立开发者和小团队，当前的窗口期值得把握。用零成本把原型跑起来、把 prompt 调好、把 workflow 搭好——这些积累不会因为额度变化而消失。

聪明的做法是，把 provider 抽象成一层接口。今天跑 Gemini 免费层，明天额度收紧就切 OpenAI 或自托管——核心逻辑无需改动。

Google 此次展示的高免费额度，本质上是 AI 基建价格战的又一轮加码。对开发者而言，该薅的羊毛要薅，该存的 key 要存，该跑的实验趁现在跑。

但别忘了去 AI Studio 查一下你自己的仪表盘数字——因为你看到的，很可能和推特上的截图不一样。

热点追踪提示词

你是一名 AI 行业编辑，请围绕下面这条热点输出一份资讯解读：
热点：Google Gemini API免费放量1M TPM OpenAI和Anthropic开发者坐不住了要求：
1. 先用一句话解释这条热点在讲什么
2. 再总结它为什么重要
3. 说明会影响哪些 AI 产品或内容方向
4. 最后给出 3 个适合资讯站使用的标题

来源：https://www.53ai.com/news/LargeLanguageModel/2026063027341.html

ai 人工智能

上一篇：告别云端付费，开源AI 3秒克隆声音，手机CPU实时运行

下一篇：Codex权限Sandbox配置不再一刀切

游乐网为非赢利性网站，所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系youleyoucom@outlook.com。