谷歌与字节编程能力为何仍是短板

数码系统

相机 win10

测评 win11

手机智车

华为 Tesla

小米理想

苹果蔚来

游戏软件

LOL 抖音

原神微信

当前位置：首页

AI资讯

谷歌与字节编程能力为何仍是短板

热心网友时间：2026-05-26

转载

最近，《纽约时报》旗下播客的一段采访引发了不小的讨论。谷歌CEO桑达尔·皮查伊在访谈中坦率承认，在AI编程（AI Coding）这个赛道上，谷歌确实落后了。

这多少有些令人意外。毕竟，谷歌在AI领域的实力有目共睹：手握Gemini系列模型，坐拥庞大的搜索、安卓、云服务生态，还有自研的TPU硬件。在刚刚过去的I/O大会上，谷歌几乎把AI能力塞进了每一个核心产品入口。

它并非没有布局AI编程。Antigra vity已经被推向前台，Gemini CLI和Gemini Code Assist也一直在为开发者提供服务。但问题在于，做了不等于做成了；生态全面，也不意味着能自动拿下市场。

如今一提到AI编程工具，开发者们最先想到的，往往还是Claude Code、Codex和Cursor。编程，已经成为AI智能体（Agent）最早跑通、也最卷的战场。几乎所有前沿AI公司都在向这里进军，就连并非以编程见长的DeepSeek，也开始围绕Agent Harness招兵买马。

可以说，AI编程未必是每家AI公司的起点，却正在成为前沿玩家们共同的战略落点。

这种局面下，谷歌的处境并非孤例。在国内，字节跳动面临着相似的尴尬。两者都拥有从模型到应用再到基础设施的完整AI生态，但在AI编程这个具体领域，字节的Trae和谷歌的Antigra vity一样，都还只是众多可选项中的一个名字，远未成为开发者绕不开的“必需品”。

如果这些巨头想在以智能体为核心的新时代，继续维持其“全家桶”式的平台地位，那么，补齐AI编程这块短板，已是迫在眉睫。

01 没拿下程序员

谷歌在AI编程上的核心问题，并非缺少产品，而是缺少真正拥趸的用户。

市场数据很能说明问题。Codex拥有超过400万的周活跃用户，而Claude Code则在开发者心智上取得了显著胜利。今年2月，The Pragmatic Engineer面向软件工程师的AI工具调查显示，Claude Code以46%的占比成为最受喜爱的工具。Business Insider在5月23日的报道中也指出，在众多创业公司内部，Claude Code已成为处理复杂工程任务时的首选。

相比之下，Antigra vity似乎乏善可陈，它更像是一个背靠谷歌生态大厦的“附属品”，而非一个凭借自身实力赢得口碑的独立产品。

从开发者的实际体感来看，Antigra vity也未能建立起足够的信任。大约五个月前，就有人专门整理了Reddit社区里超过100条关于Antigra vity的讨论，将最常见的痛点归纳为几类：额度机制混乱、性能消耗资源、安全担忧、模型选择问题，以及智能体擅自删除或改坏代码。

按理说，这些问题本应在后续更新中得到解决。Antigra vity 2.0的发布，曾被视作谷歌追赶AI编程浪潮的一个重要节点。然而，更新后的社群反响，依然算不上乐观。

目前最大的争议点在于，Antigra vity 2.0将产品形态从原本偏向集成开发环境（IDE）的体验，突然转向了一个更偏向“智能体管理器”（Agent Manager）的界面。用户熟悉的编辑器、文件树、终端、版本控制和扩展环境变得难以寻觅，不得不被迫适应一套全新的交互逻辑。

或许谷歌认为这是在向更智能、更自动化的未来迈进。但事实是，在尚未充分建立用户信任之前，就试图让开发者从“可控的IDE协作”模式，直接跳转到“黑盒式的智能体调度”模式，这几乎等同于放弃了原有的产品路径，也连带疏远了原先积累的那批用户。

更令人头疼的是，额度混乱的问题不仅没解决，反而变本加厉。

从5月20日开始，Gemini的限额机制从按调用次数计费，转向了更接近实际算力消耗的口径。Antigra vity官方声称Pro用户享有每5小时刷新的额度，但同时却又设置了每周上限。用户无法预知一次智能体任务会消耗多少算力，也不清楚自己何时会触及周限额天花板。一旦在长任务中途遭遇限额，整个开发流程就可能被强行打断。

更要命的是底层模型的表现。谷歌最新发布的Gemini 3.5 Flash虽然以速度见长，但在编程任务的稳定性和准确性上仍存疑虑。

有用户吐槽，自己只是让Gemini 3.5 Flash提供一个代码重构计划，它却直接开始动手修改代码，随后声称重构成功，但核心目标基本没完成，最后甚至在没有得到许可的情况下，恢复了一个无关的文件。

还有用户抱怨，即便明确给出了目标文件、行号和具体的修改指令，3.5 Flash仍然会反复探索同一批文件，而不是直接执行代码改动。在这个过程中，Token像不要钱似地被大量消耗。

总结来看，Antigra vity面临的是一个“三重困境”：产品形态突变，让用户感觉熟悉的工作台被拆解；额度规则不透明，长任务缺乏确定性保障；底层模型在真实代码库中的执行稳定性仍受质疑。这三者叠加，使得Antigra vity至今未能向开发者证明，它是一个值得托付和信赖的日常工具。

02 谷歌已经开始补课

当然，谷歌并非没有意识到问题的严重性。

在最近的采访中，皮查伊其实把谷歌的短板说得很清楚：如果比较文本、多模态、语音、音频、推理和整体智能，谷歌仍然极具竞争力；但具体到AI编程、工具使用、复杂指令遵循和长周期任务执行这些领域，谷歌确实有所落后。

他特别指出，谷歌过去在编程领域，可能缺乏像Claude Code或Cursor那样连贯的数据流和极致聚焦的产品体验。

这也正是谷歌当前一系列追赶动作的内在逻辑。

过去很长一段时间，谷歌面向开发者的AI工具线比较分散：Gemini Code Assist、Gemini CLI、Antigra vity、以及Firebase的相关工具各自为战，缺乏一个清晰统一的主入口。I/O大会之后，谷歌开始着手整合，将这条产品线向Antigra vity集中。Gemini CLI和Gemini Code Assist面向个人用户的能力，正逐步迁移到Antigra vity CLI和Antigra vity 2.0中。

谷歌迫切需要一个统一的入口，将Gemini真正嵌入复杂的软件工程流程，从而获取足够多的真实任务数据、失败案例、工具调用记录以及长周期任务数据，用以反哺模型迭代。

然而，同样是切入真实工作流，不同玩家的策略截然不同。Claude Code的做法是让智能体贴着开发者原有的终端和代码库工作；Cursor的策略是把AI深度集成进IDE，让人随时可以查看、修改和接管。反观Antigra vity 2.0，其产品形态则显得颇为激进——它直接将开发者“抬高”了一层，推到一个智能体管理器中，去查看任务进度、等待结果交付。

这种设计并非没有道理，甚至可能是未来的方向之一。但前提是，用户已经对这个智能体建立了充分的信任。而Antigra vity恰恰在尚未建立这种信任时，就先削弱了开发者熟悉的IDE协作体验。这或许只能解释为“不破不立”，但其中的阵痛和用户适应期，恐怕还需要一段时间来消化。

除了整合产品入口，谷歌也在补强其背后的智能体基础设施。官方已经开放了Antigra vity SDK的预览版，允许开发者基于这套框架构建自己的定制化智能体。

这背后，多少能看到Claude Code的“他山之石”。Claude Code的成功，不仅仅归功于Claude模型本身，更在于Anthropic将模型置入了一套成熟的Agent Harness（智能体驾驭系统）之中。许多开发者青睐Claude Code，正是因为它足够贴近真实的开发现场——终端、代码库、Git操作、测试、报错信息都近在眼前。谷歌显然也在吸收这套经验。

在组织层面，据The Information报道，Google DeepMind已经组建了一支针对AI编程模型能力的专项小组，由研究员和工程师集中攻关，旨在改善Gemini的代码能力。这支团队由Google DeepMind的研究工程师Sebastian Borgeaud牵头，DeepMind的首席技术官Koray Ka vukcuoglu乃至谷歌联合创始人Sergey Brin据称也参与其中。

所有这些动作都表明，谷歌已经开始全力补课。但这并不能直接证明，它一定能追上领先者。

回顾历史，谷歌并不缺少“集中力量补短板”的时刻。在社交网络时代，它曾推出Google+追赶Facebook；在移动通讯时代，也尝试用Allo对标WhatsApp、iMessage和Messenger。这些产品背后，同样有谷歌账号体系、搜索流量、安卓入口和强大的工程资源支撑，但最终都未能真正改变市场格局。

这并非预言Antigra vity会重蹈覆辙。AI编程与社交、通讯是完全不同的市场，谷歌手中也确实掌握着Gemini、云服务、开发者工具和企业客户这些更贴近软件工程的资产。但历史提醒我们一件事：巨头的资源只能把产品推到用户面前，却无法替产品赢得用户的使用习惯和心智认同。

如今的Antigra vity，已经被谷歌推到了更重要的战略位置。但它仍需证明，自己不是一个被强行整合出来的入口，而是一个真正能够承接开发者日常工作、提升生产效率的可靠工具。

对此，皮查伊倒是显得信心十足。他在采访中表示，自己对此“非常、非常乐观”，并相信谷歌终将“突破这一关”。

03 全家桶救不了不稳定的Agent

字节跳动的境遇，与谷歌有着惊人的相似性。

字节手中同样握有一套相当完整的AI“全家桶”：从面向大众的豆包、即梦，到内容生产的剪映、CapCut，再到企业协作的飞书、云服务火山引擎、智能体平台扣子，最后到AI编程工具Trae。从普通用户到内容创作者，从企业服务到基础设施，从智能体平台到开发工具，字节几乎在每一层都已完成布局。

然而，具体到AI编程这个细分战场，Trae和Antigra vity一样，都尚未成为开发者心目中那个不可或缺的“王牌工具”。

字节当然也在奋力追赶。Trae早已不只是一个AI IDE，它推出了Trae SOLO，试图切入用户的真实工作流；也开源了Trae Agent，旨在弥补开发者心智和技术信任上的短板。从招聘动向和产品迭代来看，Trae已被字节打造成一条完整的产品线，覆盖了智能体基础架构、AI编程环境、模型算法、开发者运营乃至企业客户服务等多个方向。

谷歌有Gemini、Antigra vity、Google Cloud、Firebase、Android、Workspace；字节有豆包、Trae、飞书、火山引擎、扣子和庞大的内容生态。它们本质上都不是单点工具公司，而是追求协同效应的平台型公司。

从收入结构看，AI编程对它们而言，更像是一个战略入口：开发者入口、云服务入口、企业研发流程的入口。

谷歌的财报显示，Google Services（搜索、YouTube、订阅等）仍是绝对的收入支柱，而Google Cloud则是增长最快的业务之一。字节虽未上市，但据路透社等第三方机构披露，其核心收入同样主要来自抖音/TikTok等内容平台上的广告、电商、直播等变&现模式。

这意味着，谷歌不靠Antigra vity也能活得很好，字节没有Trae也不会伤筋动骨。但是，如果它们想在以智能体为主导的新时代，继续保持平台级公司的统治力，就不能长期缺失这个关键的“开发者入口”。

微软已经证明了开发工具的战略价值，这种价值未必体现在直接收入上。VS Code是免费的，GitHub长期也不靠软件授权赚钱，但它们成功锁住了全球开发者的核心工作流。一个工程师在哪里写代码、管理代码、调用AI，最后就很可能在哪里部署应用、采购云服务、接入企业级工具链。

AI编程遵循着同样的逻辑。谁能拿下开发者每天打开的第一个工作台，谁就更容易向后延伸，承接云服务、模型调用、数据库、应用部署、监控、安全以及企业协作等一系列需求。

谷歌和字节都拥有强大的生态，但AI编程市场并非一个仅靠生态导流就能轻松取胜的战场。对于开发者而言，最关键的永远是：这个工具背后的模型，在真实的、复杂的代码库里，到底能不能稳定、可靠地干活。

一个合格的编程智能体，要解决的远不止是“生成一段代码”（这种工作聊天机器人也能做）。它需要知道应该查看哪些文件，忽略哪些无关文件；需要精准理解用户的真实意图，而不是进行反复无效的探索；需要能够根据报错信息持续修复；需要懂得何时该自动执行，何时该先询问确认；需要尽可能少地制造垃圾文件，避免误改生产代码，减少将Token浪费在无效的搜索循环上。

而这些能力的根基，最终都回归到底层模型。

Antigra vity暴露的许多问题，表面上看是产品设计问题：智能体管理器过于“黑盒”、额度不透明、任务易中断、文件改动不可控。但往深处看，很多也是模型能力问题：如果模型足够强大，能够准确判断该看哪里、该改哪里、何时该停止，那么用户对“不可靠”的感知就不会如此强烈。

这也解释了为何Claude Code和Codex能够率先脱颖而出。Claude Code的成功，首要原因在于Claude模型本身在代码理解、长上下文处理、工具调用和复杂任务规划上足够强悍；Codex亦然，OpenAI能将其打造成大规模的开发者入口，依靠的正是模型在软件工程任务上的持续迭代和优化。

当然，产品设计至关重要。智能体驾驭系统（Harness）、权限控制、操作回滚、插件生态、移动端审批、第三方工具接入……这些环节都不可或缺。但它们本质上都是为了给强大的模型提供一个更好的“发挥舞台”。如果模型本身不够稳定、不够聪明，再完善的生态也只会将这种不稳定性放大。只有当模型足够强大时，优秀的产品设计和生态整合，才有机会将技术能力转化为牢不可破的工作流习惯。

因此，AI编程的竞争，拼到最后可以分为三个层次：第一层是模型能力，这是基石；第二层是工具与框架，这是桥梁；第三层才是生态协同，这是放大器。

谷歌和字节都不缺第三层的生态。它们面临的真正挑战在于，能否将第一层的模型能力、第二层的智能体框架，与开发者真实的工作流，整合成一个稳定、高效、可信赖的系统。

巨头们固然可以把入口铺得又广又满，但倘若底层模型无法稳健支撑复杂的软件工程任务，这块“技术软肋”就会一直暴露在竞争对手面前。生态可以把开发者带到门口，而模型和产品的终极稳定性，才决定了他们是否会真正留下来，并为之付费。

来源:https://36kr.com/p/3825829999992834

上一篇： 20年前奔腾4处理器成功运行Llama3大模型实测

下一篇：昆仑万维天工SkyClaw-v1.0发布国产高性能Agent模型实现突破