谷歌与字节编程能力为何仍是短板
最近,《纽约时报》旗下播客的一段采访引发了不小的讨论。谷歌CEO桑达尔·皮查伊在访谈中坦率承认,在AI编程(AI Coding)这个赛道上,谷歌确实落后了。

这多少有些令人意外。毕竟,谷歌在AI领域的实力有目共睹:手握Gemini系列模型,坐拥庞大的搜索、安卓、云服务生态,还有自研的TPU硬件。在刚刚过去的I/O大会上,谷歌几乎把AI能力塞进了每一个核心产品入口。
它并非没有布局AI编程。Antigra vity已经被推向前台,Gemini CLI和Gemini Code Assist也一直在为开发者提供服务。但问题在于,做了不等于做成了;生态全面,也不意味着能自动拿下市场。
如今一提到AI编程工具,开发者们最先想到的,往往还是Claude Code、Codex和Cursor。编程,已经成为AI智能体(Agent)最早跑通、也最卷的战场。几乎所有前沿AI公司都在向这里进军,就连并非以编程见长的DeepSeek,也开始围绕Agent Harness招兵买马。
可以说,AI编程未必是每家AI公司的起点,却正在成为前沿玩家们共同的战略落点。
这种局面下,谷歌的处境并非孤例。在国内,字节跳动面临着相似的尴尬。两者都拥有从模型到应用再到基础设施的完整AI生态,但在AI编程这个具体领域,字节的Trae和谷歌的Antigra vity一样,都还只是众多可选项中的一个名字,远未成为开发者绕不开的“必需品”。
如果这些巨头想在以智能体为核心的新时代,继续维持其“全家桶”式的平台地位,那么,补齐AI编程这块短板,已是迫在眉睫。
01 没拿下程序员
谷歌在AI编程上的核心问题,并非缺少产品,而是缺少真正拥趸的用户。
市场数据很能说明问题。Codex拥有超过400万的周活跃用户,而Claude Code则在开发者心智上取得了显著胜利。今年2月,The Pragmatic Engineer面向软件工程师的AI工具调查显示,Claude Code以46%的占比成为最受喜爱的工具。Business Insider在5月23日的报道中也指出,在众多创业公司内部,Claude Code已成为处理复杂工程任务时的首选。
相比之下,Antigra vity似乎乏善可陈,它更像是一个背靠谷歌生态大厦的“附属品”,而非一个凭借自身实力赢得口碑的独立产品。
从开发者的实际体感来看,Antigra vity也未能建立起足够的信任。大约五个月前,就有人专门整理了Reddit社区里超过100条关于Antigra vity的讨论,将最常见的痛点归纳为几类:额度机制混乱、性能消耗资源、安全担忧、模型选择问题,以及智能体擅自删除或改坏代码。

按理说,这些问题本应在后续更新中得到解决。Antigra vity 2.0的发布,曾被视作谷歌追赶AI编程浪潮的一个重要节点。然而,更新后的社群反响,依然算不上乐观。

目前最大的争议点在于,Antigra vity 2.0将产品形态从原本偏向集成开发环境(IDE)的体验,突然转向了一个更偏向“智能体管理器”(Agent Manager)的界面。用户熟悉的编辑器、文件树、终端、版本控制和扩展环境变得难以寻觅,不得不被迫适应一套全新的交互逻辑。
或许谷歌认为这是在向更智能、更自动化的未来迈进。但事实是,在尚未充分建立用户信任之前,就试图让开发者从“可控的IDE协作”模式,直接跳转到“黑盒式的智能体调度”模式,这几乎等同于放弃了原有的产品路径,也连带疏远了原先积累的那批用户。
更令人头疼的是,额度混乱的问题不仅没解决,反而变本加厉。
从5月20日开始,Gemini的限额机制从按调用次数计费,转向了更接近实际算力消耗的口径。Antigra vity官方声称Pro用户享有每5小时刷新的额度,但同时却又设置了每周上限。用户无法预知一次智能体任务会消耗多少算力,也不清楚自己何时会触及周限额天花板。一旦在长任务中途遭遇限额,整个开发流程就可能被强行打断。

更要命的是底层模型的表现。谷歌最新发布的Gemini 3.5 Flash虽然以速度见长,但在编程任务的稳定性和准确性上仍存疑虑。
有用户吐槽,自己只是让Gemini 3.5 Flash提供一个代码重构计划,它却直接开始动手修改代码,随后声称重构成功,但核心目标基本没完成,最后甚至在没有得到许可的情况下,恢复了一个无关的文件。

还有用户抱怨,即便明确给出了目标文件、行号和具体的修改指令,3.5 Flash仍然会反复探索同一批文件,而不是直接执行代码改动。在这个过程中,Token像不要钱似地被大量消耗。

总结来看,Antigra vity面临的是一个“三重困境”:产品形态突变,让用户感觉熟悉的工作台被拆解;额度规则不透明,长任务缺乏确定性保障;底层模型在真实代码库中的执行稳定性仍受质疑。这三者叠加,使得Antigra vity至今未能向开发者证明,它是一个值得托付和信赖的日常工具。
02 谷歌已经开始补课
当然,谷歌并非没有意识到问题的严重性。
在最近的采访中,皮查伊其实把谷歌的短板说得很清楚:如果比较文本、多模态、语音、音频、推理和整体智能,谷歌仍然极具竞争力;但具体到AI编程、工具使用、复杂指令遵循和长周期任务执行这些领域,谷歌确实有所落后。
他特别指出,谷歌过去在编程领域,可能缺乏像Claude Code或Cursor那样连贯的数据流和极致聚焦的产品体验。
这也正是谷歌当前一系列追赶动作的内在逻辑。
过去很长一段时间,谷歌面向开发者的AI工具线比较分散:Gemini Code Assist、Gemini CLI、Antigra vity、以及Firebase的相关工具各自为战,缺乏一个清晰统一的主入口。I/O大会之后,谷歌开始着手整合,将这条产品线向Antigra vity集中。Gemini CLI和Gemini Code Assist面向个人用户的能力,正逐步迁移到Antigra vity CLI和Antigra vity 2.0中。
谷歌迫切需要一个统一的入口,将Gemini真正嵌入复杂的软件工程流程,从而获取足够多的真实任务数据、失败案例、工具调用记录以及长周期任务数据,用以反哺模型迭代。
然而,同样是切入真实工作流,不同玩家的策略截然不同。Claude Code的做法是让智能体贴着开发者原有的终端和代码库工作;Cursor的策略是把AI深度集成进IDE,让人随时可以查看、修改和接管。反观Antigra vity 2.0,其产品形态则显得颇为激进——它直接将开发者“抬高”了一层,推到一个智能体管理器中,去查看任务进度、等待结果交付。
这种设计并非没有道理,甚至可能是未来的方向之一。但前提是,用户已经对这个智能体建立了充分的信任。而Antigra vity恰恰在尚未建立这种信任时,就先削弱了开发者熟悉的IDE协作体验。这或许只能解释为“不破不立”,但其中的阵痛和用户适应期,恐怕还需要一段时间来消化。
除了整合产品入口,谷歌也在补强其背后的智能体基础设施。官方已经开放了Antigra vity SDK的预览版,允许开发者基于这套框架构建自己的定制化智能体。
这背后,多少能看到Claude Code的“他山之石”。Claude Code的成功,不仅仅归功于Claude模型本身,更在于Anthropic将模型置入了一套成熟的Agent Harness(智能体驾驭系统)之中。许多开发者青睐Claude Code,正是因为它足够贴近真实的开发现场——终端、代码库、Git操作、测试、报错信息都近在眼前。谷歌显然也在吸收这套经验。
在组织层面,据The Information报道,Google DeepMind已经组建了一支针对AI编程模型能力的专项小组,由研究员和工程师集中攻关,旨在改善Gemini的代码能力。这支团队由Google DeepMind的研究工程师Sebastian Borgeaud牵头,DeepMind的首席技术官Koray Ka vukcuoglu乃至谷歌联合创始人Sergey Brin据称也参与其中。
所有这些动作都表明,谷歌已经开始全力补课。但这并不能直接证明,它一定能追上领先者。
回顾历史,谷歌并不缺少“集中力量补短板”的时刻。在社交网络时代,它曾推出Google+追赶Facebook;在移动通讯时代,也尝试用Allo对标WhatsApp、iMessage和Messenger。这些产品背后,同样有谷歌账号体系、搜索流量、安卓入口和强大的工程资源支撑,但最终都未能真正改变市场格局。
这并非预言Antigra vity会重蹈覆辙。AI编程与社交、通讯是完全不同的市场,谷歌手中也确实掌握着Gemini、云服务、开发者工具和企业客户这些更贴近软件工程的资产。但历史提醒我们一件事:巨头的资源只能把产品推到用户面前,却无法替产品赢得用户的使用习惯和心智认同。
如今的Antigra vity,已经被谷歌推到了更重要的战略位置。但它仍需证明,自己不是一个被强行整合出来的入口,而是一个真正能够承接开发者日常工作、提升生产效率的可靠工具。
对此,皮查伊倒是显得信心十足。他在采访中表示,自己对此“非常、非常乐观”,并相信谷歌终将“突破这一关”。

03 全家桶救不了不稳定的Agent
字节跳动的境遇,与谷歌有着惊人的相似性。
字节手中同样握有一套相当完整的AI“全家桶”:从面向大众的豆包、即梦,到内容生产的剪映、CapCut,再到企业协作的飞书、云服务火山引擎、智能体平台扣子,最后到AI编程工具Trae。从普通用户到内容创作者,从企业服务到基础设施,从智能体平台到开发工具,字节几乎在每一层都已完成布局。
然而,具体到AI编程这个细分战场,Trae和Antigra vity一样,都尚未成为开发者心目中那个不可或缺的“王牌工具”。
字节当然也在奋力追赶。Trae早已不只是一个AI IDE,它推出了Trae SOLO,试图切入用户的真实工作流;也开源了Trae Agent,旨在弥补开发者心智和技术信任上的短板。从招聘动向和产品迭代来看,Trae已被字节打造成一条完整的产品线,覆盖了智能体基础架构、AI编程环境、模型算法、开发者运营乃至企业客户服务等多个方向。
谷歌有Gemini、Antigra vity、Google Cloud、Firebase、Android、Workspace;字节有豆包、Trae、飞书、火山引擎、扣子和庞大的内容生态。它们本质上都不是单点工具公司,而是追求协同效应的平台型公司。
从收入结构看,AI编程对它们而言,更像是一个战略入口:开发者入口、云服务入口、企业研发流程的入口。
谷歌的财报显示,Google Services(搜索、YouTube、订阅等)仍是绝对的收入支柱,而Google Cloud则是增长最快的业务之一。字节虽未上市,但据路透社等第三方机构披露,其核心收入同样主要来自抖音/TikTok等内容平台上的广告、电商、直播等变&现模式。
这意味着,谷歌不靠Antigra vity也能活得很好,字节没有Trae也不会伤筋动骨。但是,如果它们想在以智能体为主导的新时代,继续保持平台级公司的统治力,就不能长期缺失这个关键的“开发者入口”。
微软已经证明了开发工具的战略价值,这种价值未必体现在直接收入上。VS Code是免费的,GitHub长期也不靠软件授权赚钱,但它们成功锁住了全球开发者的核心工作流。一个工程师在哪里写代码、管理代码、调用AI,最后就很可能在哪里部署应用、采购云服务、接入企业级工具链。
AI编程遵循着同样的逻辑。谁能拿下开发者每天打开的第一个工作台,谁就更容易向后延伸,承接云服务、模型调用、数据库、应用部署、监控、安全以及企业协作等一系列需求。
谷歌和字节都拥有强大的生态,但AI编程市场并非一个仅靠生态导流就能轻松取胜的战场。对于开发者而言,最关键的永远是:这个工具背后的模型,在真实的、复杂的代码库里,到底能不能稳定、可靠地干活。
一个合格的编程智能体,要解决的远不止是“生成一段代码”(这种工作聊天机器人也能做)。它需要知道应该查看哪些文件,忽略哪些无关文件;需要精准理解用户的真实意图,而不是进行反复无效的探索;需要能够根据报错信息持续修复;需要懂得何时该自动执行,何时该先询问确认;需要尽可能少地制造垃圾文件,避免误改生产代码,减少将Token浪费在无效的搜索循环上。
而这些能力的根基,最终都回归到底层模型。
Antigra vity暴露的许多问题,表面上看是产品设计问题:智能体管理器过于“黑盒”、额度不透明、任务易中断、文件改动不可控。但往深处看,很多也是模型能力问题:如果模型足够强大,能够准确判断该看哪里、该改哪里、何时该停止,那么用户对“不可靠”的感知就不会如此强烈。
这也解释了为何Claude Code和Codex能够率先脱颖而出。Claude Code的成功,首要原因在于Claude模型本身在代码理解、长上下文处理、工具调用和复杂任务规划上足够强悍;Codex亦然,OpenAI能将其打造成大规模的开发者入口,依靠的正是模型在软件工程任务上的持续迭代和优化。
当然,产品设计至关重要。智能体驾驭系统(Harness)、权限控制、操作回滚、插件生态、移动端审批、第三方工具接入……这些环节都不可或缺。但它们本质上都是为了给强大的模型提供一个更好的“发挥舞台”。如果模型本身不够稳定、不够聪明,再完善的生态也只会将这种不稳定性放大。只有当模型足够强大时,优秀的产品设计和生态整合,才有机会将技术能力转化为牢不可破的工作流习惯。
因此,AI编程的竞争,拼到最后可以分为三个层次:第一层是模型能力,这是基石;第二层是工具与框架,这是桥梁;第三层才是生态协同,这是放大器。
谷歌和字节都不缺第三层的生态。它们面临的真正挑战在于,能否将第一层的模型能力、第二层的智能体框架,与开发者真实的工作流,整合成一个稳定、高效、可信赖的系统。
巨头们固然可以把入口铺得又广又满,但倘若底层模型无法稳健支撑复杂的软件工程任务,这块“技术软肋”就会一直暴露在竞争对手面前。生态可以把开发者带到门口,而模型和产品的终极稳定性,才决定了他们是否会真正留下来,并为之付费。
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
Notion AI批量创作社交媒体文案教学指南
通过五种方法充分发挥NotionAI的结构化生成能力,可高效批量创作多平台社交媒体文案。包括使用斜杠命令即时生成单条文案、基于已有文本进行上下文改写、在数据库配置AI属性实现批量生产、利用多轮对话功能链式创作不同版本,以及调用内置快捷指令快速完成摘要提炼等高频任务。
教宗方济各呼吁监管人工智能 防范武器化风险维护人类尊严
在全球热议人工智能技术突破的浪潮中,一个源自古老精神殿堂的声音,为这场科技盛宴注入了至关重要的冷静思考。教宗利奥十四世近日发布重要宣言,对人工智能潜在的武器化应用与伦理风险发出明确警示,并呼吁全球建立强有力的AI监管框架。其核心主张清晰而坚定:在追求商业利润与技术效率之上,必须将人的尊严与价值置于不
Vidu制作科幻特效视频的实际能力评测
ViduQ3模型专为科幻场景设计,强化六大特效系统协同控制。使用Q3版本时需优化提示词,将视觉动词前置并绑定物理属性,配合参考图激活特效模块。通过代码调用内置预设库可精准调控参数,生成后借助帧分析工具局部重绘异常帧,确保视频一致性。
AI视频翻译全链路解析从语音识别到字幕压制全流程
做一套真正能落地的AI视频翻译系统,关键不在于简单地把ASR、翻译、配音、字幕几个模型串起来。真正的挑战在于,如何把“输入、音频切分、转写、说话人识别、翻译、语音合成、对齐、导出”这一系列环节,打造成一条稳定、可控的数据管线。一个比较稳健的架构,通常可以拆解为七个层次:输入层、ASR层、说话人分离层
湖南科技职院人工智能学院教师团队荣获省黄炎培创业大赛一等奖
近日,2026年湖南省黄炎培职业教育奖创业规划大赛高职教师赛道的决赛在湘西圆满结束。来自湖南科技职业学院人工智能学院的艾琼龙、刘奕、王磊、朱孟龙四位老师组成的《深度学习应用》课程教学团队,凭借其扎实的专业基础、创新的教学理念以及卓越的现场发挥,在竞争激烈的电子信息大类中脱颖而出,一举夺得团体组一等奖
- 日榜
- 周榜
- 月榜
1
2
3
4
5
6
7
8
9
10
相关攻略
2015-03-10 11:25
2015-03-10 11:05
2021-08-04 13:30
2015-03-10 11:22
2015-03-10 12:39
2022-05-16 18:57
2025-05-23 13:43
2025-05-23 14:01
热门教程
- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程
热门话题

