谷歌推出年度重磅AI模型,实测可替代macOS版GPT-5

还记得不久前我们介绍过一波 Google AI 全家桶吗?那会儿正值 nano banana 爆火,Gemini 登上榜首。许多人因此第一次去尝试了 Gemini 2.5 Pro,结果发现这个不声不响的旗舰模型,很多时候居然比 GPT-5 还要出色。
现在,更强大的 Gemini 3.0,已经在 Google AI Studio 的测试里"提前上线"了。
网友们发现,它的能力提升不止一星半点,能直接用一套简单的提示词生成一个网页版 Windows、macOS 等操作系统。
大量的测试结果都提到,Gemini 3 写的代码能够直接运行,前端设计也更加成熟,甚至能做出剪辑视频、刷短视频的工具。
这次改进,可能是 Gemini 在图像编辑领域之外,再次超越 Claude 和 GPT-5 的关键时刻。
不过,这到底是为了营销制造的噱头,还是真能改变我们的使用体验?不如先跟我们一起看看这些网友分享的 Gemini 3 案例吧。
着手就写一个 Windows?
就像 nano banana 在判断生图能力时采用的指标,是看这个模型在生成文字时的表现。
而如何判断一个基础模型的交付能力,编程这种一旦代码里有个轻微错误就无法运行的项目,成了大部分基础模型厂商专攻的方向。一开始在这反面表现不错的 Claude,也因此赚到了一定的声量。
选择 Agentic Coding Average(智能体编程任务平均得分)后,模型排行榜上,Claude Sonnet 4.5 位于第一名。来源: https://livebench.ai/
近期多个博主在 X 上爆料,即将推出的 Gemini 3,在多个编程任务上的真实表现,不用说击败 GPT-5,甚至有直接超越 Claude 的趋势。
Google AI Studio 负责人 Logan 也在 X 上回复网友,确认了 Gemini 3 拥有工具调用的能力,即我们常说的智能体。
以往的编程测试,大多数集中在对逻辑能力的理解,比如一个小球在六边形框框里面流动的物理测试;对前端能力的审美把握,观察 AI 生成的是否足够交互友好,页面现代化;还有一些实用型的小游戏或小工具等。
这次放出来的部分 Gemini 3 测试,完全可以说是测试样例的一次大升级。
X 博主 chetaslua 分享了多个由 Gemini 3 完成的编程任务。它能直接给我们生成一个 macOS 的网页版电脑,在这个网页里,就像是在操作一台云电脑。所有的应用程序都可以打开,点击 Safari 的图标可以进入浏览器,并在网页里继续访问。
prompt: Design and create a web os like macOS full functional features from text editor , terminal with python and code editor and a game that can be played to dile manager to paint to video editor and all important windows os pre bundled software Use whatever libraries to get this done but make sure I can paste it all into a single HTML file and open it in Chrome.make it interesting and highly detail , shows details that no one expected go full creative and full beauty in one code block 提示词:设计并创建一个类似 macOS 操作系统的全功能网络操作系统,从文本编辑器、带 Python 的终端和代码编辑器开始,并包含一个可玩的游戏,用于文件管理器、绘图、视频编辑器以及所有重要的 Windows 操作系统预装软件。使用任何库来完成这个任务,但确保我能够将所有内容粘贴到一个单一的 HTML 文件中,并在 Chrome 中打开它。使其有趣且高度详细,展示没有人预期到的细节,在一个代码块中实现完全的创意和美感。
源码: https://codepen.io/ChetasLua/pen/yyezLjN
来源:https://x.com/chetaslua/status/1977866953705316571
不仅 macOS 云电脑能生成,博主还用同样的提示词,修改成 Windows、Linux、以及云手机等操作系统,开机动画、系统内操作,同样能完美还原。
而且,Gemini 3 在处理这些编程任务时,速度也得到了提升。根据博主在评论区的回复,Gemini 3 的推理速度在 1-2 分钟。
当把同样的提示词交给 Claude Sonnet 4.5 处理,网友分享的结果是,Claude 只是生成了一个页面,所有的应用程序都不能点击打开。我也测试了一下 GPT-5 的能力,虽然它可以打开某些应用,但是打开之后,就没有下一步的处理逻辑了。
https://x.com/pallavmac/status/1977979879489679640
还有一个小彩蛋,在网页打开的云电脑里面,点击终端,输入 matrix,我们会看到类似黑客帝国电影海报的 01 流动代码,可以说是对 The Matrix Revolution(黑客帝国电影港版译名)的真实还原了。
除了这几个热门的系统还原测试,Gemini 3 的编程能力,也体现在它的前端也有了其他 AI 模型做不到的进步。最明显的就是 AI 编程容易出现的"渐变紫",Gemini 3 终于摆脱了。
x@Liam06972452,提示词:Write full HTML, CSS and JavaScript for a stunning, bold, creative and unique landing page for a website about llms. It should look like it was built from scratch by a world-leading web design agency。
就像这个关于大语言模型的 ,输入的提示词仅仅是「为关于 LLMs 的 编写完整的 HTML、CSS 和 JavaScript,以创建一个令人惊叹、大胆、富有创意和独特的着陆页。它应该看起来像是由世界顶尖的网页设计公司从头构建的。」
网友们纷纷在评论区说,Gemini 3 一定有专门的设计师在合作,还有人预测 Gemini 3 将在前端领域,像 nano banana 一样占据主导地位。
不过也有人认为 Gemini 3 的前端,还是存在一些问题。尽管它解决了那些讨厌的渐变,改变了大多少 AI 模型长期以来一直在做的同样事情,但 3.0 的前端总是黑色的,除非明确提示。在我看来,黑色比渐变好太多, 的设计就应该简洁大方。
基于能一句话写出一个系统,还有优秀前端能力的 Gemini 3,还可以生成一个在线的视频编辑器,当然也是真的能够剪辑视频。
提示词:create amazing single html page video editor that WORKS! make it amazing。(创建一个令人惊叹的单一 HTML 页面视频编辑器,它必须能正常工作!让它变得非常棒。) 来源:https://x.com/sbalhatlani/status/1977501190322549017 CodePen 可运行体验链接:https://codepen.io/DiNaSoR/pen/WbrEELE
一个能无限刷短视频的抖音 App 网页版。
来源:https://www.reddit.com/r/Bard/comments/1o67jz4/crazy_google_gemini_30_pro_just_built_a_perfect/
体验地址:https://jsbin.com/yisixokuwi/1
那些做 vibe coding、一键生成网页应用工具的 Lovable、Cursor 等,可能要考虑默认模型换成 Gemini 3 了。
在经典的代码能力测试上,还有一个生成自行车图标的任务,比较模型对于 SVG 代码的生成效果。
Gemini 3 能生成普通的版本的鹈鹕。
https://x.com/whylifeis4/status/1974205929110311134
甚至还有游戏《我的世界》同款风格的 3D 版本。
免责声明
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
国产GLM-4.6编程模型出圈,成全球开发者新宠
一款来自中国的开源编程模型,正在海外开发者群体中掀起热潮。这款名为GLM-4 6的模型凭借其卓越的编程性能和极具竞争力的价格,成为全球技术社区热议的焦点。在X平台、Reddit和YouTube等海外
荣耀Robot Phone概念机亮相:AI大脑配超强行动力,2026年巴塞罗那发布
在近期举办的Magic 8系列新品发布会上,荣耀推出了一款名为“ROBOT PHONE”的全新概念终端,这款融合AI与机器人技术的设备引发了科技界的强烈关注。据最新介绍,该产品不仅搭载了先进的AI计
2025大鲸榜揭幕:用AI驱动企业增长的专家评估指南
人工智能行业的热度持续不减,但发展重心已发生显著转移。全球AI领域投资总额再创新高,项目数量却呈现下降趋势。资本策略从广撒网转向精准投资,用户关注点从技术体验转向实际收益。行业共识逐渐形成:AI竞争
摩根大通报告:ChatGPT到2030年或助OpenAI抢占25%市场份额
摩根大通近日发布的行业研究报告显示,尽管面临低成本大模型的市场挑战,OpenAI仍凭借技术积累和先发优势,预计将在2030年占据全球人工智能市场约四分之一的份额,营收规模突破1740亿美元。支撑这一
2025大鲸榜:AI落地实战派如何为企业降本增效?
人工智能行业的热度仍在持续,但发展重心已发生显著变化。全球AI领域投资总额持续走高,但投资项目数量呈现明显下降趋势。资本运作方式从广泛布局转向精准投资,用户需求也从体验新技术转向计算投入产出比。行业
热门推荐
热门教程
更多- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程



















