谷歌推出年度重磅AI模型，实测可替代macOS版GPT-5

数码系统

相机 win10

测评 win11

手机智车

华为 Tesla

小米理想

苹果蔚来

游戏软件

LOL 抖音

原神微信

当前位置：首页

谷歌推出年度重磅AI模型，实测可替代macOS版GPT-5

热心网友时间：2025-10-16

转载

还记得不久前我们介绍过一波 Google AI 全家桶吗？那会儿正值 nano banana 爆火，Gemini 登上榜首。许多人因此第一次去尝试了 Gemini 2.5 Pro，结果发现这个不声不响的旗舰模型，很多时候居然比 GPT-5 还要出色。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新！ 👉 点此立即查看 👈

现在，更强大的 Gemini 3.0，已经在 Google AI Studio 的测试里"提前上线"了。

网友们发现，它的能力提升不止一星半点，能直接用一套简单的提示词生成一个网页版 Windows、macOS 等操作系统。

大量的测试结果都提到，Gemini 3 写的代码能够直接运行，前端设计也更加成熟，甚至能做出剪辑视频、刷短视频的工具。

这次改进，可能是 Gemini 在图像编辑领域之外，再次超越 Claude 和 GPT-5 的关键时刻。

不过，这到底是为了营销制造的噱头，还是真能改变我们的使用体验？不如先跟我们一起看看这些网友分享的 Gemini 3 案例吧。

着手就写一个 Windows？

就像 nano banana 在判断生图能力时采用的指标，是看这个模型在生成文字时的表现。

而如何判断一个基础模型的交付能力，编程这种一旦代码里有个轻微错误就无法运行的项目，成了大部分基础模型厂商专攻的方向。一开始在这反面表现不错的 Claude，也因此赚到了一定的声量。

选择 Agentic Coding Average（智能体编程任务平均得分）后，模型排行榜上，Claude Sonnet 4.5 位于第一名。来源： https://livebench.ai/

近期多个博主在 X 上爆料，即将推出的 Gemini 3，在多个编程任务上的真实表现，不用说击败 GPT-5，甚至有直接超越 Claude 的趋势。

Google AI Studio 负责人 Logan 也在 X 上回复网友，确认了 Gemini 3 拥有工具调用的能力，即我们常说的智能体。

以往的编程测试，大多数集中在对逻辑能力的理解，比如一个小球在六边形框框里面流动的物理测试；对前端能力的审美把握，观察 AI 生成的是否足够交互友好，页面现代化；还有一些实用型的小游戏或小工具等。

这次放出来的部分 Gemini 3 测试，完全可以说是测试样例的一次大升级。

X 博主 chetaslua 分享了多个由 Gemini 3 完成的编程任务。它能直接给我们生成一个 macOS 的网页版电脑，在这个网页里，就像是在操作一台云电脑。所有的应用程序都可以打开，点击 Safari 的图标可以进入浏览器，并在网页里继续访问。

prompt: Design and create a web os like macOS full functional features from text editor , terminal with python and code editor and a game that can be played to dile manager to paint to video editor and all important windows os pre bundled software Use whatever libraries to get this done but make sure I can paste it all into a single HTML file and open it in Chrome.make it interesting and highly detail , shows details that no one expected go full creative and full beauty in one code block 提示词：设计并创建一个类似 macOS 操作系统的全功能网络操作系统，从文本编辑器、带 Python 的终端和代码编辑器开始，并包含一个可玩的游戏，用于文件管理器、绘图、视频编辑器以及所有重要的 Windows 操作系统预装软件。使用任何库来完成这个任务，但确保我能够将所有内容粘贴到一个单一的 HTML 文件中，并在 Chrome 中打开它。使其有趣且高度详细，展示没有人预期到的细节，在一个代码块中实现完全的创意和美感。

源码： https://codepen.io/ChetasLua/pen/yyezLjN

来源：https://x.com/chetaslua/status/1977866953705316571

不仅 macOS 云电脑能生成，博主还用同样的提示词，修改成 Windows、Linux、以及云手机等操作系统，开机动画、系统内操作，同样能完美还原。

而且，Gemini 3 在处理这些编程任务时，速度也得到了提升。根据博主在评论区的回复，Gemini 3 的推理速度在 1-2 分钟。

当把同样的提示词交给 Claude Sonnet 4.5 处理，网友分享的结果是，Claude 只是生成了一个页面，所有的应用程序都不能点击打开。我也测试了一下 GPT-5 的能力，虽然它可以打开某些应用，但是打开之后，就没有下一步的处理逻辑了。

https://x.com/pallavmac/status/1977979879489679640

还有一个小彩蛋，在网页打开的云电脑里面，点击终端，输入 matrix，我们会看到类似黑客帝国电影海报的 01 流动代码，可以说是对 The Matrix Revolution（黑客帝国电影港版译名）的真实还原了。

除了这几个热门的系统还原测试，Gemini 3 的编程能力，也体现在它的前端也有了其他 AI 模型做不到的进步。最明显的就是 AI 编程容易出现的"渐变紫"，Gemini 3 终于摆脱了。

x@Liam06972452，提示词：Write full HTML, CSS and JavaScript for a stunning, bold, creative and unique landing page for a website about llms. It should look like it was built from scratch by a world-leading web design agency。

就像这个关于大语言模型的，输入的提示词仅仅是「为关于 LLMs 的编写完整的 HTML、CSS 和 JavaScript，以创建一个令人惊叹、大胆、富有创意和独特的着陆页。它应该看起来像是由世界顶尖的网页设计公司从头构建的。」

网友们纷纷在评论区说，Gemini 3 一定有专门的设计师在合作，还有人预测 Gemini 3 将在前端领域，像 nano banana 一样占据主导地位。

不过也有人认为 Gemini 3 的前端，还是存在一些问题。尽管它解决了那些讨厌的渐变，改变了大多少 AI 模型长期以来一直在做的同样事情，但 3.0 的前端总是黑色的，除非明确提示。在我看来，黑色比渐变好太多，的设计就应该简洁大方。

基于能一句话写出一个系统，还有优秀前端能力的 Gemini 3，还可以生成一个在线的视频编辑器，当然也是真的能够剪辑视频。

提示词：create amazing single html page video editor that WORKS! make it amazing。（创建一个令人惊叹的单一 HTML 页面视频编辑器，它必须能正常工作！让它变得非常棒。）来源：https://x.com/sbalhatlani/status/1977501190322549017 CodePen 可运行体验链接：https://codepen.io/DiNaSoR/pen/WbrEELE

一个能无限刷短视频的抖音 App 网页版。

来源：https://www.reddit.com/r/Bard/comments/1o67jz4/crazy_google_gemini_30_pro_just_built_a_perfect/

体验地址：https://jsbin.com/yisixokuwi/1

那些做 vibe coding、一键生成网页应用工具的 Lovable、Cursor 等，可能要考虑默认模型换成 Gemini 3 了。

在经典的代码能力测试上，还有一个生成自行车图标的任务，比较模型对于 SVG 代码的生成效果。

Gemini 3 能生成普通的版本的鹈鹕。