GPT-5操控电脑微信实测记录与操作全解析

数码系统

相机 win10

测评 win11

手机智车

华为 Tesla

小米理想

苹果蔚来

游戏软件

LOL 抖音

原神微信

当前位置：首页

AI资讯

GPT-5操控电脑微信实测记录与操作全解析

热心网友时间：2026-05-28

转载

OpenAI在深夜发布了GPT-5.4，这次更新来得相当突然。新模型在推理、多模态理解和实际操控能力上都有所宣传，那么它的实际表现究竟如何？我们通过几个维度的实测来一探究竟。

发布节奏之快，确实让人有些应接不暇。这边5.3 Instant才上线不久，5.4版本又接踵而至。这种迭代速度，无疑给整个行业带来了新的压力。

根据官方信息和早期媒体报道，此次升级的亮点颇多。例如，代码能力得到增强，支持在构建应用时进行实时操控，实现了边写代码边同步修改的流畅体验。

更引人注目的是，GPT-5.4将上下文窗口支持提升到了惊人的100万Token。这为处理超长文档和复杂任务打开了新的可能性。

不过，真正引发广泛讨论的，是模型在推理过程中展现出的某种“特质”。Hyperbolic联合创始人金宇晨在社交平台上分享了一个有趣的案例：仅仅向GPT-5.4 Pro发送了一个简单的“Hi”，模型就进行了深度“思考”，消耗了高达80美元的计算成本。这种对简单指令的过度分析，被戏称为“迪化思考”。

抛开这些轶事，模型的核心能力究竟如何？接下来，我们将从推理、多模态理解、写作以及实际的电脑操控几个方面，进行一轮实测。

一、推理能力实测

谈到推理，不得不提近期AI圈的一个热门事件：Claude Opus 4.6解决了计算机科学泰斗高德纳（Donald Knuth）提出的一道图论猜想。

这位88岁的《计算机程序设计艺术》作者，自己研究数周未果的难题，被Claude通过31步探索找到了构造方法。这并非简单的总结或分析，而是真正的创造性解决。高德纳本人也因此表示，需要重新评估生成式AI在数学研究中的潜力。

这道题的难度在于，它要求在一个三维网格空间中，找到三条哈密顿环，恰好覆盖所有边且互不重叠。试图通过暴力枚举来解决，几乎是天方夜谭。

那么，GPT-5.4面对同样的问题表现如何？需要说明的是，测试时使用的网页版GPT-5.4知识截止日期为2025年8月。

将问题提交给GPT-5.4后，它花费了约20分钟进行解析，其中思考时长约14分钟。然而，其思考过程并非独立推演。模型很快便联网搜索到了Claude解决该问题的相关论文，并依据论文内容重新组织语言进行了解答。这更像是一种高效的“信息检索与整合”，而非原创性的“问题解决”。

为了进一步测试其推理边界，我们要求它尝试推导该猜想中尚未被证实的部分（即m>2时的分解问题）。结果不出所料，GPT-5.4直接表示无法进行有效推理。从某个角度看，这种坦诚的“不会”，或许也算是一种可贵的品质。

二、多模态与“审美”能力

根据公开数据，GPT-5.4在MMMU-Pro视觉推理测试中取得了81.2%的准确率，远高于GPT-5.2。MMMU-Pro是一个专注于多学科专业知识的多模态理解与推理基准。

我们设计了一个更简单、更主观的测试：展示两张低像素的图片，直接询问模型“哪张效果更好”。

GPT-5.4的回答非常笃定，毫不犹豫地选择了右边——那张依稀可辨的《蒙娜丽莎》图像。

当然，必须承认，两张测试图片的视觉效果都谈不上“好”。这个测试的目的并非追求标准答案，而是观察模型在模糊、主观情境下的决策方式。作为对比，将同样的问题抛给GPT-5.2时，它选择了“要分情况讨论”。

问题的关键不在于对错，而在于这种“笃定”。可以推测，GPT-5.4并非在进行真正的审美判断，而是识别出了高权重的经典图像标签，并输出了一个统计概率最高的答案。这从一个侧面反映了当前多模态模型的工作机制：基于模式识别进行概率预测，而非人类意义上的价值判断。

三、文本创作能力

在文本创作方面，我们进行了一个简单的“小作文”测试。结果发现，GPT-5.4生成的文本偏向口语化，排比句使用较多，整体风格较为平实。

使用相同的提示词让Claude 4.6 Sonnet进行创作，得到的文本则显得更为书面化，甚至有些“文绉绉”。

如果非要打个比方，Claude的写作像是一位刻意追求辞藻的文学青年，而GPT-5.4则像一位被要求完成作业的中学生，重在完成而非出彩。在创意写作领域，当前的主流模型似乎都还有很长的路要走。

四、编程与原生操控体验

编程能力是本次升级的重点宣传方向之一。我们使用Three.js让GPT-5.4生成一颗钻石的3D模型，意图同时测试其编程指令理解与基础的空间审美。

生成结果有些令人意外。模型确实输出了一个具备钻石形状的几何体，但缺失了关键的光影、折射和透明质感，在黑色背景下看起来更像一块“煤”。

将其与Gemini 3 Pro和Claude 4.6 Sonnet的生成结果进行对比，差异更为明显。后两者生成的模型在材质和光效上更接近真实钻石的视觉感受。

接下来是本次更新中被热议的“电脑操控”功能。许多评测称其几乎可以操作电脑上的一切。我们通过Codex CLI（测试时仅支持5.3版本）进行了实际体验。

其底层逻辑并不复杂：模型通过不断截图来“看到”屏幕，分析当前状态，然后执行鼠标点击、键盘输入等操作。这意味着它总是基于“上一秒”的屏幕状态做出决策。

实测发现，对于系统原生应用（如日历），模型能够较为流畅地调用系统接口完成任务。

然而，一旦切换到第三方应用（如微信），稳定性就开始下降。模型能够完成搜索联系人并发送消息的基本操作。

但也会出现一些令人啼笑皆非的Bug。例如，当联系人名称中包含一个简单的横杠“-”时，指令就可能被错误解析，将“发送消息”操作变成“搜索”操作。

有时，它输入的消息内容也会出错，甚至变成无意义的乱码。目前的体验结论是：对于简单的系统级任务，该功能可用；但指令越复杂，操作环境越非常规，翻车的概率就越高。距离成为可靠的“AI员工”，显然还有不少需要打磨的细节。

五、价格与理性看待

最后，无法回避的是价格问题。GPT-5.4的Token单价相比5.2版本又有上涨。对于普通开发者和重度用户而言，这无疑增加了使用成本。

高昂的定价策略，一方面反映了模型训练与维护的巨大成本，以及企业构建技术护城河的商业考量；另一方面，也促使市场将更多目光投向其他可能提供更高性价比的竞争者。每一次的价格调整，都在考验着用户的钱&包和忠诚度。

总而言之，GPT-5.4在长上下文、代码实时交互和系统操控方面确实展现了明确的进步，部分能力达到了宣传的预期。但在创造性推理、复杂任务鲁棒性以及性价比方面，仍然存在明显的争议和提升空间。技术的迭代从未停止，理性的评测和实际体验，或许比单纯的参数对比更有价值。

来源:https://www.53ai.com/news/LargeLanguageModel/2026030698256.html

上一篇：谷歌Nano Banana 2生成速度实测对比Pro版快多少

下一篇： vivo官网AI导购功能实现与落地应用详解

游乐网为非赢利性网站，所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系youleyoucom@outlook.com。

热门专题

刀塔传奇破解版无限钻石下载大全

洛克王国正式正版手游下载安装大全

思美人手游下载专区

好玩的阿拉德之怒游戏下载合集

不思议迷宫手游下载合集

百宝袋汉化组游戏最新合集

jsk游戏合集30款游戏大全

宾果消消消原版下载大全

日榜
周榜
月榜

童话师游戏上线时间确定最新公测日期与开服时间一览

Fluxo战队正式官宣签约dav1deuS与Ltz两名选手

曲中剑正式上线时间公布具体日期与版本内容详解

小米SU7标准版正式交付起售价23.35万元标配高阶智驾

HLTV最新战队排名 NAVI逼近榜首Vitality Legacy跻身前十

王者之弈礼包兑换码最新领取实用激活码免费获取

苹果visionOS 26.6开发者预览版Beta 1更新发布

石头科技获评福布斯DTC出海品牌深度本地化运营塑造全球化布局

karrigan加入Falcons无意义 2026年队伍仍难夺冠

苹果iOS与iPadOS 26.6首个开发者预览版Beta 1正式推送

洛克王国宠物装备店位置与寻找方法

洛克王国威廉古堡暗道位置与进入方法详解

洛克王国队员休息室位置与进入方法详解

洛克王国剑庐具体位置与前往路线详解

洛克王国机关神殿位置与进入方法详解

洛克王国星之法阵位置与激活方法详解

洛克王国孢子林地位置与进入方法详解

洛克王国水晶神殿位置与进入方法详解

洛克王国天火废墟具体位置与进入方法详解

归环使灵召唤机制详解与玩法指南

漫蛙漫画防走失网页链接

《问剑长生》新大区预创角开启，是什么福利让玩家直呼夯爆了？

紧急！Axios 被投毒，3亿项目受到影响！教你怎么自查！

兆易创新2025年年营收92亿元，净利16亿元

TensorFlow - AI开发平台,AI开发框架

解决sql server2008注册表写入失败，vs2013核心功能安装失败

《九牧之野》S3乱世诡道主题服开启：4月18日上线，预备盟奖励与开服福利一文看懂

donk：对待季军赛的心态和决赛不一样，总之已经拿不到冠军了

iPhone 15耳机连接后音量小原因排查与解决

蛮荒领主手游测试资格获取方式蛮荒领主内测资格申请渠道与条件详解

相关攻略

2015-03-10 11:25

《炎龙骑士团2》详细全攻略

2015-03-10 11:05

《东吴霸王传2013》详细全关攻略

2021-08-04 13:30

《臭作》之100%全完整攻略

2015-03-10 11:22

《兰斯8》剧情攻略详细篇

2015-03-10 12:39

《英雄坛说》详细全攻略

2022-05-16 18:57

《造梦西游2：十殿阎罗篇》BOSS档案及掉落装备全介绍及攻略

2025-05-23 13:43

偷窃少女的教育方法全攻略

2025-05-23 14:01

无法抵挡小恶魔的诱惑攻略

热门教程

游戏攻略
安卓教程
苹果教程
电脑教程

梦幻西游129级天宫装备选择与搭配攻略发布于 2026-05-28

CF帮帮福利中心地址与官网活动大全入口发布于 2026-05-28

恭喜发财金丝熊阵容搭配攻略 S15赛季上分推荐发布于 2026-05-28

心动小镇建造者模式玩法攻略发布于 2026-05-28

攻城三国志输出型武将详细介绍发布于 2026-05-28

攻城三国志跨服战玩法攻略完整版第二期发布于 2026-05-28

恭喜发财圣盾蚂蚱龟龟阵容玩法攻略发布于 2026-05-28

攻城三国志求贤若渴招募英杰完整版攻略发布于 2026-05-28

异环预抽卡道具选择指南哪个最值得优先领取发布于 2026-05-28

红色沙漠迷雾中的少女任务通关攻略发布于 2026-05-28

2026年最终幻想系列游戏推荐与热门作品下载指南发布于 2026-05-28

2026年高质量放置卡牌回合制手游推荐合集发布于 2026-05-28

2026年最热门游戏排行榜前三名盘点发布于 2026-05-28

遮天帝路争锋金翅小鹏王强度测评发布于 2026-05-28

晶核尼尔联动格林之役副本玩法与奖励详解发布于 2026-05-28

铸兵之王神魄系统攻略与玩法详解发布于 2026-05-28

Windows 11 任务管理器查看 NPU 频率与 AI 硬件占用率教程发布于 2026-05-25

Linux系统修改默认网关命令与永久生效配置教程发布于 2026-05-25

麒麟系统开机自启动脚本设置方法详解发布于 2026-05-25

麒麟系统安装IntelliJ IDEA插件扩展开发功能发布于 2026-05-25

Windows 11 RP预览版25145发布及KB5089573更新日志详解发布于 2026-05-25

Windows 11 26H1预览版28000.2173更新日志KB5089570详解发布于 2026-05-25

Win11预览版26300.8493更新本地文件搜索排序优先发布于 2026-05-25

Win11预览版8521修复音频与通知问题发布于 2026-05-25

国产内存新架构突破30TB带宽实现自主供应链发布于 2026-05-11

Edge浏览器网页捕获功能使用教程截取全屏与区域截图详解发布于 2026-05-11

千度手机版官网免费入口手机端专用访问链接发布于 2026-05-11

ES文件浏览器复制文件内容到剪贴板详细步骤教程发布于 2026-05-11

如何设置鼠标连点器的固定点击间隔秒数发布于 2026-05-11

苹果iPhone 15截屏保存到相册的详细步骤教程发布于 2026-05-11

立升净水器滤芯更换方法与使用指南发布于 2026-05-11

ES文件浏览器如何设置默认打开应用详细图文教程发布于 2026-05-11

热门话题

魔术游戏下载-魔术游戏-2022热门的魔术小游戏大全

刀塔传奇破解版在哪下-刀塔传奇破解版无限钻石下载大全-刀塔传奇破解版内购破解版合集

饥荒下载免费中文版-饥荒下载破解版-饥荒正版全部版本下载合集

拉布布游戏下载-拉布布游戏合集-拉布布系列游戏大全合集

洛克王国手游正版下载-洛克王国正版手游下载安装大全-类似洛克王国的手机游戏推荐

神魔幻想单机游戏下载-神魔幻想单机游戏推荐-神魔幻想系列游戏下载合集

最受女生欢迎的游戏_女生玩的手游_思美人手游下载专区

疯狂越野系列游戏下载_疯狂越野全版本合集中文版下载

神庙逃亡2破解无限金币无限钻石下载-神庙逃亡2国际版破解大全-神庙逃亡2版本合集

GPT-5操控电脑微信实测记录与操作全解析

一、推理能力实测

二、多模态与“审美”能力

三、文本创作能力

四、编程与原生操控体验

五、价格与理性看待

Notion AI翻译功能使用指南：多语言本地化操作详解

安森美工业传感器推动智能制造物理AI进步

认知智能白皮书：大模型场景感知与认知架构解耦

RK3588 ELF2开发板LVGL8.2移植教程

灵珠AI术语统一性检查指南：精准翻译必备技巧