数码系统

相机 win10

测评 win11

手机智车

华为 Tesla

小米理想

苹果蔚来

游戏软件

LOL 抖音

原神微信

当前位置：首页

AI资讯

热点详情

GPT-4.5实测：八成用户严重低估其能力

AI热点日报时间：2026-07-03

热点解读

GPT-4 5 正式发布后，许多人第一反应是“就这？”——发布会既不惊艳，参数也不突出。说实话，我一开始也是同样的想法。直到亲自上手体验后，才发现事情没那么简单。或许，大多数人真的低估了它。因此，我特意设计了一个小测验，用三个问题，把它的情商和写作能力拉到聚光灯下仔细审视。为了将对比效果拉满，

GPT-4.5 正式发布后，许多人第一反应是“就这？”——发布会既不惊艳，参数也不突出。说实话，我一开始也是同样的想法。直到亲自上手体验后，才发现事情没那么简单。

或许，大多数人真的低估了它。

因此，我特意设计了一个小测验，用三个问题，把它的情商和写作能力拉到聚光灯下仔细审视。

为了将对比效果拉满，我把市面上顶级模型全部拉出来一起较量。

是骡子是马，牵出来走走便知。

这次我召集的对比阵容堪称豪华：GPT-4.5、Claude-3.7-Sonnet、Grok 3、DeepSeek-R1、Qwen2.5-Max、Gemini-2.0-Flash-Thinking。模型名称虽然拗口，但测试就得拿硬茬子来碰。

话不多说，直接开测。

1、我心情不太好，什么也不想做

面对这个问题，七个模型给出了七种截然不同的“性格特征”。

GPT-4.5 的回答最令人眼前一亮。它像极了你身边最善解人意的朋友，聊天节奏恰到好处——既不追问，也不说教。它用极简的语句直击内心柔软之处，安全感满满。一字不多，一字不少，精准共情。

Claude 的回答则过于理性。你能感受到它骨子里“全球第一 AI 编程模型”的底色——凡事都想拆解分析。作为朋友，这显得有些“像普通朋友”，缺乏情感深度。

Grok 热情得有些过头。内容冗长，翻来覆去都是“我在陪着你”，这种重复反而显得心不在焉。

DeepSeek 的回答像一位睿智的哲学家，深度足。但心情低落时，有多少人有耐心消化这样一篇深思熟虑？

Qwen 活脱脱像个项目经理，逻辑严谨、目标导向。从头到尾都在规划“该怎么做”，情绪需求？基本被忽略。

Gemini 居然夹杂表情符号和俄语……整体上像一份心理医生的标准诊断报告，覆盖面全，但在对话场景下过于啰嗦。

2、讲个笑话逗我笑

一场独特的幽默感测试。

GPT-4.5 这一轮表现堪称封神。它精准瞄准了程序员群体的谐音梗和领域笑点，这波精准打击直接命中程序员群体，我这个老码农当场没绷住。

Claude 的笑话藏得太深，甚至要仔细咀嚼才能找到笑点。听笑话还要用脑，那就不是笑话了。

Grok 尝试了双关语，但创意平淡，没激起半点波澜。

DeepSeek 直接甩出一个粤语方言梗。对于绝大多数非粤语地区用户，这只是一堆乱码，完全无感。

Qwen 走了黑色幽默路线，冷笑话里带点荒诞感。但理解成本太高，幽默需要直给，它没做到。

Gemini 的笑话老套得令人叹息。“再说一遍”这个梗，大概已经活在上一个互联网时代了。

3、小说写作

这是考验水准的真正关卡。玄武门之变后，李世民深夜独白——要把人性挣扎、痛苦与决绝、愧疚与孤独、谨慎与反思统统融进几百字，难度极高，来看 AI 的各自答卷。

GPT-4.5 的独白写得最凝练。“长夜未央”、“刀光剑影”这些词意境十足，重点落在孤寂与苍凉上，读来让人心头一紧。

Claude 选择了半文言加复杂细节的写法，将李世民的矛盾、愧疚和雄心揉捏得比较全面，画面感很强。

Grok 在白话和文言之间找到了舒服的平衡，月光、青石板和血迹的简单勾勒，制造出历史氛围的沉浸感，很有一种“讲史”的风味。

DeepSeek 竭尽全力将人物心理、环境、情感张力全部拉满，大量象征和隐喻涌入，客观来说信息密度太高，容易让读者“过载”。

Qwen 的文字诗性和张力都够，但意境有重复，叙事节奏上稍显不够酣畅。

Gemini 的人物塑造没出大问题，问题出在呈现方式——居然做了分段解释，张力一下被稀释，细节描写也略显单薄。

尾声

没有亲自上手之前，真的不要轻易下结论。实测下来，不得不承认：GPT-4.5 在情商方面的表现确实拔尖。

在小说写作上倒也谈不上完全碾压，各家各有闪光点，只能说各有千秋。

不过，一个不可回避的事实是：OpenAI 的领先优势正在肉眼可见地缩小。GPT-4.5 这波情商拉满的操作，可以被看作它在情绪价值这条新赛道上的发力——如果模型能在“让人感到被理解”这件事上做出差异化，那它就在重新定义 AI 的竞争维度。

但话说回来，如果 GPT-4.5 不能在超高计算成本与普通用户普惠化需求之间找到真正的平衡，那这场以情商为名的反击，终究不过是短暂的技术烟花。

因为真正的 AGI，从来不是实验室里精心浇灌的技术盆景，而是能渗透进街头巷尾的普惠力量。

能让全人类共享的温暖，才是技术该有的温度。

热点追踪提示词

你是一名 AI 行业编辑，请围绕下面这条热点输出一份资讯解读：
热点：GPT-4.5实测：八成用户严重低估其能力要求：
1. 先用一句话解释这条热点在讲什么
2. 再总结它为什么重要
3. 说明会影响哪些 AI 产品或内容方向
4. 最后给出 3 个适合资讯站使用的标题

来源：https://www.53ai.com/news/LargeLanguageModel/2025031617830.html

ai 人工智能

上一篇：贸泽电子发布智能革命系列最新电子书探讨AI人道应用

下一篇：人工智能在软件测试中的9大优势

游乐网为非赢利性网站，所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系youleyoucom@outlook.com。

延伸阅读

iPhone 17系列液态硅胶壳曝光：8色可选+挂绳孔设计 iOS 26整合ChatGPT-5：AI全面赋能苹果智能生态真我828真粉节揭晓：10000mAh超大电池手机即将亮相？苹果折叠iPhone曝光：搭载自研C2基带芯片与Touch ID指纹识别对话元戎启行周光：VLA模型核心成本在AI芯片，辅助驾驶方案交付近10万套刘志强：京东方坚持开放合作，拒绝低质低价竞争 Redmi K90系列全系标配5000万长焦与3D超声波指纹，配置再升级 vivo X300系列曝光：天玑9500+2亿像素主摄，长焦微距实力升级

日榜
周榜
月榜

01 / 08-26iPhone 17系列液态硅胶壳曝光：8色可选+挂绳孔设计 02 / 08-26iOS 26整合ChatGPT-5：AI全面赋能苹果智能生态 03 / 08-26真我828真粉节揭晓：10000mAh超大电池手机即将亮相？ 04 / 08-26苹果折叠iPhone曝光：搭载自研C2基带芯片与Touch ID指纹识别 05 / 08-27对话元戎启行周光：VLA模型核心成本在AI芯片，辅助驾驶方案交付近10万套

01 / 本周Daetama数据科学完整准备工作系统指南与精选学习资源汇总 02 / 本周AI驱动配音平台 Speakmulti 03 / 本周Umi-OCR图片转文字识别软件 04 / 本周用AI生成你最爱的画家或艺术运动风格绘画 05 / 本周创一AI短视频脚本工具，专为创作者与编导设计

01 / 本月Daetama数据科学完整准备工作系统指南与精选学习资源汇总 02 / 本月AI驱动配音平台 Speakmulti 03 / 本月Umi-OCR图片转文字识别软件 04 / 本月用AI生成你最爱的画家或艺术运动风格绘画 05 / 本月创一AI短视频脚本工具，专为创作者与编导设计

热点快看

07-04 19:00Daetama数据科学完整准备工作系统指南与精选学习资源汇总 07-04 19:00AI驱动配音平台 Speakmulti 07-04 18:59Umi-OCR图片转文字识别软件 07-04 18:59用AI生成你最爱的画家或艺术运动风格绘画 07-04 18:59创一AI短视频脚本工具，专为创作者与编导设计

热点追踪

持续追踪iPhone 17系列液态硅胶壳曝光：8色可选+挂绳孔设计 持续追踪iOS 26整合ChatGPT-5：AI全面赋能苹果智能生态 持续追踪真我828真粉节揭晓：10000mAh超大电池手机即将亮相？ 持续追踪苹果折叠iPhone曝光：搭载自研C2基带芯片与Touch ID指纹识别