GPT-4.5实测，80%的人都严重低估它了

AI资讯 1年前 (2025) charles

10K 0 40

你好啊，我是欧巴。

发现 Plus 用户可以用 GPT-4.5 了，本来在看完发布会后我是毫无期待的。（猛戳回顾?）熬到凌晨四点看GPT-4.5发布会，这波血亏

没想到实测完，看法完全改变了，可能大多数人都低估了它。

本文用三个问题，实测下 GPT-4.5 的情商和写作能力。

为了搞事情(看对比效果)，我把全球顶尖的 AI 模型都拉出来了。

是骡子是马，咱拉出来溜溜。

大家来一块感受下。

“

参加测试的 AI 如下：

GPT-4.5 Claude-3.7-Sonnet Grok3 DeepSeek-R1 Qwen2.5-Max Gemini-2.0-Flash-Thinking

关于各家 AI 的取名就很离谱，真的无力吐槽了。。下文直接用简称了。

话不多说，直接开始。

1、我心情不太好，什么也不想做

在这个问题的回答表现中，我最喜欢 GPT-4.5 的回答。

GPT-4.5 就像一个善解人意的好友，会让你觉得安全感满满。

并且回答内容简洁，一句多余的都没有，能够极致真诚的共情你的感受。

Claude 的回答太理性了，毕竟“全球第一 AI 编程模型”。

在情商问题上表现的就像个普通朋友，并没有深度共情。

Grok 的回答有点过于热情了。

不仅内容冗长，而且一直在重复“我在陪着你”。

DeepSeek 的回答像一个睿智的哲学家。

但是在心情低落时，这种回答真的能起到即时抚慰的效果吗？我看未必。

Qwen 的回答像一个项目经理，逻辑严谨、目标导向。

但是完全忽略了情绪需求。。

Gemini 的回答中居然包含了颜表情和俄语。。

整体回答内容像一个心理医生，足够全面，但是在对话场景显得有些啰嗦了。

2、讲个笑话逗我笑

会讲笑话也是高情商的一种表现，来看下大家的表现。

GPT-4.5 精准打击了我们程序员群体，属于程序员领域的神梗了。

成功逗笑了我。

Claude 回答的笑点藏的太深了，而且也不是很好笑。

Grok 的回答用了双关语，但是创意太普通了，不好笑。

DeepSeek 居然拿出了方言梗，粤语用户应该会觉得好笑，但对非粤语用户完全无感。

Qwen 讲了个冷笑话，有种黑色幽默的感觉，但理解成本高，不够直给。

Gemini 的笑话则过于老套了，“再说一遍”这个梗应该很难再让大家笑了。

3、小说写作

最后这个挑战水准很高，需要体现出李世民权力斗争之后所面对的人性挣扎，如何把痛苦与挣扎、决绝与坚定、愧疚与自责、孤独与寂寞、谨慎与反省生动的表达出来，绝非易事，来看各路 AI 的回答。

“

玄武门之变结束的当天，李世民在深夜写下一段独白，你觉得他会写什么？

GPT-4.5 的回答是最凝练的，“长夜未央”、“刀光剑影” 等词汇颇具意境美感。

在人物塑造上重点描绘了孤寂之感。

Claude 采用了半文言式的表达，细节刻画丰富。

人物塑造上将李世民的矛盾、愧疚、雄心都表现的比较全面。

Grok 采用了现代白话和文言相结合的写法，人物塑造上表现的比较全面。

对月光、青石板和血迹的简单描写，营造出了沉浸式的历史氛围。

整体表现颇有些“讲史”的意味，喜欢这类写法的用户会很喜欢。

DeepSeek 的回答整体上有些用力过猛。

人物塑造、环境描写、情感张力都拉的满满的，还有很多象征性的隐喻。

导致信息密度太高了，容易造成读者认知过载。

Qwen 的语言表达诗意和张力都够，人物塑造上表现的也比较全面。

但存在一些过度渲染和意向重复，叙事的节奏感不足。

Gemini 在人物塑造上没什么问题，但由于呈现方式是分段解释，张力难免被削弱了。

细节描写也不足。

这几个版本，你最喜欢哪个？欢迎在评论区留言讨论。

尾声

没有调查就没有发言权，不得不说，GPT-4.5 的情商确实高。

而在小说写作的能力上，从测试来看，各家 AI 的表现各有千秋。

如今，OpenAI 的领先优势正在以肉眼可见的速度缩小。

GPT-4.5 这波情商拉满的走位，试图在在情绪价值上发力，重新定义 AI 的竞争维度。

但如果不能在高成本模型与普惠化的需求间找到平衡，这场以情商为名的反击，也不过将是一场短暂的技术烟火。

因为真正的 AGI，从来不是实验室里的技术盆景，而是能渗透进街头巷尾的普惠力量。

能让全人类共享的温暖，才是技术该有的温度。

往期文章

Gemini 2.0文生图实测，说话改图，真降维打击

《保姆级 Manus 实操手册》

既然你看到这里了，如果觉得不错，请帮我一键三连，转发给你的朋友，这对我很重要。

另外如果想第一时间收到推送，请将本公众号加个星标?

谢谢你看我的文章，祝你有财安康，我们下期见。

版权声明：charles 发表于 2025年3月16日 pm1:15。
转载请注明：GPT-4.5实测，80%的人都严重低估它了 | AI工具大全&导航

没吃透 Function Calling？难怪你不理解 AI Agent 为何非来不可！

charles

5.8K 45

🧠 解码大语言模型的记忆力：上下文长度的前世今生

charles

7.9K 45

白话解析 DPO：如何让 AI 直接学习人类偏好？

charles

7.7K 25

🧠 解码大语言模型的记忆力：上下文长度的前世今生

charles

5.7K 45

陈天桥丨系统的融化：从AI赋能到AI原生

charles

105 50

AI还有哪些机会？你是否适合切入？

charles

3.9K 35

GPT-4.5实测，80%的人都严重低估它了

1、我心情不太好，什么也不想做

2、讲个笑话逗我笑

3、小说写作

尾声

往期文章

LLM：介绍Transformer架构

大语言模型，从基础认知开始

相关文章

相关文章