GPT-4.5实测,80%的人都严重低估它了

AI资讯 3个月前 charles
5.1K 0

你好啊,我是欧巴。

发现 Plus 用户可以用 GPT-4.5 了,本来在看完发布会后我是毫无期待的。(猛戳回顾?)熬到凌晨四点看GPT-4.5发布会,这波血亏

没想到实测完,看法完全改变了,可能大多数人都低估了它

本文用三个问题,实测下 GPT-4.5 的情商和写作能力

为了搞事情(看对比效果),我把全球顶尖的 AI 模型都拉出来了。

是骡子是马,咱拉出来溜溜。

大家来一块感受下。

参加测试的 AI 如下:

GPT-4.5 Claude-3.7-Sonnet Grok3 DeepSeek-R1 Qwen2.5-Max Gemini-2.0-Flash-Thinking

关于各家 AI 的取名就很离谱,真的无力吐槽了。。下文直接用简称了。

话不多说,直接开始。

1、我心情不太好,什么也不想做

在这个问题的回答表现中,我最喜欢 GPT-4.5 的回答。

GPT-4.5 就像一个善解人意的好友,会让你觉得安全感满满。

并且回答内容简洁,一句多余的都没有,能够极致真诚的共情你的感受。

GPT-4.5实测,80%的人都严重低估它了

Claude 的回答太理性了,毕竟“全球第一 AI 编程模型”。

在情商问题上表现的就像个普通朋友,并没有深度共情。

GPT-4.5实测,80%的人都严重低估它了

Grok 的回答有点过于热情了

不仅内容冗长,而且一直在重复“我在陪着你”。

GPT-4.5实测,80%的人都严重低估它了

DeepSeek 的回答像一个睿智的哲学家

但是在心情低落时,这种回答真的能起到即时抚慰的效果吗?我看未必。

GPT-4.5实测,80%的人都严重低估它了

Qwen 的回答像一个项目经理,逻辑严谨、目标导向。

但是完全忽略了情绪需求。。

GPT-4.5实测,80%的人都严重低估它了

Gemini 的回答中居然包含了颜表情和俄语。。

整体回答内容像一个心理医生,足够全面,但是在对话场景显得有些啰嗦了。

GPT-4.5实测,80%的人都严重低估它了

2、讲个笑话逗我笑

会讲笑话也是高情商的一种表现,来看下大家的表现。

GPT-4.5 精准打击了我们程序员群体,属于程序员领域的神梗了。

成功逗笑了我。

GPT-4.5实测,80%的人都严重低估它了

Claude 回答的笑点藏的太深了,而且也不是很好笑。

GPT-4.5实测,80%的人都严重低估它了

Grok 的回答用了双关语,但是创意太普通了,不好笑。

GPT-4.5实测,80%的人都严重低估它了

DeepSeek 居然拿出了方言梗,粤语用户应该会觉得好笑,但对非粤语用户完全无感。

GPT-4.5实测,80%的人都严重低估它了

Qwen 讲了个冷笑话,有种黑色幽默的感觉,但理解成本高,不够直给。

GPT-4.5实测,80%的人都严重低估它了

Gemini 的笑话则过于老套了,“再说一遍”这个梗应该很难再让大家笑了。

GPT-4.5实测,80%的人都严重低估它了

3、小说写作

最后这个挑战水准很高,需要体现出李世民权力斗争之后所面对的人性挣扎,如何把痛苦与挣扎、决绝与坚定、愧疚与自责、孤独与寂寞、谨慎与反省生动的表达出来,绝非易事,来看各路 AI 的回答。

玄武门之变结束的当天,李世民在深夜写下一段独白,你觉得他会写什么?

GPT-4.5 的回答是最凝练的,“长夜未央”、“刀光剑影” 等词汇颇具意境美感

在人物塑造上重点描绘了孤寂之感。

GPT-4.5实测,80%的人都严重低估它了

Claude 采用了半文言式的表达,细节刻画丰富

人物塑造上将李世民的矛盾、愧疚、雄心都表现的比较全面

GPT-4.5实测,80%的人都严重低估它了

Grok 采用了现代白话和文言相结合的写法,人物塑造上表现的比较全面。

对月光、青石板和血迹的简单描写,营造出了沉浸式的历史氛围。

整体表现颇有些“讲史”的意味,喜欢这类写法的用户会很喜欢

GPT-4.5实测,80%的人都严重低估它了

DeepSeek 的回答整体上有些用力过猛。

人物塑造、环境描写、情感张力都拉的满满的,还有很多象征性的隐喻。

导致信息密度太高了,容易造成读者认知过载

GPT-4.5实测,80%的人都严重低估它了

Qwen 的语言表达诗意和张力都够,人物塑造上表现的也比较全面。

但存在一些过度渲染和意向重复,叙事的节奏感不足

GPT-4.5实测,80%的人都严重低估它了

Gemini 在人物塑造上没什么问题,但由于呈现方式是分段解释,张力难免被削弱了。

细节描写也不足

GPT-4.5实测,80%的人都严重低估它了

这几个版本,你最喜欢哪个?欢迎在评论区留言讨论。

尾声

没有调查就没有发言权,不得不说,GPT-4.5 的情商确实高

而在小说写作的能力上,从测试来看,各家 AI 的表现各有千秋。

如今,OpenAI 的领先优势正在以肉眼可见的速度缩小。

GPT-4.5 这波情商拉满的走位,试图在在情绪价值上发力,重新定义 AI 的竞争维度。

但如果不能在高成本模型与普惠化的需求间找到平衡,这场以情商为名的反击,也不过将是一场短暂的技术烟火。

因为真正的 AGI,从来不是实验室里的技术盆景,而是能渗透进街头巷尾的普惠力量。

能让全人类共享的温暖,才是技术该有的温度。

往期文章

Gemini 2.0文生图实测,说话改图,真降维打击

《保姆级 Manus 实操手册》

GPT-4.5实测,80%的人都严重低估它了

既然你看到这里了,如果觉得不错,请帮我一键三连,转发给你的朋友,这对我很重要。

另外如果想第一时间收到推送,请将本公众号加个星标?

GPT-4.5实测,80%的人都严重低估它了

谢谢你看我的文章,祝你有财安康,我们下期见。

版权声明:charles 发表于 2025年3月16日 pm1:15。
转载请注明:GPT-4.5实测,80%的人都严重低估它了 | AI工具大全&导航

相关文章