关于大模型能力问题与质量问题的感受

AI资讯 4周前 charles
1.7K 0

 大模型并不是无所不能的,大模型也有自己的能力圈 



在之前的文章中谈到过大模型的能力问题,你对大模型认知的开始——大模型的能力问题,而根据这几天调用第三方接口的感受来谈谈大模型的质量问题。

首先要明白一个概念,能力与质量不是一回事,能力是能去做一件事,质量是能把一件事给做好。



大模型的能力与质量



有很多人到现在也不是很明白大模型到底是什么,以及能够做些什么;原因就在于很多人太过于注重大模型本身,也就是离大模型太近了,只看到了大模型的细节,却没看到大模型的轮廓,因此要学会离大模型远一点,这样才能对大模型形成一个完整的认识,不然就类似于盲人摸象,每个人眼中的大象都不一样。

关于大模型能力问题与质量问题的感受

如果我们抛开大模型的实现细节,用一个完全外行人的眼光去看待大模型,抛开技术人员的思维模式,那么什么是大模型?应该怎么认识它?

从表面来看,我们给大模型一段输入,大模型能够给出一段输出;输出类型包括文字,图片,视频,音乐等等多种格式的数据,这也是多模态的由来。

然后,对一些使用了思维链(CoT)等推理规划技术的模型来说,它们还能根据用户的需要做出近似合理的逻辑推理和行程规划。

当然,大模型也有其不足,最典型的就是知识截止到模型训练的那天为止;但从外行人的眼光来看,就是模型无法回答最近的问题,以及问到一些专业的领域的知识,模型可能会一本正经的胡说八道;换句话说,就是大模型不可信。

ok ,对一个完全外行的人来说,在不给他介绍哪怕一点和大模型相关知识的前提下,他会对大模型产生一个怎样的认识?

不知道大家有没有发现,这种方式就是我们常说的图灵测试,在完全不知情的情况下,大模型是否能够通过图灵测试。

关于大模型能力问题与质量问题的感受

ok ,对一个完全不懂技术的人来说,大模型就是一个能力强大(能说能画,上知天文下知地理),但偶尔又突然抽风的一个不知名的东西。

所以当抛弃技术,抛弃原理,抛弃为什么,这时人们对大模型的认识就是大模型的表现,也就是大模型的能力问题。

对行外人来说,只需要了解大模型的能力即可;但对内行人来说,就需要了解大模型的能力是怎么实现的;而这些就属于技术范畴了。

所以,作为技术人员来说,很多时候喜欢从技术的角度去看待问题,这就容易钻牛角尖;而如果从大模型的能力去认识大模型,那么我们就能对大模型产生一个大致的轮廓。

而不管技术多么的牛逼,但我们都要考虑大模型的能力圈,不要让大模型去做它根本办不到的事情;而这也是很多人钻牛角尖的地方。

前面说了大模型的能力问题,下面就是说大模型的质量问题;比如说在绝大部分人眼里,openAI发布的模型肯定会比其它公司的模型要好,而且从实际情况来看,国外的很多模型确实要比国内的表现要好;而这个好,指的就是质量。

比如,国内也有很多做知识问答,AIGC的模型,国外这种模型就更多了;国内的模型能做到这些,国外的模型也可以做到这些;这就代表着它们有相同的能力。

关于大模型能力问题与质量问题的感受

但从效果上来看,国内的模型生成内容的质量普遍较差,导致这种现象的原因有很多,但归根结底来说还是国内的技术不达标。

所以说,同样是做大模型服务商,有些公司的模型人追着用;而有些公司的模型扔了都没人用。

原因是什么?

原因就在于虽然它们具有相同的能力圈,但它们有些能力强,有些能力弱;而这就直接导致,不同大模型产品的生成质量参差不齐,也就是大模型产品有好有坏。

而对一家做大模型上层应用的企业来说,如果底层模型选不好,那么结果也就不言而喻了。


关于大模型能力问题与质量问题的感受

作为应用开发者的我们来说,首先我们要认识到大模型的能力圈,也就是不要去做一个摸象的盲人,然后在此基础之上再去找一个质量更好的模型;而如果能力足够的话,也可以去尝试学习和研究大模型的底层实现,也就是说大模型的能力是怎么来的。

为什么同样都是模型,有的模型能力比较强,而有的模型能力就比较差?

这才是我们需要学习和研究的方向,而不是上来就直接摸着大象的一个部位,就认为大模型就是这个样子。

而对一些专家,学者来说,他们的任务就是不断扩展大模型的能力圈,并且不断提升大模型的能力。


版权声明:charles 发表于 2025年3月8日 pm6:32。
转载请注明:关于大模型能力问题与质量问题的感受 | AI工具大全&导航

相关文章