《大话西游》中的一句经典台词:“爱一个人需要理由吗?”
需要吗?
不需要吗?
爱情,总是在不知不觉间降临,让人觉得奇妙且无法抗拒。
那到底爱一个人有没有理由?
很多人都尝试去解释,常见理由是这么几种:
1.外貌的魅力
2.才华的光环
3.物质的引力
4.三观的契合
在漫长的进化过程中,人类总喜欢问为什么,在找寻理由,找寻答案,找到内在的客观规律。
在客观世界里面找理由
诞生了哲学、数学、天文学、物理学、生物学等自然学科,科学家孜孜以求,帮助人类实现了“上天入地”,科学的发展反过来也促进了人类“解释”的能力。
黑洞的存在
DNA的双螺旋结构
在20世纪初,科学家们对遗传物质的本质和结构知之甚少。
1953年,詹姆斯·沃森和弗朗西斯·克里克发现了DNA的双螺旋结构,这一发现揭示了遗传信息的存储和复制方式,为遗传学和分子生物学的发展奠定了基础。
还有很多这样的例子,气候变化与全球变暖、生物多样性的形成、光纤通信等。当然,自然科学里面也还有很多无法解释的现象和问题。
黑洞的性质:尽管黑洞是宇宙中最为神秘的天体之一,科学家们对其性质的研究已经取得了一些进展,但关于黑洞内部的结构和信息悖论等问题仍然没有得到彻底的解答。例如,中国科学院大学物理学院教授田雨和博士生陈前与合作者在《物理评论快报》上发表的论文中,提出了一种全新的黑洞“长毛”机制,这表明黑洞的研究还在不断深入,但许多问题依然悬而未决 。
海市蜃楼的成因:海市蜃楼是一种大气光学现象,通常在特定的气候和地理条件下出现。虽然可以用光的折射来解释,但有些海市蜃楼现象却无法找到地球上的原型,科学家们至今无法解释这些现象的具体成因。
在主观世界里面找理由
诞生了社会学、心理学、神经科学、教育学和行为学等人文科学和社会科学。但相对于自然科学的突飞猛进发展,人文科学和社会科学则显得发展缓慢。
比如领域中存在许多公认的未解之谜,这些谜题涉及到人类思维、情感、意识等复杂现象。以下是几个目前人类还无法完全解释的心理学现象:
-
意识的本质:意识是心理学中最为复杂和神秘的领域之一。尽管有了大量的研究,但科学家们对于意识如何产生、其物理基础是什么、以及它在大脑中的具体作用等问题仍然缺乏一个明确的解释。
-
情绪的生物学基础:情绪是人的行为和决策中的重要因素,但我们对于情绪的生物学基础和它们如何影响人类行为的理解仍然有限。
-
记忆的形成和遗忘机制:记忆是认知心理学中的核心议题,尽管我们知道记忆的形成和遗忘与大脑的特定区域有关,但具体的机制仍然是一个未解之谜。
-
梦的神经机制:梦是普遍的人类经验,但科学家们对于梦的神经机制、梦的功能以及如何解释梦的内容等问题仍然没有确切的答案。

也就是说,不管主观世界还是客观世界,人类总是在不断地探索,不断地寻求解释,逐步在理解这个世界,但仍然还是有很多无法得到解释,甚至可能拓展越多,无法解释的东西会越来越多。
古希腊哲学家芝诺曾经说过:“人的知识就好比一个圆圈,圆圈里面是已知的,圆圈外面是未知的。你知道得越多,圆圈也就越大,你不知道的也就越多。”
但是没有理由,找不到理由,找不到规律,是不是就不敢用不会用不能用呢?纵观历史长河,并不是这样的。
-
火的使用:早在人类文明的早期,人们就开始使用火来取暖、烹饪和照明,而对燃烧的化学反应和热力学原理的理解则是后来科学发展的结果。
-
轮子:轮子的使用可以追溯到古代文明,但对轮子运动的动力学原理的深入理解则是在牛顿和伽利略等科学家的工作之后才逐渐发展起来的。
-
冶金术:古埃及人和美索不达米亚人使用冶金术来提炼金属,而对金属的化学性质和冶炼过程的科学理解则是后来才发展起来的。
以上是古代的,近代的也有:
-
电力:在电力的早期应用中,人们使用电力来驱动机器和照明,而对电磁理论的深入理解则是在法拉第和麦克斯韦等人的研究之后才发展起来的。
-
无线电:在无线电的早期使用中,人们利用无线电波进行通信,而对电磁波传播的科学理解则是在麦克斯韦和赫兹等人的研究之后才逐渐清晰的。
基于以上的认识,回到大模型的“可解释性”。为什么大模型出现“可解释性”的问题?
第一个是模型本身。前面我们研究模型的时候,逻辑回归线性模型(详见:银行人从零开始学大模型(二):逻辑回归模型),提供了较好的可解释性,因子和因子的权重就是你的解释;而到了神经网络,情况则完全不一样了,原始输入可能还能体现特征,但是进入神经网络之后,它使用自己的特征和特征权重,但是什么则不知道,这就是大家说的“黑盒子”,既然是“黑盒子”,就像是古代的人类使用火,对其是不知所以的。
第二个是“涌现”的现象。不知道什么时候,猿人的智力“涌现”,进化成人,并且语言文字能力,大大提升了智能层次。现在人工智能也类似,越来越多的人工智能大模型“涌现”出了科学家们无法解释的能力。仿佛在一夜之间,人工智能具备“涌现”能力之后,就觉醒了一般,变得不可控,甚至变得让人“恐惧”了,那错愕的心理可能和当时猿看到人应该是一样的。
解释是有困难的,但是人工智能科学家尝试解释人工智能的能力。
来自Anthropic的研究团队在人工智能(AI)领域取得了一项重大突破,他们的最新研究报告《走向单语义性:用字典学习分解语言模型》(Towards Monosemanticity: Decomposing Language Models With Dictionary Learning)中,展示了一种新方法,能够让我们更深入地理解大型语言模型的内部工作原理。
论文地址:https://transformer-circuits.pub/2023/monosemantic-features/index.html
神经网络这个“黑箱”被Anthropic的研究团队打开了一道缝隙。他们的方法基于稀疏自动编码器和弱字典学习算法,成功地从包含512个神经元的层中提取出了4000多个可解释的特征。
科学家还想到一种方法:用更高级的模型解释低端模型。
OpenAI在2023年5月9日展示了一种创新性方法:使用先进的大型语言模型GPT-4来解释早期模型GPT-2的行为。
GPT-4 作为一个更为复杂和高级的模型,拥有远超 GPT-2 的参数数量和处理能力。同样作为“硅基生物”的大模型,GPT-4可能比人类这种”碳基生物“更能理解AI本身,模型参数规模的差异使得 GPT-4也许有能力深入解读 GPT-2 的行为和决策过程。GPT-4观察分析GPT-2,可能会像高等生物人类观察简单生物蚂蚁的行为一样。
具体而言,是利用GPT-4对GPT-2的行为进行自动化解释,并对这些解释进行评分。解释过程涵盖三个步骤:首先,GPT-4基于GPT-2的神经元活动和相关文本序列生成解释;其次,再次使用GPT-4模拟被解释神经元的行为;最后,比较模拟的结果与实际的神经元活动,以此为基础对解释进行评分。这种方法让GPT-4成功解释了GPT-2中超过30万个神经元的行为,尽管大多数解释得分较低,但也有超过1000个神经元的解释得分高于0.8。通过这种方法,OpenAI得以用AI解释AI,其效果接近于人类水平。
接受其不可解释性
但是“道高一尺魔高一丈”,随着大模型参数规模的不断增长,比如达到万亿级别,和计算速度的加快,模型内部的神经元活动变得越来越复杂和快速,这使得精确追踪每一个神经元的变化变得越来越困难,无法测量AI就更难预测和控制。尤其当考虑到未来AI可能基于量子计算机发展时,由于量子叠加态带来的本质不确定性,AI系统的复杂性和不可预测性可能更加突出。
尤瓦尔赫拉利的《未来简史》预测,现代智人将升级为“智神”,人类也将从自由人文主义跨入科学人文主义和数据主义。
科技人文主义
人文主义的保守派,通过生物技术进行自我改造,让人能随心所欲消除和控制自己的欲望,拥有高智商和AI无法理解的行为,人仍是世界中心。
数据主义
人类的所有决策将基于数据,甚至直接由算法代为决策。人要做的是完成万物互联,形成所有现实数据的上载。算法将成为世界中心。
到了数据算法君王时代,人文主义将荡然无存,取而代之的是数据算法成为人类(智神)的意义。
那个时候,灵魂、心灵、意识,甚至感觉可能统统都抛弃了,扔进历史的垃圾堆里,可能都是冰凉的数据,用“数据结果”说话,让“可解释性”站到一旁。到时候再回到看金融行业强监管,AI模型必须有良好的解释性,可能就是一个笑话了(当然模型的稳定性是要追求的,就像远古人一样需要火的稳定性,至少不能引火自焚吧)。
回到文章开头,爱一个人需要理由吗?如果现代智人将升级为“智神”,留给现代人类的时间可能就不多了,就别啰啰嗦嗦的问理由了,趁着还有“感觉”就好好爱吧,别让“当爱已成往事”。