大语言模型中出现的涌现现象是值得深入研究的问题。所谓“大语言模型的涌现现象”,一般指的是:对某些任务来说,小规模语言模型基本没有解决能力,但当模型大小增长到某个规模,大语言模型突然就获得了这种解决任务的能力。这是目前在大语言模型研究中发现的一种特殊现象,但为何会出现此种现象,并未有明确的解释。同时,最近也有研究质疑这种涌现现象是否真的存在,形成了争议。本文主题即为相关现象介绍、可能的解释,以及目前关于此的一些争论。
什么是大模型的涌现能力
复杂系统中的涌现现象
复杂系统学科里已经对涌现现象做过很久的相关研究。那么,什么是“涌现现象”?当一个复杂系统由很多微小个体构成,这些微小个体凑到一起,相互作用,当数量足够多时,在宏观层面上展现出微观个体无法解释的特殊现象,就可以称之为“涌现现象”。
生活中的涌现现象
在日常生活中也有一些涌现现象,比如雪花的形成、堵车、动物迁徙、涡流形成等。这里以雪花为例来解释:雪花的构成是水分子,水分子很小,但是大量的水分子如果在外界温度条件变化的前提下相互作用,在宏观层面就会形成一个很规律、很对称、很美丽的雪花。
那么问题是:超级大模型会不会出现涌现现象?显然我们很多人都知道答案,答案是会的。