语言≠思维，大模型学不了推理：一篇Nature让AI社区炸锅了,区域,大脑,人类20240723-业界动态-szhfh.com

语言≠思维，大模型学不了推理：一篇Nature让AI社区炸锅了,区域,大脑,人类

2024-07-23 00:53:14

语言≠思维，大模型学不了推理：一篇Nature让AI社区炸锅了,区域,大脑,人类

方向(xiang)完全搞错(cuo)了？

方向(xiang)完全搞错(cuo)了？

大语言模型（LLM）为什(shi)么空间智能不足，GPT-4 为什(shi)么用语言以外的数据训(xun)练，就能变得更聪(cong)明？现在(zai)这些问题(ti)有「标准答案」了。

近日，一篇麻省(sheng)理工学院（MIT）等机构(gou)发(fa)表(biao)在(zai)顶级(ji)学术期刊《自然(ran)》杂志(zhi)的文章观察到(dao)，人类大脑生成和解析语言的神经网络并不负责形式(shi)化推理，而且提出推理并不需要语言作为媒介(jie)。

这篇论(lun)文声称「语言主要是(shi)用于交流的工具(ju)，而不是(shi)思考的工具(ju)，对于任(ren)何经过(guo)测试的思维形式(shi)都(dou)不是(shi)必需的」，引发(fa)了科技领域社区的大讨论(lun)。

难(nan)道真的如语言学家乔(qiao)姆(mu)斯基所(suo)言，追捧 ChatGPT 是(shi)浪费资源，大语言模型通向(xiang)通用人工智能（AGI）的路线完全错(cuo)了？

让我们看看这篇论(lun)文《Language is primarily a tool for communication rather than thought》是(shi)怎么说的。

论(lun)文链接：https://www.nature.com/articles/s41586-024-07522-w

语言是(shi)人类智能的一个决定性特征(zheng)，但它所(suo)起的作用或多或少一直存在(zai)争(zheng)议。该研究提供了神经科学等相关学科角度的最新证据，以论(lun)证现代人类的语言是(shi)一种交流工具(ju)，这与我们使用语言进(jin)行思考的流行观点相反。

作者首先介(jie)绍了支持(chi)人类语言能力的大脑网络。随后回顾(gu)语言和思维双重分离的证据，并讨论(lun)语言的几种特性，这些特性表(biao)明语言是(shi)为交流而优化的。该研究得出结论(lun)认为，尽管语言的出现无(wu)疑改变了人类文化，但语言似乎并不是(shi)复杂思维（包括符号思维）的先决条件。相反，语言是(shi)传播文化知识的有力工具(ju)，它可能与我们的思维和推理能力共同(tong)进(jin)化，并且只反映(ying)了人类认知的标志(zhi)性复杂性，而不是(shi)产生这种复杂性。

图 1

研究证据挑战了语言对于思维的重要性。如图 1 所(suo)示，使用 fMRI 等成像(xiang)工具(ju)，我们可以识别(bie)完整(zheng)、健康的大脑中的语言区域，然(ran)后检(jian)查在(zai)完成需要不同(tong)思维形式(shi)的任(ren)务时，语言区域的相关响应。

01.人类大脑中的语言网络

从人脑的生物学结构(gou)来看，语言生成和语言理解由左半球一组相互连接的大脑区域支持(chi)，通常称为语言网络（图 1a；Box 2 描述了它与语言神经生物学经典模型的关系）。

Box 2。许多教科书仍然(ran)使用 Wernicke 提出的语言神经基础模型，并由 Lichteim 和 Geschwind 进(jin)行了阐述和修订。该模型包括两个皮层区域：Broca 区位于下额叶皮层，Wernicke 区位于后上颞叶皮层。这两个区域分别(bie)支持(chi)语言产生和理解，并通过(guo)一条背侧纤维束（弓(gong)状束）连接。

语言网络有两个非常重要的特性：

首先，语言区域表(biao)现出输入和输出模态的独立性，这是(shi)表(biao)征(zheng)抽(chou)象性的关键特征(zheng)。主要表(biao)现为在(zai)理解过(guo)程中，这些大脑区域对跨(kua)模态（口头、书面或手语）的语言输入做出反应。同(tong)样，在(zai)语言生成过(guo)程中，无(wu)论(lun)我们是(shi)通过(guo)口语还是(shi)书面语来产生信息，这些区域都(dou)是(shi)活跃的。这些区域支持(chi)语言理解和生成（图 1a）这一事实表(biao)明，它们很可能存储了我们的语言知识，这对于编码和解码语言信息都(dou)是(shi)必需的。

其次，语言区还能对词义和句法(fa)结构(gou)进(jin)行表(biao)征(zheng)和处理。特别(bie)是(shi)，关于脑磁图和颅(lu)内记录研究的证据表(biao)明，语言网络的所(suo)有区域都(dou)对词义以及词间句法(fa)和语义依赖性敏感（图 1a）。总之，语言网络中语言表(biao)征(zheng)的抽(chou)象性以及网络对语言意义和结构(gou)的敏感性使其成为评估(gu)语言在(zai)思维和认知中的作用假设的明确目标（(Box 3）。

我们对人类语言和认知能力，以及它们之间关系的理解仍然(ran)不完整(zheng)，还有一些悬而未决的问题(ti)：

语言表(biao)征(zheng)的本质是(shi)什(shi)么？
思维是(shi)否依赖于符号表(biao)征(zheng)？
儿童学习语言时，语言网络是(shi)如何成长的？

语言表(biao)征(zheng)的本质是(shi)什(shi)么？

思维是(shi)否依赖于符号表(biao)征(zheng)？

儿童学习语言时，语言网络是(shi)如何成长的？

02.语言对于任(ren)何经过(guo)检(jian)验的思维形式(shi)都(dou)不是(shi)必需的

经典的方法(fa)是(shi)通过(guo)研究大脑损伤或疾(ji)病的个体来推断大脑与行为之间的关联(lian)和分离。这种方法(fa)依赖于观察大脑某部分受损时个体行为的变化，从而推测不同(tong)大脑区域的功能和行为之间的联(lian)系。

有证据表(biao)明 —— 有许多个体在(zai)语言能力上有严重的障碍，影响到(dao)词汇和句法(fa)能力，但他们仍然(ran)表(biao)现出在(zai)许多思考形式(shi)上的完整(zheng)能力：他们可以解决数学问题(ti)，进(jin)行执行规划(hua)和遵循(xun)非言语指令(ling)，参与多种形式(shi)的推理，包括形式(shi)逻辑推理、关于世界的因果推理和科学推理（见图 1b）。

研究表(biao)明，尽管失去了语言能力，一些患有严重失语症的人仍然(ran)能够进(jin)行所(suo)有测试形式(shi)的思考和推理，他们在(zai)各种认知任(ren)务中的完整(zheng)表(biao)现就是(shi)明证。他们根本无(wu)法(fa)将这些想法(fa)映(ying)射到(dao)语言表(biao)达上，无(wu)论(lun)是(shi)在(zai)语言生成中（他们无(wu)法(fa)通过(guo)语言向(xiang)他人传达自己(ji)的想法(fa)），还是(shi)在(zai)理解中（他们无(wu)法(fa)从他人的单词和句子中提取意义）（图 1b）。当然(ran)，在(zai)某些脑损伤病例中，语言能力和（某些）思维能力都(dou)可能受到(dao)影响，但考虑到(dao)语言系统与其他高级(ji)认知系统的接近性，这是(shi)可以预料的。

尤其是(shi)一些聋哑儿童，他们长大后很少或根本没有接触过(guo)语言，因为他们听不见说话，而他们的父母或看护人不懂手语。缺(que)乏语言接触会对认知的许多方面产生有害影响，这是(shi)可以预料的，因为语言是(shi)了解世界的重要信息来源。尽管如此，语言剥夺的个体无(wu)疑表(biao)现出复杂的认知功能能力：他们仍然(ran)可以学习数学、进(jin)行关系推理、建立因果链，并获得丰富(fu)而复杂的世界知识。换句话说，缺(que)乏语言表(biao)征(zheng)并不会使人从根本上无(wu)法(fa)进(jin)行复杂的（包括符号的）思考，尽管推理的某些方面确实表(biao)现出延(yan)迟。因此，在(zai)典型的发(fa)展中，语言和推理是(shi)平行发(fa)展的。

03.完整(zheng)的语言并不意味着完整(zheng)的思维

以上证据表(biao)明，迄今为止测试的所(suo)有类型的思维都(dou)可以在(zai)没有语言的情况下实现。

接下来，论(lun)文讨论(lun)了语言和思维双重分离的另一面：与语言介(jie)导思维的观点相反，完整(zheng)的语言系统似乎并不意味着完整(zheng)的推理能力。

人类语言是(shi)由交流压力塑造(zao)的。

来自发(fa)育性和后天性脑部疾(ji)病的证据表(biao)明，即使语言能力基本完好，也可能存在(zai)智力障碍。

例如，有些遗传疾(ji)病导致智力受损程度不同(tong)，但患有这些疾(ji)病的人的语言能力似乎接近正常水平；还有一些精(jing)神层面有缺(que)陷(xian)的人，会影响思考和推理能力，但同(tong)样不会影响语言。最后，许多获得性脑损伤的个体在(zai)推理和解决问题(ti)方面表(biao)现出困难(nan)，但他们的语言能力似乎完好无(wu)损。换句话说，拥有完整(zheng)的语言系统并不意味着自动具(ju)备思考能力：即使语言能力完好无(wu)损，思考能力也可能受损。

总的来说，这篇论(lun)文回顾(gu)了过(guo)去二十(shi)年的相关工作。失语症研究的证据表(biao)明：所(suo)有经过(guo)检(jian)验的思维形式(shi)在(zai)没有语言的情况下都(dou)是(shi)可能的。fMRI 成像(xiang)证据表(biao)明：参与多种形式(shi)的思考和推理并不需要语言网络。因此，语言不太(tai)可能成为任(ren)何形式(shi)思维的关键基础。

MIT 研究得出结论(lun)的同(tong)时，顶尖 AI 领域学者最近也发(fa)表(biao)了对大模型发(fa)展的担忧(you)。上个星期四 Claude 3.5 的发(fa)布号称拥有研究生水平的推理能力，提升了行业的标准。不过(guo)也有人表(biao)示经过(guo)实测可见，它仍然(ran)具(ju)有 Transformer 架构(gou)的局限性。

对此，图灵奖获得者 Yann LeCun 表(biao)示，问题(ti)不在(zai)于 Transformer，而是(shi)因为 Claude 3.5 仍然(ran)是(shi)一个自回归大模型。无(wu)论(lun)架构(gou)细节如何，使用固定数量的计算步骤来计算每个 token 的自回归 LLM 都(dou)无(wu)法(fa)进(jin)行推理。

LeCun 也评论(lun)了这篇 Nature 论(lun)文，对思维不等于语言表(biao)示赞同(tong)。

对此，你(ni)怎么看？

参考内容：

https://news.ycombinator.com/item?id=40756176

https://x.com/ylecun/status/1804834054954459539

发(fa)布于：上海市

版权号:18172771662813

以上就是本篇文章的全部内容了，欢迎阅览！
资讯企业新闻行情企业黄页同类资讯首页网站地图返回首页移动站 , 查看更多