业界动态
语言≠思维,大模型学不了推理:一篇Nature让AI社区炸锅了,区域,大脑,人类
2024-07-23 00:53:14
语言≠思维,大模型学不了推理:一篇Nature让AI社区炸锅了,区域,大脑,人类

方向(xiang)完全搞错(cuo)了?

方向(xiang)完全搞错(cuo)了?

大语言模型(LLM)为什(shi)么空间智能不足,GPT-4 为什(shi)么用语言以外的数据训(xun)练,就能变得更聪(cong)明?现在(zai)这些问题(ti)有 「标准答案」了。

近日,一篇麻省(sheng)理工学院(MIT)等机构(gou)发(fa)表(biao)在(zai)顶级(ji)学术期刊《自然(ran)》杂志(zhi)的文章观察到(dao),人类大脑生成和解析语言的神经网络并不负责形式(shi)化推理,而且提出推理并不需要语言作为媒介(jie)。

这篇论(lun)文声称「语言主要是(shi)用于交流的工具(ju),而不是(shi)思考的工具(ju),对于任(ren)何经过(guo)测试的思维形式(shi)都(dou)不是(shi)必需的」,引发(fa)了科技领域社区的大讨论(lun)。

难(nan)道真的如语言学家乔(qiao)姆(mu)斯基所(suo)言,追捧 ChatGPT 是(shi)浪费资源,大语言模型通向(xiang)通用人工智能(AGI)的路线完全错(cuo)了?

让我们看看这篇论(lun)文《Language is primarily a tool for communication rather than thought》是(shi)怎么说的。

论(lun)文链接:https://www.nature.com/articles/s41586-024-07522-w

语言是(shi)人类智能的一个决定性特征(zheng),但它所(suo)起的作用或多或少一直存在(zai)争(zheng)议。该研究提供了神经科学等相关学科角度的最新证据,以论(lun)证现代人类的语言是(shi)一种交流工具(ju),这与我们使用语言进(jin)行思考的流行观点相反。

作者首先介(jie)绍了支持(chi)人类语言能力的大脑网络。随后回顾(gu)语言和思维双重分离的证据,并讨论(lun)语言的几种特性,这些特性表(biao)明语言是(shi)为交流而优化的。该研究得出结论(lun)认为,尽管语言的出现无(wu)疑改变了人类文化,但语言似乎并不是(shi)复杂思维(包括符号思维)的先决条件。相反,语言是(shi)传播文化知识的有力工具(ju),它可能与我们的思维和推理能力共同(tong)进(jin)化,并且只反映(ying)了人类认知的标志(zhi)性复杂性,而不是(shi)产生这种复杂性。

图 1

研究证据挑战了语言对于思维的重要性。如图 1 所(suo)示,使用 fMRI 等成像(xiang)工具(ju),我们可以识别(bie)完整(zheng)、健康的大脑中的语言区域,然(ran)后检(jian)查在(zai)完成需要不同(tong)思维形式(shi)的任(ren)务时,语言区域的相关响应。

01.人类大脑中的语言网络

从人脑的生物学结构(gou)来看,语言生成和语言理解由左半球一组相互连接的大脑区域支持(chi),通常称为语言网络(图 1a;Box 2 描述了它与语言神经生物学经典模型的关系)。

Box 2。许多教科书仍然(ran)使用 Wernicke 提出的语言神经基础模型,并由 Lichteim 和 Geschwind 进(jin)行了阐述和修订。该模型包括两个皮层区域:Broca 区位于下额叶皮层,Wernicke 区位于后上颞叶皮层。这两个区域分别(bie)支持(chi)语言产生和理解,并通过(guo)一条背侧纤维束(弓(gong)状束)连接。

语言网络有两个非常重要的特性:

首先,语言区域表(biao)现出输入和输出模态的独立性,这是(shi)表(biao)征(zheng)抽(chou)象性的关键特征(zheng)。主要表(biao)现为在(zai)理解过(guo)程中,这些大脑区域对跨(kua)模态(口头、书面或手语)的语言输入做出反应。同(tong)样,在(zai)语言生成过(guo)程中,无(wu)论(lun)我们是(shi)通过(guo)口语还是(shi)书面语来产生信息,这些区域都(dou)是(shi)活跃的。这些区域支持(chi)语言理解和生成(图 1a)这一事实表(biao)明,它们很可能存储了我们的语言知识,这对于编码和解码语言信息都(dou)是(shi)必需的。

其次,语言区还能对词义和句法(fa)结构(gou)进(jin)行表(biao)征(zheng)和处理。特别(bie)是(shi),关于脑磁图和颅(lu)内记录研究的证据表(biao)明,语言网络的所(suo)有区域都(dou)对词义以及词间句法(fa)和语义依赖性敏感(图 1a)。总之,语言网络中语言表(biao)征(zheng)的抽(chou)象性以及网络对语言意义和结构(gou)的敏感性使其成为评估(gu)语言在(zai)思维和认知中的作用假设的明确目标((Box 3)。

我们对人类语言和认知能力,以及它们之间关系的理解仍然(ran)不完整(zheng),还有一些悬而未决的问题(ti):

  • 语言表(biao)征(zheng)的本质是(shi)什(shi)么?

  • 思维是(shi)否依赖于符号表(biao)征(zheng)?

  • 儿童学习语言时,语言网络是(shi)如何成长的?

语言表(biao)征(zheng)的本质是(shi)什(shi)么?

思维是(shi)否依赖于符号表(biao)征(zheng)?

儿童学习语言时,语言网络是(shi)如何成长的?

02.语言对于任(ren)何经过(guo)检(jian)验的思维形式(shi)都(dou)不是(shi)必需的

经典的方法(fa)是(shi)通过(guo)研究大脑损伤或疾(ji)病的个体来推断大脑与行为之间的关联(lian)和分离。这种方法(fa)依赖于观察大脑某部分受损时个体行为的变化,从而推测不同(tong)大脑区域的功能和行为之间的联(lian)系。

有证据表(biao)明 —— 有许多个体在(zai)语言能力上有严重的障碍,影响到(dao)词汇和句法(fa)能力,但他们仍然(ran)表(biao)现出在(zai)许多思考形式(shi)上的完整(zheng)能力:他们可以解决数学问题(ti),进(jin)行执行规划(hua)和遵循(xun)非言语指令(ling),参与多种形式(shi)的推理,包括形式(shi)逻辑推理、关于世界的因果推理和科学推理(见图 1b)。

研究表(biao)明,尽管失去了语言能力,一些患有严重失语症的人仍然(ran)能够进(jin)行所(suo)有测试形式(shi)的思考和推理,他们在(zai)各种认知任(ren)务中的完整(zheng)表(biao)现就是(shi)明证。他们根本无(wu)法(fa)将这些想法(fa)映(ying)射到(dao)语言表(biao)达上,无(wu)论(lun)是(shi)在(zai)语言生成中(他们无(wu)法(fa)通过(guo)语言向(xiang)他人传达自己(ji)的想法(fa)),还是(shi)在(zai)理解中(他们无(wu)法(fa)从他人的单词和句子中提取意义)(图 1b)。当然(ran),在(zai)某些脑损伤病例中,语言能力和(某些)思维能力都(dou)可能受到(dao)影响,但考虑到(dao)语言系统与其他高级(ji)认知系统的接近性,这是(shi)可以预料的。

尤其是(shi)一些聋哑儿童,他们长大后很少或根本没有接触过(guo)语言,因为他们听不见说话,而他们的父母或看护人不懂手语。缺(que)乏语言接触会对认知的许多方面产生有害影响,这是(shi)可以预料的,因为语言是(shi)了解世界的重要信息来源。尽管如此,语言剥夺的个体无(wu)疑表(biao)现出复杂的认知功能能力:他们仍然(ran)可以学习数学、进(jin)行关系推理、建立因果链,并获得丰富(fu)而复杂的世界知识。换句话说,缺(que)乏语言表(biao)征(zheng)并不会使人从根本上无(wu)法(fa)进(jin)行复杂的(包括符号的)思考,尽管推理的某些方面确实表(biao)现出延(yan)迟。因此,在(zai)典型的发(fa)展中,语言和推理是(shi)平行发(fa)展的。

03.完整(zheng)的语言并不意味着完整(zheng)的思维

以上证据表(biao)明,迄今为止测试的所(suo)有类型的思维都(dou)可以在(zai)没有语言的情况下实现。

接下来,论(lun)文讨论(lun)了语言和思维双重分离的另一面:与语言介(jie)导思维的观点相反,完整(zheng)的语言系统似乎并不意味着完整(zheng)的推理能力。

人类语言是(shi)由交流压力塑造(zao)的。

来自发(fa)育性和后天性脑部疾(ji)病的证据表(biao)明,即使语言能力基本完好,也可能存在(zai)智力障碍。

例如,有些遗传疾(ji)病导致智力受损程度不同(tong),但患有这些疾(ji)病的人的语言能力似乎接近正常水平;还有一些精(jing)神层面有缺(que)陷(xian)的人,会影响思考和推理能力,但同(tong)样不会影响语言。最后,许多获得性脑损伤的个体在(zai)推理和解决问题(ti)方面表(biao)现出困难(nan),但他们的语言能力似乎完好无(wu)损。换句话说,拥有完整(zheng)的语言系统并不意味着自动具(ju)备思考能力:即使语言能力完好无(wu)损,思考能力也可能受损。

总的来说,这篇论(lun)文回顾(gu)了过(guo)去二十(shi)年的相关工作。失语症研究的证据表(biao)明:所(suo)有经过(guo)检(jian)验的思维形式(shi)在(zai)没有语言的情况下都(dou)是(shi)可能的。fMRI 成像(xiang)证据表(biao)明:参与多种形式(shi)的思考和推理并不需要语言网络。因此,语言不太(tai)可能成为任(ren)何形式(shi)思维的关键基础。

MIT 研究得出结论(lun)的同(tong)时,顶尖 AI 领域学者最近也发(fa)表(biao)了对大模型发(fa)展的担忧(you)。上个星期四 Claude 3.5 的发(fa)布号称拥有研究生水平的推理能力,提升了行业的标准。不过(guo)也有人表(biao)示经过(guo)实测可见,它仍然(ran)具(ju)有 Transformer 架构(gou)的局限性。

对此,图灵奖获得者 Yann LeCun 表(biao)示,问题(ti)不在(zai)于 Transformer,而是(shi)因为 Claude 3.5 仍然(ran)是(shi)一个自回归大模型。无(wu)论(lun)架构(gou)细节如何,使用固定数量的计算步骤来计算每个 token 的自回归 LLM 都(dou)无(wu)法(fa)进(jin)行推理。

LeCun 也评论(lun)了这篇 Nature 论(lun)文,对思维不等于语言表(biao)示赞同(tong)。

对此,你(ni)怎么看?

参考内容:

https://news.ycombinator.com/item?id=40756176

https://x.com/ylecun/status/1804834054954459539

发(fa)布于:上海市
版权号:18172771662813
 
    以上就是本篇文章的全部内容了,欢迎阅览 !
     资讯      企业新闻      行情      企业黄页      同类资讯      首页      网站地图      返回首页 移动站 , 查看更多   
sitemapsitemap1sitemap2sitemap3sitemap4sitemap5sitemap6sitemap7