语言与思维:传统认知观点受到挑战

原文标题:Nature 热议论文证明「语言不是思考工具」,LLM 可能要学不会推理了?

原文作者:机器之心

冷月清谈:

研究人员发表论文《语言主要是一种交流工具,而不是思考工具》,引发了热烈的讨论,挑战了语言对思维至关重要的传统观点。 论文回顾了神经科学等领域的最新证据,认为现代人类语言的主要功能是沟通,而非思维。语言在推理中的作用受到质疑,这与 Yann LeCun 和诺姆·乔姆斯基等人对 LLM 推理能力的批评相呼应。 该研究从四个维度评估了语言对思维的影响,包括影响范围、重要程度、性质和时效性,并通过个案研究、神经科学和心理学实验等方法进行验证。

怜星夜思:

1、Yann LeCun 和诺姆·乔姆斯基对 LLM 的批评是否合理?他们提出的论点是否存在缺陷?
2、如果语言不是思维的必需工具,那么它在人类认知中扮演什么角色?
3、从进化适应性的角度来看,语言的沟通和认知功能如何共同促进人类的生存?

原文内容


机器之心PRO · 会员通讯 Week 26

---- 本周为您解读 ③ 个值得细品的 AI & Robotics 业内要事 ----

1. Nature 热议论文证明「语言不是思考工具」,LLM 可能要学不会推理了?

「语言≠思维」的论文引起了哪些讨论?论文观点和乔姆斯基唱衰 ChatGPT 有何关联?为什么研究语言和思维的关系很重要?哪些证据说明语言和思维关系不大?语言在人类沟通系统是什么角色?...

2. Super App 引发的迷思:在泡沫与难题中寻找大模型落地的答案

为何 Super App 仍没有出现?英伟达股价暴涨又暴跌,是人工智能泡沫还是人工智能硬件的泡沫?经典的 PMF 理论在大模型时代是否仍适用?大模型应用能否赚钱落地看哪些关键指标?AI 巨头们找到可行的商业模式了吗?大模型的潜力已经到顶了吗?面临哪些不得不解决的技术难题?...

3. 深度剖析:构建 10 万卡 GPU 集群需要知道哪些事?

构建 10万 H100 GPU 集群要多少钱?如何才能压榨GPU集群性能极限?GPU集群成本与性能如何平衡?用集群训AI模型如何保证稳定?GPU集群怎么保证可持续发展?...


...本期完整版通讯含 3 项专题解读 + 26 项本周 AI & Robotics 赛道要事速递,其中技术方面 9 项,国内方面 7 项,国外方面 10 项。

本期通讯总计 2638 字,可免费试读至 10% 
 消耗 99 微信豆即可兑换完3整本期解读(约合人民币 9.9 元) 


要事解读①  Nature 热议论文证明「语言不是思考工具」,LLM 可能要学不会推理了?

日期:6 月 24 日

事件:MIT 和 UC 伯克利的研究者近期发布的论文《Language is primarily a tool for communication rather than thought》指出「语言不是用于思考的工具」,引发了 AI 社区的大量关注和对 LLM 推理能力的热议。

论文都引起了哪些讨论?

语言是人类智能的一个决定性特征,但它所起的作用或多或少一直存在争议。《Language is primarily a tool for communication rather than thought》提供了神经科学等相关学科角度的最新证据,以论证现代人类的语言是一种交流工具,这与我们使用语言进行思考的流行观点相反。这一论点和此前 Yann LeCun 和乔姆斯基等人在唱衰 LLM 的理由似有相关,因而引发了大量讨论。

1、在论文发布前,业界关于 LLM 是否具备推理能力或拥有智能一直存在争议。以 Yann LeCun 为代表的一种声音认为,LLM 不具备理解、记忆、推理、规划这四项智能的基本特征,是通往 AGI 的一条歧路。[18]

① LeCun 曾在不同场合对自回归 LLM 进行批判,因为它们虽然表现惊人,但很多问题难以解决,包括事实错误、逻辑错误、推理有限、容易生成有害内容等,重要的是,这类模型并不了解这个世界底层的事实。

② 此外,LeCun 在近期的一场访谈中指出,语言是对现实的一种简化表示,人们在推理时并不像想象中那样频繁地使用语言。同时,人类大部分知识与语言无关,仅通过语言来构建智能系统是不足够的。

2、另一方面,美国哲学家、语言学家、认知科学家诺姆・乔姆斯基在 2023 年对大语言模型的批判文章同样引起了极大关注。[19]

① 乔姆斯基强调人类大脑与机器学习模型的根本区别。人类大脑是一个高效且优雅的系统,能够从有限的信息中运作;它不寻求推断数据点之间的直接相关性,而是寻求解释。

② ChatGPT 等机器学习模型虽然能够生成看似人性化的语言,但这些模型缺乏智能的关键能力。它们无法进行真正的因果解释,只能进行描述和预测。

3、MIT 的论文从脑神经研究的角度解释了语言和思维及推理能力无关。论文在发布后得到了大量转发分享,并在 AI 社区中引起热议,许多网友就论文的观点和当下大语言模型的发展情况展开讨论。

① 知名 AI 研究员 Hardmaru 在社交平台上转发分享了该论文,Yann LeCun 也转发分享,对思维不等于语言表示赞同。[20]

4、有网友认为 LLM 在处理和表达抽象思维方面具有潜力,但这种潜力尚未被充分探索和实现。[20]

① 抽象概念是人类长期拥有的,它构成了我们思维的高阶领域。

② 语言是一种交流工具,而 LLM 是在语言的基础上,通过书籍和文本训练所得,并不直接反映我们的思维。

③ 但 LLM 中的潜在空间代表了一种高级抽象形式,它能够将大量无序的文本信息进行压缩和矢量化存储,之后还可以进行解压缩,但很少有人深入研究 LLM 以解锁这种能力。

5、有网友认为语言是一种表达能力,不是直接的推理能力。但是,大量推理的表达堆积起来,他也形成了基于统计学的推理能力,所以应该说大模型不具备创建推理逻辑的能力,而不是没有推理能力。[21]

6、有网友指出,该论文和乔姆斯基、LeCun 的观点具有一致性。[21]

① 他表示,乔姆斯基脱胎于维根特斯坦的观点也认为语言的第一功能是思维。但他指的语言其实是帮助人们掌握具体语言的认知能力。

② LLM“掌握”语言的方式与人类完全不同,因此缺少了功能后没有推理能力。

论文为什么要研究语言和思维的关系?

1、该工作指出,尽管语言是人类的一个定义性特征,但语言的确切功能和起源的驱动因素一直是跨学科激烈讨论的话题。而目前主导了讨论的话题是两个并不互相排斥的假设:

① 一是语言主要服务于沟通功能,主要用于让人类彼此分享知识、思想和感受。

② 二是语言会调节思维和认知,这一假设又根据主张的强烈程度分为多个具体的观点。如最强烈的主张认为语言对所有形式的(至少是命题性)思维是必需;较弱的主张认为语言可能只是促进某些思维和推理的关键/部分因素。

2、从进化适应性的角度来看,语言的沟通和认知功能都可以提供适应优势。然而,论文强调关于认知特征的进化起源的假设是出了名的难以评估。

3、对于语言的功能和它在人类认知中的作用和重要性,研究者认为当下是一个展开讨论的成熟时机,具体原因有两个:

① 首先,过去二十年在解读语言的神经结构方面取得了重大进展,为评估语言处理机制在各种思维形式中的参与提供清晰的“目标(Target)”。

② 其次,大量不同语言的语料库和基于信息理论的强大计算工具的出现,为严格描述语言系统提供了可能。

论文从哪些维度评估得到「语言≠思维」的结论?

1、该工作回顾了过去二十年的研究工作,提供了神经科学等相关学科角度的最新证据,以论证现代人类的语言是一种交流工具,这与我们使用语言进行思考的流行观点相反。

2、就语言在思维中的作用,研究者聚焦于该问题中以往出现的不同观点的多样性和理论复杂性,而后通过不同的方法展开分析。就目前而言,有关语言在思维中作用的观点涉及四个维度:

① 第一个维度关注语言对思维的影响范围,其主张由强到弱涵盖:从声称所有的思维(至少所有命题性思维)都需要语言表征,到声称只有某些特定类型的思维需要语言。

② 第二个维度关注语言对思维的重要性程度,其主张由强到弱涵盖:从声称语言表征对思维是必需的(即没有这些表征的访问,思维就不可能发生),到声称它们只是增强或促进思维。

③ 第三个维度关注思维和所涉及语言表征的性质,一些理论强调所有自然语言共有的特征(如词汇和语法结构),其他理论关注特定语言独有的特征(如某些语言的特有的概念词汇和标记)

④ 第四个维度关注语言对思维影响的时效性,部分主张认为语言在认知能力发展中起到关键作用,尤其是在儿童时期,而成熟的大脑可能不再需要语言来支持思维。

3、就不同维度所涉及的主张,论文从个案研究、神经科学的研究和心理学实验等方式进行评估和验证。

① 论文指出,对于较为极端的主张,比如所有形式的思维都需要语言表征的说法最容易被证伪。

② 对于关注部分类型思维需要语言表征的主张,研究者通过明确定义相关思维的范围,让假设在经验上可以检验和评估。

③ 对于生成语言表征会促进思维发展的主张,研究者通过明确观察条件,并进一步描述该假设背后的神经学机制进行评估(目前的证据仍然复杂且有争议)。

乔姆斯基从哲学和认知科学的角度出发,认为 LLM 缺乏真正的因果推理能力。这种观点引发了关于语言和思维本质的争论。

语言作为沟通和认知的共同进化特质,为我们今天所看到的复杂而适应性强的物种奠定了基础。