发现程序和语言习得

2022-09-11

1 研究背景

1957年, 乔姆斯基 (Chomsky) 发表了《句法结构》 (Syntactic Structure) 一书, 标志着生成语言学派的诞生, 揭开了一场革命的序幕。生成语言学对语言学, 以至认知科学、心理学、数学、社会学、哲学、电子计算机以及人工智能等学科都产生了巨大的影响。至今, 生成语言学仍是现代语言学理论中影响最大、学术地位最高的主流理论。

在生成语法理论之前, 结构主义语言学派一统天下。乔姆斯基在师从美国结构语言学家海利斯 (Harris) 的过程中, 逐渐发现结构主义的研究方法只能对语言结构的表面现象作一定的描写, 不能解释关于语言结构性质的一些重要问题, 如语言的创造性, 语言习得, 语言知识和能力 (Chomsky, 1961;1965;1975) 。乔姆斯基视语言为一种心理现象, 认为语言能力是先天的, 包括一整套有限的公理化的规则系统和原则系统, 运用这些系统就可以衍生出无限的合乎语法的句子。转换生成语法已经历经5个发展阶段, 其研究的是以句法为中心的句子生成规律。但是, 乔姆斯基理论的形成是建立在一些错误的前提之上的 (林允清, 1999;2000;2001) , 生成语法永远不能修正成正确的理论, 下一节中将简略提及。

乔姆斯基的生成语言学跟语言习得机制的研究息息相关。对语言习得的研究是心理语言学的一个分支。在语言习得领域, 先天论、后天论和相互作用论同时并存, 构成了儿童语言习得理论研究的三大分支。这三种语言习得的理论分别侧重先天机制, 学习规则, 和认知前提。至今没有一套完整、系统的、为学术界所公认的语言习得机制。

下一节将介绍林允清 (1999, 2000, 2003) 在审视乔姆斯基错误的基础上, 提出的一个新的、更贴近语言本体、致力于解读语言能力的语言学学说——“发现程序”说。作为一套科学的、系统的语言习得机制, “发现程序”的提出和未来的研究成果将给其他的语言学流派和研究, 比如生成语法理论, 认知语言学, 语言习得等带来新的思路和研究切口。然后, 将简要说明其价值, 综述目前的研究状况, 并展望未来的发展前景。

2“发现程序”说的由来

林允清 (2000, 2003) 详细追溯并分析了乔姆斯基理论形成、发展的全过程。乔姆斯基早年师从结构主义语言学家海利斯, 他的理论建立是从批评结构主义语言学和发现程序开始的。乔姆斯基发现, 以分布和替换的发现程序作为对话语进行切分和分类的方法, 只能对语言结构的表面现象作一定的描写, 却不能解释语言的创造性、语言习得、语言知识和能力等重要问题。乔姆斯基认为, 语法是复杂的、未知的, 不可能用一套机械的程序获得。试想, 如果语法是未知的, 怎么证实用来发现语法的发现程序本身是正确而且有效的呢?在此基础上, 乔姆斯基提出了评估程序, 后来发展为普遍语法 (Universal Grammar) 。他 (1975, 1986) 举了几组例句, 认为儿童掌握的语法知识不是学来的, 用概括, 类推等方法解释不了。因此, 乔姆斯基认为, 儿童生来就具有一整套先天普遍的语法, 儿童习得语言的过程, 是为普遍语法的“参数”赋值的过程。

在这一理论基础的问题上, 很多语言学家 (Putnam, 1980:287;Matthews, 1998:112~113) 都指出, 乔姆斯基的例子可以用一般的学习机制来解释, 以此作为先天语法的证据是不充分的。林允清 (1999, 2000, 2003) 还指出乔姆斯基理论中的其他一些错误之处。最重要的一条是, 乔姆斯基和结构主义语言学家们一样, 都混淆了“语法知识” (knowledge of grammar) 和“语法知识是怎样习得的” (knowledge of how knowledge of grammar is acquired) 这两个概念。林允清强调, 每一个心智正常的成年人都清楚地、清醒地知道自己本族语的语法, 即结构主义语言学家们所描述的句型及转换规则。他认为, 这些句型和转换规则是约定俗成的惯例, 是人们讲述经验, 表达思想的习惯方式。欲详细了解这些语法的性质, 请参看林允清 (1999) 。结构主义语言学家们的研究体会也证实了这一点。海利斯曾经数次在论著中提到, 语言学家们在直觉中知道语法规则, 发现程序是用科学的、形式化的方法来代替简单的直觉。这样, 发现程序并不是用来发现语法规则, 重要的是这些程序本身。它们被设计出来, 其所得到的结果必须符合我们所知道的语法。因此, 语法是已知的。未知的是我们习得语法的过程。

重新审视海利斯研究的过程中, 林允清 (2000) 发现, 结构主义语言学家强加在自己身上的双重任务——提出发现程序和利用这些程序发现语法——导致了这个学派的衰落。而在语法是已知的情况下, 发现程序正是解释儿童语法习得的钥匙。林允清提出假设:儿童并不是生来就有一套先天的普遍语法, 而是具有一种受遗传因素决定的先天的语言习得机制——发现程序, 这些程序使得儿童能够在输入的语料中识别规则和型式, 从而习得语法。而语言学家的任务则是在海利斯研究的基础上发展发现程序。在这一新的语言学研究中, 目标是明确的:发现儿童天生的语言习得机制——发现程序;方法也是明确的:用已知的语法知识去测试设计的程序正确与否。“发现程序”学说没有任何哲学基础或是方法论上的缺陷。发现程序使我们更接近认识语言能力本身, 提供了一个解释人类语言秘密的途径。

3 研究基础总结和现状分析

海利斯的研究成果, 尤其是跟发现程序有关的部分;语言习得领域的研究成果;语言学、心理学、人工智能等领域的专家学者们对发现程序的关注和取得的成绩, 都是“发现程序”说的研究基础。下文将一一简单介绍。

3.1 海利斯的研究成果

海利斯是美国结构主义语言学家的代表人物之一。贯穿海利斯整个学术生涯的是以分布为标准的分析原则。在1951年他最重要的论著《结构语言学的方法》 (Methods in Structural Linguistics) 中, 海利斯致力于设计出一套明确的“发现程序”, 用高度形式化的方法确定语言的基本单位 (音位和语素) , 从复杂的语义中提取出语言形式中的规律和模式, 减少语法的冗余。

海利斯的所有论著几乎都是严格技术性的、形式化的, 充塞着高度形式化的公式。语义的唯一作用是被用来判定是否有重复。这是因为海利斯比其他人更清楚地认识到, 语言学的困难是只能通过语言来描写语言;唯有形式化的方法才能避免语义理解太过灵活所带来的压力。如果言语是随机杂乱的, 它就将无从研究。言语不是随机杂乱的, 它的结构就恰恰存在与它对随机性的偏离之中。也正是通过对非随机性的模式的搜寻, 语言学才可能摆脱若非如此就可能产生的循环论证 (张和友, 2001) 。值得注意的是, 海利斯并不排除意义, 他希望形式化的分析能使意义上的差别外显。

海利斯曾经数次在论著中提到, 语言学家们在直觉中知道语法规则, 发现程序是用科学的、形式化的方法来代替简单的直觉。海利斯的发现程序包括两个主要步骤, 首先确定语言单位, 然后综述这些单位的分布规律。虽然他自己没有用发现程序来解释语言习得的机制, 但是, 他也承认这方面可以做进一步的研究 (1986:375) 。在海利斯的学生格莱特曼 (Gleitman, 2002:211) 看来, 发现程序的两个主要步骤看上去就是语言习得的机制。在语言习得中, 儿童首先从言语输入中发现并存储重复出现的模式, 然后把它们归类为有效的语言单位, 接着合并为更高一级的单位。这样, 每一个上一层次的语言单位都由下一级单位的分布规律来决定。用这种与海利斯发现程序相似的方法, 儿童能够完成自然语言的习得。

乔姆斯基 (1975:138) 曾提到, 结构语言学的切分和归类的方法可以被看做是一个语言习得理论。但是, 乔姆斯基把发现程序与传统的经验主义混为一谈, 并且基于上一节提到的一些错误的判断, 他坚信经验主义不能解释人类的语言知识。现在, 林允清指出了乔姆斯基理论基础性的错误, 而海利斯的发现程序又一次作为解决语言学理论难题的一把钥匙被提了出来。

在音位分析方面, 海利斯设计出“任意点切分”程序 (the procedure of‘segmenting utterances at arbitrary points’) , “归类可替换音段”程序 (the procedure of‘grouping substitutable segments’) , “结合互相依赖的音段”程序 (the procedure of‘joining dependent segments’) 等9个程序;在形态分析角度, 提出了8个程序, 如“独立和模式化组合”程序 (the procedure of‘independent and patterned combinations’) , “平衡特殊的语段”程序 (the procedure of‘equating unique morphemic segments’) 等。可是, 海利斯的“发现程序”工作主要集中在语音和形态上。他虽然提出了转换语法, 但是并没有用“发现程序”来解释语法规则的获取。而这正是林允清教授的“发现程序”学说的主要目标及未来的研究内容。

3.2 语言习得领域研究现状

最早介入语言习得领域的并不是语言学家, 而是心理学家。他们称之为儿童语言发展 (child language development) 。在西方, 语言学家介入这一领域大约是上个世纪50年代, 以乔姆斯基提出普遍语法为发端。目前, 在语言发展领域, 先天论、后天论和相互作用论同时并存。

先天主义理论并非来自实证研究, 很多坚定的先天主义者从来不做实证研究。他们的力量来自语言学理论, 也就是乔姆斯基的普遍语法理论。他们认为, 儿童生来有一套先天的普遍语法, 适合于任何一种语言。他们把语言习得看作一个演绎的过程, 儿童习得语言, 就是通过与具体语言材料相结合, 为普遍语法的各个“参数”赋值, 从而习得具体语法。他们搜寻所有语言中普遍性的证据, 然后断定它们是先天的。

支持后天论的发展心理学家们强调后天经验, 他们的目的是提供个体发展过程的解释, 说明有机体是怎样从一个时间的一种状态变化到另一种状态的。从发展的角度看, 当认知或语言的某些方面被断言是先天的, 它仅仅表明某一特定功能出现的一个阶段。

鉴于经验主义无法排除先天因素的作用, 而先天主义理论也并不完全否定环境因素的作用, 相互作用的理论似乎成了合乎逻辑的转向目标。

相互作用论的代表人物之一, 心理学家皮亚杰 (1984:6-65) 以他的儿童心理学研究为证据, 认为语言能力是以感知运动性智力为前提的, 是感觉运动的智慧建构的必然结果, 是决定胚胎渐成的器官和行为自我调节的结果。他 (1990) 认为, 先天论的假设可以说是不必要的, 儿童在取得某种程度的感觉运动或智慧以前, 根本没有语言出现;儿童的语言能力只是一般人类认知能力的一个组成部分;语言的普遍性只是认知普遍性的一部分, 它不是人类与生具有的普遍语法, 而是表现为人类普遍具有的认知策略。在著名的1971年巴黎大辩论中, 先天论的代表人物乔姆斯基和相互作用论的代表人物皮亚杰展开了正面交锋。乔姆斯基反驳说, 感觉运动智能建构不能说明语言现象, 语言与一般智能是不同的。

根据相互作用理论, 心理发展的所有方面都是遗传因素和环境因素相互作用的结果。可是, 设想一下, 如果没有一个先天的语言机制, 连这也是相互作用的产物, 那么, 因为不同个体与环境相互作用的情形各不相同, 这种相互作用的结果必然导致儿童句法结构大相径庭。但在实际上, 儿童最终获得的语言结构和语言发展的过程极为相似。

根据大量研究成果 (Demopoulos&Marras, 1986;Laura E.Beck, 2002:363-534;Susan H.Foster-Cohen, 2002;朱曼殊, 1986;周国光&王葆华, 2001) , 发展心理学家们倾向支持有一个先天的特别针对语言的语言习得机制支配儿童的语言发展。这种先天的语言习得机制并非语言知识本身, 而是从周围多种可能的语法规则中去发现特定的语法规则的天性。而林允清的“发现程序”学说正是一条可以解释这个语言习得机制的途径。它可以使语言的结构性、语言发展的一致性、否定证据、速度、关键期等得到解释, 而又不存在乔姆斯基的先天普遍语法理论中的问题。

虽然上个世纪中期以后, 由于乔姆斯基的批判, “发现程序”在语言学界并不受重视。可是, 在一些对语言习得感兴趣的语言学家中, 在心理学界, “发现程序”一直在被使用和发展 (G l e i t m a n, 2 0 0 2;Gleitman, Gleitman, Landau, &Wanner, 1998;Maratsos&Chalkley, 1980) 。Maratsos&Chalkley (1980) 提出了一套语法范畴的分布学习算法。他们认为, 儿童可以根据同现词和在句子中的位置来判断一个词的词性。格莱特曼 (2002) 在很多心理学实验结果的基础上指出, 儿童对语音的习得在很大程度上是没有语义反馈的感知过程的。

可是, 直至今日, 仍然很少有人用“发现程序”的思想去解释语法规则的习得。而这正是“发现程序”学说的主要目标, 也就是未来的研究内容。

3.3 人工智能领域对发现程序的研究

在人工智能领域, “发现程序”也一直在被使用和发展。

爱因德及同事 (Blanche-Benvensite et al., 1984;Eynde et al., 2002;Schosler&Kirchmeier-Andersen, 1997) 采用海利斯的思想, 在过去的三十年里致力于法语和荷兰语语法研究, 已经完成机器可读得的语法字典。每个字典包含成千上万个句型结构和转换规则。他们的工作表明, 把人们直觉里清楚地知道的语法描写出来是可能而且现实的。

上个世纪80年代初, 英国计算语言学家伍尔夫 (Wolff) 就开始用发现程序来解释语言习得。并在此基础之上, 提出了SP理论, 经过20多年的改进, 已发展成一个比较成熟的理论。这一理论认为, 不论大脑还是电脑, 所有的信息处理都可以被理解为信息压缩, 通过模式匹配和统一来完成。简单的说, SP系统接收环境传来的“新”信息, 并转化为知识库中的“旧”信息 (Wolff, 2006) 。与此同时, 系统尽可能地压缩信息, 发现互相匹配的模式并合并或统一。这与心理学领域的传统观念也是相一致的。而“SP”的由来是:信息压缩在尽可能保持非冗余描述能力 (Power) 的同时, 促进了信息的简化 (Simplicity) (Wolff, 2003) 。为了帮助理解并检测SP理论, 抽象的系统被改写为相对具体的、利用普通电脑就可以运行的软件模拟。到目前为止, 已经设计出SP61和SP70两个比较成熟的电脑系统模型。

SP理论继承了海利斯发现程序中的精髓。目的是整合和简化计算和认知科学中的一系列概念。它提供了一个崭新的角度来解释人类认知的很多方面, 如自然语言的分析和产生、模糊识别和最佳匹配信息检索、概率推理以及无人监督的归纳法学习等。这一理论对我们建立“发现程序”学说有很好的借鉴作用。

4 对未来的展望

“发现程序”学说将在以上各个领域的研究基础上, 用发现程序的思想去解释语音、形态及语法规则的习得。

海利斯认为, 发现程序可以在适当调整后适用各种语言。在新的“发现程序”学说中, 依然如此。以英语为例, 虽然仍然不断有新的解释型语法提出, 如系统功能语法、认知语法等, 普遍公认的英语的主要基本句型仍然是:N+V, N+V+N, N+V+P+N, N+V+N+N, N+V+N+P+N, N+be+A, N+be+P+N等7种。由这7种句型层级性的代入具体的词, 逐步可以生成“X falls.”以及“X strikes Y.”, 以至“A tree fell.”和“A rock struck a tree.”这样的日常生活中的句子。再加上单句间的进一步转换、复合, 构成了复杂的语言现象。

“发现程序”学说的目标是在现存语法的基础上, 找出相关“发现程序”的具体内容, 比如, 是什么样的程序使得小孩能学到“X love Y”, “X V-ed his way to Y”这些句型及转换规则?这些句型和转换规则有很多。相关的发现程序是否也很多?发现程序之间有什么联系?同时, 用心理学和人工智能的研究成果来补充和证实以上的解释。

5 结语

本文在简单评价各语言学流派的基础上, 介绍了林允清教授提出的新的语言学研究理论, 即“发现程序”学说。他以评价乔姆斯基转换生成语法为起点, 在重新审视海利斯的语言学研究成果, 特别是发现程序的基础上, 提出:儿童并不是生来就有一套先天的普遍语法, 而是具有一种受遗传因素决定的先天的语言习得机制——发现程序;这些程序使得儿童能够在输入的语料中识别规则和型式, 从而习得语法;语言学家的任务是在海利斯研究的基础上发展发现程序。本文简单梳理了“发现程序”学说的形成过程, 介绍了它的研究基础和未来的研究内容。

这一新的语言学学说贯穿语言学, 发展心理学, 人工智能等领域, 学科交叉和渗透带来了蓬勃的生命力。这一学说使我们更接近认识语言能力本身, 提供了一个解释人类语言秘密的途径。它的研究成果也将为很多目前未知的问题提供一个很好的切口, 比如儿童早期大脑的构造, 语言和思维、语言能力和认知能力的关系等。

摘要:本文介绍了北京师范大学教授林允清提出的新的语言学研究理论——“发现程序”学说。林允清以评价乔姆斯基转换生成语法为起点, 在重新审视海利斯的语言学研究成果, 特别是发现程序的基础上, 提出:儿童并不是生来就有一套先天的普遍语法, 而是具有一种受遗传因素决定的先天的语言习得机制——发现程序;这些程序使得儿童能够在输入的语料中识别规则和型式, 从而习得语言;语言学家的任务是在海利斯研究的基础上发展并验证发现程序。这一新学说提供了另一个解释人类语言秘密的途径, 并将对语言学、心理学、人工智能等方面产生深远的影响。

关键词:发现程序,语言习得

参考文献

[1] 皮亚杰.发生认识论[M].北京:商务印书馆, 1990.

[2] 张和友.“哈利斯的描写主义语言学研究”[J].四川大学学报, 2001 (1) .

[3] Laura E.Beck[著], 吴颖, 等[译].儿童发展[M].南京:江苏教育出版社, 2002.

[4] 周国光, 王葆华.儿童句式发展研究和语言习得理论[M].北京:北京语言文化大学出版社.

[5] 朱曼殊.儿童语言发展研究[M].上海:华东师范大学出版社, 1986.

[6] Blanche-Benveniste C.et al.1984.Pronom et syntaxe:I’approche pronominale et son application au fran?ais.Paris:SELAF.

[7] Chomsky, Noam.1957, Syntactic Strucutres.The Hague:Mouton.

[8] Chomsky, Noam.1961, “Some meth-odological remarks on generativegrammar”.Word17:219-239.

[9] Chomsky, Noam.1965.Aspects of the Theory of Syntax.Cambridge, Massachusetts:MIT Press.

[10] Chomsky, Noam.1975.The Logical Structure of Linguistic Theory.New York:Plenum Press.

[11] Chomsky, Noam.1986.Knowledge of Language:Its nature, origin, and use.London:Praeger.

[12] Demopoulos & Marras (eds.) , 1986.Lan-guage Learning and Concept Acquisition.New Jercy:Ablex Publish-ing Corporation.

[13] Eynde, K.et al.2002.“Distributional syntactic analysis and valency:basic notions, procedures, and applications of the pronominal approach”.In:Bruce E.Nevin (Ed.) , The Legacy of Zellig Harris.Amsterdam/Philadelphia:John Benjamins Publishing Company.

[14] Gleitman, L., 2002.“Verbs of a feather flock together II”.In:Bruce E.Nevin (Ed.) , The Legacy of Zellig Harris.Amsterdam/Philadelphia:John Benjamins Publishing Company.

[15] Gleitman, L.R., H.Gleitman, B.Landau, & E.Wanner, 1998.‘Language acquisition:The state of the art’.In E.Wanner & L.R.Gleitman (Eds.) , Lan-guage Acquisition:State of the Art.New York:Cambridge University Press.

上一篇:铁路桥梁工程大体积混凝土裂缝成因及防治措施下一篇:基于“互联网+”时代下的人力资源管理趋势和实践分析

本站热搜