语料库语言学

2024-04-18

语料库语言学(精选11篇)

篇1:语料库语言学

【摘要】语料库是语料库语言学研究的基础资源,也是经验主义语言研究方法的主要资源。

语料库分为很多类型,现在已有相当数量的语料库可供语言研究使用。

语料库语言学作为语言学的一个新的分支,当然离不开语料库。

本文解释了语料库语言学的定义及其内涵,介绍了英语语料库的发展和现状,并对语料库语言学的未来发展进行了展望。

【关键词】语料库;语料库语言学;发展

一、引言

语料库自从20世纪60年代初出现至今,已经经历了半个多世纪的发展。

随着计算机技术的不断进步,语料库的研究已经不再是某些人的专利。

同时语料库的发展也正在以惊人的速度对语言研究的很多领域产生着愈来愈大的影响。

语料库语言学,是一种基于语料库的全新的研究技术和方法。

可以毫不夸张地说,语料库语言学开辟了语言研究的一个全新的领域。

本文拟对语料库的建设,语料语言学的研究特点,语料库及语料语言学的发展现状以及存在问题等角度对于语料库及语料语言学进行一次梳理。

二、理论回顾

1.什么是语料库、语料库语言学?语料又称为素材,是自然发生的语言材料包括书面语和口语的集合。

“可以用来作为描述一种语言的出发点或用于证实有关一种语言的假设的手段”(Crystal,1991)。

语料库(corpus)亦称语库,是存放语言材料的仓库。

语料库是收集并科学地组织起来的语言材料数据库,这种材料是某种语言中自然出现的,可以是书面的,也可以是口头的(申厚坤,)。

通常地讲,语料库就是指为语言研究收集的、用电子形式保存的语言材料,由自然出现的书面语或口语的样本汇集而成,用来代表特定的语言或语言变体。

2.语料库及语料库语言学的的产生与发展。

有人认为语料库研究的发展经历了三个阶段:运用语料库进行语言研究最早可以追溯到19世纪末,当时的研究手段还只停留在卡片制作和人工检索的阶段,其成果也仅用作编纂语法书或词典的参考。

20世纪60年代至90年代是语料库语言学发展的第二个阶段,世界各地都开始建设自己的语料库并且开始跨国联合建立国际性的语料库。

20世纪90年代中期是语料库语言学发展的第三个阶段。

但现在被研究者普遍认同的是参照乔姆斯基转换生成语言学的兴衰,认为语料库语言学经历了早期发展、新发展与复兴三个阶段。

3.语料库语言学的研究意义。

语料库语言学采用数据驱动的实证主义研究方法对自然语言进行统计分析。

对语言、语言交际和语言学习的行为规律进行多层面和全方位的研究。

使语言研究不仅只是对单纯语言学上的符号的描述和解释,还是对蕴涵着的复杂社会因素和深刻文化意义的描述和解释。

4.语料库语言学的`现状。

语言界越来越多的人意识到语料在语言研究中的巨大作用。

大批语料库的建成极大地促进了基于语料研究项目的迅速开展。

语料库语言学也正在一起不可替代的巨大优势在语言学研究中发挥着越来越无法替代的重要作用。

语料语言学在以下各方面正被广泛地运用着。

篇2:语料库语言学

稍加留意就可以发现,当代一些对外语教学有着重要影响的词典和语法书均是在语料库的基础上编写的。

SEU语料库建成后,Quick等人合编了堪称权威之作的《当代英语语法》(A Grammar of Contempor-ary English),并根据充实了的语料库合编了更具权威的《英语语法大全》(A Comprehensive Grammar of the English Language)。

篇3:语料库语言学与英语教学

语料库 (Corpus) , 是一个由大量的语言实际使用的信息组成的, 专供语言研究、分析和描述的语言资料库。它是在随机采样的基础上, 收集人们实际使用的、有代表性的真实语言材料而创建起来的。

语料库语言学 (Corpus Linguistics) 是以语料库为基础对语言进行分析和研究的科学。语料库语言学为语言研究提供了一种全新的方法和思路, 利用语料库经过实际观察和分析得出的数据能够在很大程度上减少外语教学的盲目性, 对外语教学具有重要意义。

2. 语料库语言学的发展

语料库语言学是20世纪中后期开始崛起的一门新兴科学, 经过几十年的发展, 正逐渐趋于成熟和繁荣。它不仅是语言研究不可或缺的先进工具, 还是重要的语言研究系统方法论。作为一种语言学研究方法, 语料库及索引 (concordancing) 早在18世纪就在欧洲得到了应用。

19世纪时, 语料库方法在语言学研究中继续得到运用, 基于语料库的研究主要集中在词典编纂和语法研究。20世纪50年代, 早期的语料库语言学研究陷入低谷并中断。语料库研究在20世纪80年代中期进入复兴阶段。现代语料库是指大型的以电子文档为主要构成的计算机语料库。

早期的语料库语言学是指20世纪50年代中期以前, 即Chomsky提出转换生成语法理论之前的所有基于语言材料的语言研究。利用真实的语言材料研究语言一直是语言学家的传统, 他们受实证主义和行为主义观点的影响, 认为用收集到的某种语言中自然出现的语言材料建立起足够大的语料库, 对研究这种语言是必要而可行的。《牛津英语辞典》的编纂者Murray和《现代英语语法》的作者Jesperson都曾以原始的方法认真积累真实语言素材, 并以这些为基础研究语言规律和解释语言现象。

但是, 到了20世纪50年代后期, 这种早期的语言学随着Chomsky的转换生成语法学派的兴起而中断了。Chomsky及其转换生成语法学派主要从两个方面否定早期语料研究。首先, 语料研究方向有误。Chomsky认为, 语言研究的主要目标是建立一种能反映说话人心理现实的语言认知模式, 即语言能力模式。因为只有语言能力才能对说话人的语言知识作出解释和描述, 而语言运用只是语言能力的外在证据, 通常它只会因超语言因素的影响而发生变化, 因而它不能确切地反映语言能力。语料从本质上只是外在化的话语的汇集, 基于语料的研究所建立的经验模式也仅能算作是对语言能力作出的部分解释。因此, Chomsky认为, 语料不是语言学家从事语言研究的得力工具。其次, 语料具有不完整性和不充分性。Chomsky通过研究发现, 英语短语结构规则是有递归性的, 这种递归性表明, 自然语言的句子是无限的, 而作为语料基本单位的句子的无限性决定了语料的无限性。也就是说, 语料永远是不完整、不充分的。

在此后的近20年里, 语料研究方法几乎是名誉扫地。尽管如此, 英国伦敦大学的Quirk不畏权威批评, 凭借其非凡的学术勇气, 开创了第一代语料库语言学。他在1959年宣布建立英语用法调查语料库 (The Survey of English Usage) , 目的是对英语语法进行全面的指导。不久后, 美国的Francis和Kucera等人在布朗大学利用计算机建立了布朗语料库 (Brown Universiy Standard Corpus of Present-day American English) 。1975年, J Svartvik为首的一批语言学家在瑞典Lund大学开始对Quirk语料的口语部分作出韵律标注, 并实现了机读, 建立了伦敦-朗德语料库 (London-Lund Corpus of Spoken English) 。这个语料库不仅激发了语言学家对英语口语的研究, 而且鼓舞人们进行了与语料库有关的大量的研究工作, 开创了语言学研究的新局面。

语料库语言学自80年代以来, 迅猛发展, 空前繁荣。第二代语料库相继建成, 基于语料的研究项目增多, 研究范围不断扩大, 成果丰硕。这些都稳固并提升了语料库语言学在语言学界的地位。

3. 语料库语言学对英语教学的影响

3.1 外语教学中语言现象处理方面的观念转变

语料库语言学可以通过先进的检索手段进行频率统计 (Frequency Count) 。它可以将语言的不对称性分布特征清楚地表现在词汇、语法结构、词组和词汇搭配等语言现象上。以词汇为例, 绝大多数书面文章的95%由4000—5000次高频词构成, 这其中1000个高频词又占了文章的85%;口语中, 50个高频功能词汇占了60% (Nation, 1990) 。这要求教师在外语教学中区别对待不同的语言现象, 包括高频词、高频词的低频义、低频词的高频义、高频语法结构和高频词汇搭配等。

统计学认为, 高频的语言项目一般是语言学习者在使用过程中最可能遇到、学习或使用的语言项目。由于非本族语的学习者的接触和学习目标语的精力和时间十分有限, 把典型的语言规律作为教学的中心可以减轻学习负担, 避免混淆, 从而提高教学的有效性, 达到事半功倍的效果。

语料库语言学正在引起教学思想观念的转变, 人们从均衡对待不同的语言现象转变为有重点地对待典型的语言现象。这种指导思想已在教学大纲中逐步反映出来。早在1982年, 张彦斌先生就提出要进行词频统计和每个词条下不同词义的频率统计, 为教学大纲中词汇的制定提供科学的依据。我们应该运用语料库研究的成果为教材编写和词典编纂提供依据。

在教学活动中, 教师也应该具有语言现象有高低频之分的意识, 并在教学的备课、教学、辅导、考试、批改作业等各个环节贯彻有重点地对待典型语言现象的原则, 高频的语言现象应作为教学的重点, 并受到教师和学生的重视, 这一原则应用在考试环节中, 使用定位检索软件准备练习题或测试题可以极大地减轻教师的工作量, 并且使题目更具真实性和可靠性。

3.2 对各种语域变体的特点有更清楚的认识

在不同的语域中, 语言会有各自不同的特点, 在外语教学中这一特点应该得到足够的重视。语料库语言学证明了有些语言形式在不同语域中出现的频率有明显的差异。将语料库语言学与外语教学相结合, 便于我们对各种语域变体的特点作出进一步研究, 并对其语言形式的用法有更全面的了解。

Svartvik对英语动词被动语态的研究是利用语料库研究语域变体中最有名的。在不同的语域中, 被动语态出现的频率有显著差异。被动语态在科技文献中出现的频率最高, 在约5万词的文本中, 每千词中出现23.1次;其次是新闻报道, 在约4万5千词的文本中, 每千词中出现15.8次;频率最低的是广告, 在2万8千词的文本中, 每千词中平均只出现3次。

Rundell利用BNC的口语部分进行的研究也有许多新的发现。例如, 一般词典都把begin和start这两个词当作同义词对待, 而Rundell在研究中发现, began主要用于书面语中, 出现的次数几乎是started的两倍;而started则主要用于口语中, began在口语中出现的频率则低得多。不同年龄段的人在使用语言中也存在着差异, Rundell研究发现50岁以上的老年人习惯把shall用在肯定句中, 年龄越小, 这样使用shall的人就越少。而使用“Shall I...”这种疑问句形式的则包括各种年龄阶段的人。

3.3 兼顾目的语和母语之间的差异性

在外语教学实践中发现, 由于目的语的语言规则与母语自身语言的特点有很大差异, 目的语和母语之间的差异往往是学习者难以掌握并容易出错的地方。语言学家通过实践证明了对目的语和母语之间差异的分析能够对外语教学产生积极的影响。Groan Kjellmer在1992年曾经提出在外语教学中, 最好能够在目的语的典型性与目的语和母语之间的差异性之间取得一种谨慎的平衡。

语料库语言学为目的语和母语之间的差异性研究提供了技术保证和科学依据。经过对目的语和母语两种语料库的分析研究, 不仅可以揭示目的语的语言特征, 还可以分析研究两者之间的差异。在英语教学中, 要多层面吸收国际上英语语料库的研究成果, 并结合中国的汉语语料研究, 发现英汉两种语言的差异, 并重视语言学习中的跨语言因素, 运用到英语教学中, 从而提高英语教学的质量和效率。

3.4 帮助学习者学习地道的英语

英语学习者在学习过程中会遇到很多问题。在一定条件下, 把外语学习者的口语和书面语收集起来, 就可以建成一个学习者语料库 (the learner corpus) 。将英语学习者语料库和英语本族语者的语料库进行对比, 可以发现英语学习者在使用语言中出现的一些问题。Granger描述的一个学习者语料库收集的是以英语为外语的高级阶段的成年人学习者所写的文章。她把这个语料库中的一些材料与以英语为母语的人的语料库中的相关材料进行了对比, 利用计算机统计出各种连接词在两个语料库中出现的次数, 发现外语学习者与本族语使用者在连接词的使用方面有很大差异。例如, 在以英语为母语的语料库中, however, therefore, so, then, thus是出现次数最多的5个连接词;而在外语学习者的语料库中最常见的5个连接词是in fact, so, indeed, for example, for instance。由此可见, 学习者在写作中对某些连接词使用过多, 而对另一些连接词则使用不足。

建立学习者语料库, 从学习者的输出获取对教学有用的信息, 并结合目的语描述、学习者的特点以及与这两者相关的教学的研究, 将极大地改进我们的英语教学。

4. 结语

目前, 利用语料库对语言进行研究的成果不断出现, 语料库语言学的应用范围也越来越广泛。从辞典、语法书、教学大纲的编纂到对自然语言的研究, 语料库语言学正在逐渐引发应用语言学特别是外语教学的一场革命。它促使了外语教学思想观念的转变, 在教学中使我们对各种语域变体有更清楚的认识, 并兼顾目的语与母语的差异性, 从而使学习者学习到更地道的英语。

参考文献

[1]Graeme Kennedy.An Introduction to Corpus Linguistics[M].北京:外语教学与研究出版社, 2000.

[2]Biber, Douglas&Conrad, Susan&Reppen, Randi.Cor-pus Linguistics:Investigating Language Structure and Use[M].北京:外语教学与研究出版社, 2000.

[3]桂诗春, 杨惠中.中国学习者英语语料库[M].上海:上海外语教育出版社, 2003.

[4]陈建生.语料库语言学与英语教学[J].解放军外国语学院学报, 2004, (1) .

篇4:语料库语言学综述

【关键词】语料库;语料库语言学;发展

一、引言

语料库自从20世纪60年代初出现至今,已经经历了半个多世纪的发展。随着计算机技术的不断进步,语料库的研究已经不再是某些人的专利。同时语料库的发展也正在以惊人的速度对语言研究的很多领域产生着愈来愈大的影响。语料库语言学,是一种基于语料库的全新的研究技术和方法。可以毫不夸张地说,语料库语言学开辟了语言研究的一个全新的领域。本文拟对语料库的建设,语料语言学的研究特点,语料库及语料语言学的发展现状以及存在问题等角度对于语料库及语料语言学进行一次梳理。

二、理论回顾

1.什么是语料库、语料库语言学?语料又称为素材,是自然发生的语言材料包括书面语和口语的集合。“可以用来作为描述一种语言的出发点或用于证实有关一种语言的假设的手段”(Crystal,1991)。

语料库(corpus)亦称语库,是存放语言材料的仓库。语料库是收集并科学地组织起来的语言材料数据库,这种材料是某种语言中自然出现的,可以是书面的,也可以是口头的(申厚坤,2005)。通常地讲,语料库就是指为语言研究收集的、用电子形式保存的语言材料,由自然出现的书面语或口语的样本汇集而成,用来代表特定的语言或语言变体。

2.语料库及语料库语言学的的产生与发展。有人认为语料库研究的发展经历了三个阶段:运用语料库进行语言研究最早可以追溯到19世纪末,当时的研究手段还只停留在卡片制作和人工检索的阶段,其成果也仅用作编纂语法书或词典的参考。20世纪60年代至90年代是语料库语言学发展的第二个阶段,世界各地都开始建设自己的语料庫并且开始跨国联合建立国际性的语料库。20世纪90年代中期是语料库语言学发展的第三个阶段。

但现在被研究者普遍认同的是参照乔姆斯基转换生成语言学的兴衰,认为语料库语言学经历了早期发展、新发展与复兴三个阶段。

3.语料库语言学的研究意义。语料库语言学采用数据驱动的实证主义研究方法对自然语言进行统计分析。对语言、语言交际和语言学习的行为规律进行多层面和全方位的研究。使语言研究不仅只是对单纯语言学上的符号的描述和解释,还是对蕴涵着的复杂社会因素和深刻文化意义的描述和解释。

4.语料库语言学的现状。语言界越来越多的人意识到语料在语言研究中的巨大作用。大批语料库的建成极大地促进了基于语料研究项目的迅速开展。语料库语言学也正在一起不可替代的巨大优势在语言学研究中发挥着越来越无法替代的重要作用。语料语言学在以下各方面正被广泛地运用着。

①语料库语言学与词典编撰。语料库语言学对于词典的编撰无疑具有极其重要的作用。稍加留意就可以发现,当代一些对外语教学有着重要影响的词典和语法书均是在语料库的基础上编写的。SEU语料库建成后,Quick等人合编了堪称权威之作的《当代英语语法》(A Grammar of Contempor-ary English),并根据充实了的语料库合编了更具权威的《英语语法大全》(A Comprehensive Grammar of the English Language)。COBUILD语料库也以其庞大的库容、多样的内容作为词典编纂不可缺少的工具。

②语料库语言学与语言研究。我们无法否认这样的事实:任何和语言现象有关的研究都离不开真实的语言素材。语料库为应用语言学的研究提供了丰富的语言材料。语料库语言学使得在语言理论、语言史研究和句法、词法分析及自动语法分析方面得到了充分的应用。再加上语料库的检索功能和统计手段给句法研究、语篇分析、会话分析和语音研究提供了方便。互联网上现代英语国际电脑文档(I2CAME)介绍了许多近年来以语料库为基础的语言研究项目,说明语料库对于语言研究的重大意义。

A.语料库语言学与外语教学。毫不夸张地说,语料库和语料库语言学的应用已经渗透到语言教学的各个角落。许智坚将语料库语言学在外语教学中的应用总结为如下六点:a.帮助减少课堂上教的与人们实际上正在使用的语言之间的差距;b.发现过去被忽略的语言规律;c.帮助我们更清楚地认识各种语域变体的特点;d.帮助我们更准确地理解一些词语在实际交际中的意义和用法;e.帮助发现学习者使用语言时的问题;f.测试及语言错误分析等方面。在计算机辅助教学中语料库语言学能在教学中发挥更大的作用。

B.语料库语言学与翻译。语料库语言学与翻译的结合起步相对较晚,至今只有十多年的历史。两者的结合源于国外对翻译学的研究。应用于翻译中的语料库多是平行语料库,由相对应的两种或多种语言构成的文本组成。

③语料库语言学的其他运用。此外,语料库语言学也在其他一些领域起了一定的作用,比如有力地推动了计算机语言学的发展,主要表现在语料处理工具的研究、机器翻译及话语识别和话语合成等方面。

5.语料库语言学存在的问题。①语料库语言学的地位问题。语料库语言学的地位到底怎么定义,这一直以来有些争议。尤其是语料库语言学被引进中国以来,这种地位问题的讨论就一直没有停止过。刘满堂、潘永樑等人所持观点为:语料库语言学是一门新兴而独立的语言学分支学科。黄昌宁、丁信善、许家金等人则持相反观点。他们甚至提出用基于语料库的研究方法可能更适合于反映语料库语言学的地位和性质。

②语料库建设的问题。收集语料时的文本形式、文本所有权和版权等的问题也不容忽视。再加上不同语料库的注释采用的编码系统不完全相同或很不相同,为信息交换和基于语料库的语言研究带来很大的困难。另外,机器可读语料库中的语篇仍有版权限制,还有语料的时限问题,这些都是语料语言学进一步发展所必须面对的问题。

③语料库语言学的发展问题。李文中(2010)指出语料库语言学的发展至少有如下四个问题亟待解决:A.语料库开发问题。语料库开发正在向两头快速发展和延伸:一是通用型的、基于网络的超大型语料库开发;二是个性化、专门化、行业化的小型语料库开发。这两种开发的方向各有其优势,到底哪种开发方向应该占据优势,还是两种发展方向各自为战,又亦或是两者相结合发展,确实也是需要考虑的问题。B.语料库研究的发展问题。语料库研究需要更大的发展纵深,要解决如何从描述到解释,以及如何从发现到理论建构等难题。C.语料库研究方法和视野问题。语料语言学是集中于实践性研究,偏废理论建构式的研究,还是也需要在理论建构上有所建树?研究的视角仅仅局限于教学和语言习得,还是不断的拓展其研究领域以扩大其影响力?这也是问题。D.语料库研究应用问题。语料库研究应用越来越多元化和日常化。到底如何将语料库的研究成果更加充分的应用起来,应该引起足够的重视。但目前最大问题可能是只有一小部分语言研究专家掌握语料库研究方法,绝大多数语言教师和语言学习者不了解语料库,不会使用语料库,更不懂如何运用语料库资源进行科学研究。

三、结语

近几年来在计算语言学和语言信息处理领域的学术会议上,语料库的建设和应用一直是重要论题之一。纵观其讨论的重点主要集中在基于语料库的语言分析方法,以及语料的标注、管理和规范等问题上。语言学家更多关心的是语料库的规划和建设,语料库方法在语言研究和教学中的应用。(傅爱平)现阶段,语料库主要用于语言描写,为词典编纂、教材编写、语言教学提供实际语例,帮助语言学家揭示语言的词汇、语法、语义和语用规律。我们坚信,语料库语言学将会广泛地应用于語言学研究的各个领域,不仅仅为外语教学、词典编纂、教材编写等开辟新的道路,更会在其他不同的更为广泛的应用语言学的领域里大放光彩。

参考文献:

[1]丁信善.语料库语言学的发展及研究现状[J].当代语言学.北京:1998(1)4-12.

[2]桂诗春.发展我国应用语言学的几点想法[J].语言文字应用.北京:1998(1):11.

[3]何安平.学习者语料库与外语教学[J].国外外语教学,1999(4).

[4]冯志伟.中国语料库研究的历史与现状[J].汉语语言与计算学报,2002(1).

篇5:语料库语言学

此外,语料库语言学也在其他一些领域起了一定的作用,比如有力地推动了计算机语言学的发展,主要表现在语料处理工具的研究、机器翻译及话语识别和话语合成等方面。

5.语料库语言学存在的问题。

篇6:语料库语言学

语料库开发正在向两头快速发展和延伸:一是通用型的、基于网络的超大型语料库开发;二是个性化、专门化、行业化的小型语料库开发。

这两种开发的方向各有其优势,到底哪种开发方向应该占据优势,还是两种发展方向各自为战,又亦或是两者相结合发展,确实也是需要考虑的问题。

B.语料库研究的发展问题。

语料库研究需要更大的发展纵深,要解决如何从描述到解释,以及如何从发现到理论建构等难题。

C.语料库研究方法和视野问题。

语料语言学是集中于实践性研究,偏废理论建构式的研究,还是也需要在理论建构上有所建树?研究的视角仅仅局限于教学和语言习得,还是不断的拓展其研究领域以扩大其影响力?这也是问题。

D.语料库研究应用问题。

语料库研究应用越来越多元化和日常化。

到底如何将语料库的研究成果更加充分的应用起来,应该引起足够的重视。

但目前最大问题可能是只有一小部分语言研究专家掌握语料库研究方法,绝大多数语言教师和语言学习者不了解语料库,不会使用语料库,更不懂如何运用语料库资源进行科学研究。

三、结语

近几年来在计算语言学和语言信息处理领域的学术会议上,语料库的建设和应用一直是重要论题之一。

纵观其讨论的重点主要集中在基于语料库的语言分析方法,以及语料的标注、管理和规范等问题上。

语言学家更多关心的是语料库的规划和建设,语料库方法在语言研究和教学中的应用。

(傅爱平)现阶段,语料库主要用于语言描写,为词典编纂、教材编写、语言教学提供实际语例,帮助语言学家揭示语言的词汇、语法、语义和语用规律。

我们坚信,语料库语言学将会广泛地应用于语言学研究的各个领域,不仅仅为外语教学、词典编纂、教材编写等开辟新的道路,更会在其他不同的更为广泛的应用语言学的领域里大放光彩。

参考文献:

[1]丁信善.语料库语言学的发展及研究现状[J].当代语言学.北京:(1)4-12.

[2]桂诗春.发展我国应用语言学的几点想法[J].语言文字应用.北京:1998(1):11.

[3]何安平.学习者语料库与外语教学[J].国外外语教学,(4).

[4]冯志伟.中国语料库研究的历史与现状[J].汉语语言与计算学报,(1).

篇7:语料库语言学与高职英语教育论文

摘要:

语料库语言学习在高职英语教育中的应用,转变了英语语言的处理观念,使学生认识了各种语域变体,能在实际英语运用中更加地道。高职英语在改革过程中要重视语料库语言学在教育中的应用,促进英语教学质量的提升。

关键词:

篇8:语料库语言学的过去、现在与未来

语料库语言学研究是以大规模的机器可读语料为基础的, 一般认为始于上世纪60年代。但是在机读语料库出现之前, 语料库研究已广泛用于圣经和文学研究、词汇、方言研究等领域, 这一时期也被称为“前电子语料库时期”。

在SEU语料库创建不久, 英语语料库的编制进入了电子时代。语料库电子时代又分为第一代和第二代。

第一代电子语料库时期建立的主要语料库有布朗语料库 (The Brown Corpus) 、兰卡斯特-奥斯陆/卑尔根语料库 (LOB Corpus) 、伦敦-隆德语料库 (LLC) 等。LOB语料库由英国兰卡斯特大学和挪威奥斯陆大学与挪威人文科学计算中心共同合作建立。LOB语料库被认为可与布朗语料库相媲美, 它收集了1961年出版的英国书面, 同样有500篇文本, 每篇约2000词, 共计100万词次。1975年, 瑞典隆德大学开始将英国SEU语料库收集的英语口语材料转化成机读的形式, 并在原来语料的基础上增加了13篇文本, 经过加工整理, 收录100篇文本, 于1980年建立起伦敦-隆德英语口语料库。

在第一代电子语料库的基础上, 第二代电子语料库收录内容不再仅限于口语语料, 语言信息更多, 相比之下, 更加完善, 实用。第二代电子语料库主要有COBUILD语料库、朗文语料库、国际英语语料库等。

COBUILD计划是英国柯林斯出版社和伯明翰大学的一个合作项目, 历时4年多, 于1984年完成。1990年SINCLAIR宣布, COBUILD语料库经过扩展, 更名为英语库。1997年, 其所含的语料已超过3亿词次, 并且还在不断扩大。朗文语料库网由英国的三大语料库组成, 它们是朗文兰卡斯特英语语言语料库、朗文口语语料库和朗文学习者英语语料库。该语料库取材自1900年以来英国英语、美国英语和世界上其他主要的英语变体, 涉及书面英语和口头英语两种形式, 是一个覆盖范围很广的语料库, 计划库容为5000万词次, 到90年代早期, 库容已达到3000万词次。国际英语语料库的最大特点是其严密的组织和语料库的国际性和代表性, 统一的标准和周密的设计确保了语料库的质量, 其潜在的研究与应用价值与日俱增[1]。

在我国已完成的语料库有上海交大的黄人杰、杨惠中主持完成的专门用途英语语料库、交通大学科技英语语料库, 北京大学计算语言研究所开发建设的Babel汉英平行语料库, 北外中国外语教育研究中心创建的北外双语对应语料库, 以及由上海交通大学外国语学院翻译与词典学研究中心创建的莎士比亚戏剧英汉平行语料库等。

二、语料库与其他学科的关系

1. 语料库的学科定位

什么是语料库语言学?很多学者和语言学家都各自给出过定义:

(1) K.Ailmer&B.Altenberg指出, 根据篇章材料对语言的研究称为语料库语言学[2]。

(2) 基于现实生活中语言运用的实例进行的语言研究称为语料库语言学 (T.McEnery&A.Wilson, 1996:1) [3]。

(3) 黄昌宁指出:“语料库语言学是80年代才崭露头角的一门计算机语言学的新的分支学科。它研究机器可读的自然语言文本的采集、存储、检索、统计、语法标注、句法语义分析, 以及具有上述功能的语料库在语言定量分析、词典编纂、作品风格分析、自然语言理解和机器翻译等领域中的应用[4]。”

2. 语料库的应用

语料库语言学经过半个多世纪的发展, 已与多个学科结合在一起, 形成典型的跨学科领域。目前, 语料库已被用于词典编纂、词汇研究、句法研究、语义研究、语用研究与话语分析、文体学研究、机器翻译、社会语言学研究等领域, 并取得了丰硕的成果。

(1) 语料库在词汇研究领域的应用

近年来, 借助语料库对于词汇学的研究取得了一定的进展。卫乃兴指出:“词语搭配是当今语料库语言学研究中最为活跃的领域, 它处于中心地位。”王克非和胡显耀借助语料库对翻译汉语词汇和源语词汇进行对比分析, 考察翻译汉语区别于汉语源语语料的词汇使用特征。采用定量分析研究词汇使用情况显然更有说服力, 从这个意义上说, 语料库在词汇研究领域十分有价值。

另外, 卫乃兴在词汇搭配方面做出了积极的探索。卫指出, 研究专业性搭配可进一步丰富词语搭配研究的内容, 对描述科技文章中词语组合的特点与规律, 其语义特点和语篇组织特点都有重要价值[5]。

(2) 语料库与翻译学

语料库翻译学的创始人是以英国曼彻斯特大学翻译与跨文化研究中心MONA BAKER教授为代表的一批学者。语料库翻译学是指以语料库为基础, 以真实的双语语料或翻译语料为研究对象, 以数据统计与理论分析为研究方法, 依据语言学、文学和文化理论及翻译学理论, 系统分析翻译本质、翻译过程和翻译现象等内容的研究[6]。

一般来说, 用于翻译学研究的语料库有平行语料库, 翻译语料库, 可比语料库和口译语料库等。现已建成的比较成熟的译学研究语料库有翻译英语语料库、Babel汉英平行语料库、北外双语对应语料库、中国法律法规汉英平行语料库、全国公示语翻译语料库、莎士比亚戏剧英汉平行语料库、奥斯陆多语语料库等, 很多语料库资源是共享的, 研究者可以根据需要选择合适的语料库[7]。

语料库翻译学研究虽然只有短短十几年的发展历史, 但起步较快, 发展势头迅猛。语料库翻译学区别于传统的译学, 为翻译学科的发展提供了新的思路和发展方向, 使得译学研究内容得到不断拓展和延伸。

(3) 语料库与汉语研究

语料库语言学的发展和英语语料库的建设推动了汉语语料库的建设和汉语的研究。

我国在离散单词、简单口令的语音识别方面已经取得不少进展。90年代, 中国科学院自动化研究所研制了“汉语大词汇量语音识别与口呼文本输入系统”, 以声韵调为基元来进行语音识别, 识别时采用了隐马尔可夫模型及人工神经网络方法[8]。

另外, 在汉字识别系统的研究方面也取得了很多成绩。我国从上世纪70年代开始汉字自动识别的研究工作, 清华大学、北京邮电大学、武汉工业大学等研发的系统汉字识别率都相对较高, 成绩喜人。

此外, 很多学者利用语料库进行语义韵研究。语料库在人工智能和外语教学等方面也大有用武之地。很多时候, 语料库用于其他学科并不是泾渭分明的, 语料库研究范式可以将多个学科研究有机地结合在一起, 从而能够更好地服务于各个学科。

三、语料库的未来

梁茂成曾指出[9], 由于大型语料库包含了大量的语言事实, 无论是从事理论研究的理论语言学家, 还是从事实研究的经验语言学家, 语料库都将成为最重要的数据源。

在未来语料库语言学探索的道路上, 其发展趋势将会呈现以下特点:

首先, 随着科技的进步, 尤其是计算机网络信息技术的爆炸式发展, 语料库的库容将不是难题。语料库的容量将会进一步增大, 以满足增大样本的需求, 以便于更加全面客观地进行语言研究。

其次, 语料库的类型将会更加多样化。为了不同学科和研究的需要, 未来的语料库将会更加多样, 以适应不同研究的需要。

再次, 语料库与其他学科的联系将会更加紧密, 甚至语料库与多个学科同时融合在一起, 从而更好地开展研究工作。正如刘满堂指出, 随着语料库应用领域的不断扩大, 语言研究各领域越来越依赖于电子语料库这一研究工具, 语料库语言语言学正逐渐成为一个跨学科的语言学分支[10]。语料库与翻译学、词典学、计算语言学、人工智能等学科结合, 必将极大地促进各个学科的发展。

四、结语

语料库语言学是一门新兴的学科, 同时它又是一门交叉学科。基于这点, 语言库语言学有着广阔的前景和发展空间。未来语料库自身建设和完善是摆在研究者面前的新的有意义的课题。此外, 语料库与其他各个学科的结合和应用还有待进一步探索。

参考文献

[1]刘满堂.近40年英语语料库及语料库语言学研究的回顾与展望[J].陕西教育学院学报, 2004, 20 (1) :98-100.

[2]Ailmer, J.&B.Altenberg (eds.) English Corpus Linguis-tics:Studies in Honor of Jan Svartvik[C].Longman.1991.

[3]T.McEnery, A.&A.Wilson.Corpus Linguistics[M].Edin-burgh:Edinburgh University Press, 1996.

[4]黄昌宁.语料库语言学[M].北京:商务印书馆, 2002.

[5]卫乃兴.专业性搭配初探[J].解放军外国语学院学报2001, 24, (4) :20-23.

[6]胡开宝.语料库翻译学概论[M].上海:上海交通大学出版社, 2011:1.

[7]胡开宝.基于语料库的莎剧《哈姆雷特》汉译本中“把”字句应用及其动因研究[J].外语学刊, 2009 (1) :111-115.

[8]冯志伟.基于语料库的机器翻译系统[J].术语标准化与信息技术, 2010, 1:28.

[9]梁茂成.理性主义、经验主义与语料库语言学[J].中国英语教育, 2009, 4.

篇9:语料库语言学与语法教学探讨

关键词:语料库语言学;语法教学;数据驱动学习

1引言

长期以来,究竟在英语教学中该不该教语法以及如何教语法一直是值得争议的话题。Rod nlis在他发表的“Current Issues in the Teaeching of GrammarAn SLA Per-spectlve”文章中指出,对于学习者如何习得第二外语的研究有利于帮助我们思考学习者怎样习得语法。本文在分析了传统语法教学法——结果教学法和过程教学法的利与弊之后,从语言习得的角度,探讨了数据驱动学习法在语法教学中应用的理据性。它协调传统的两种教学法,从真正意义上优化语法教学。从而,真正提高语法教学的效率,为学习者有效地习得语法提供方便之门。

2传统教学法回顾

2.1结果法

结果法除了语法翻译法外,还包括听说法等,它把语法系统细分为各个组成部分,然后依次把每一个部分传授给学习者。Batstone指出,结果教学法的优点在于“它可以给学习者提供一个结构清楚、层次分明的学习框架,它可以让学习者注意到所学语言的结构并且可以把这些结构分离出来,把它们的用法充分地展示出来,这样就能让学习者有一种较强的的方向感和安全感,能让他们明确学习的目标,增强学习的动力”。Lewis在总结结果教学法的不足之处中指出:(1)不少用于教学的误法规则本身就是不正确的;(2)学生往往不能够很好地理解教师的语法知识;(2)不能够理解抽象的元语言和语言规则会导致不必要的学习失败;(4)没有研究证实,显性的语法知识可以帮助学生习得整个语法系统;(5)没有研究证实,语法是语言习得的基础。

总结结果教学法的优缺点,我们知道结果教学法呈现出“我们该教授什么样的语法内容”“显性语法知识的讲授是否有价值”等问题的讨论,另外,它只强调语言的规律性。而桂诗春则认为,语言的本质是概率性的,而不是规约性的,与其说合语法的准确的句子,不如说本族人经常说的地道的语言,最后,结果教学法忽略了学习者语言习得的规律,导致学习者“知法犯法”,也就是明明知道语法规则,在使用或练习时忽略这个规则。

2.2过程法

鼓励学习者在学习过程中的探索发现能力,让学生通过接触语言来发现语言的规律,典型的就是交际法,另外还有任务教学法和意念——功能法。过程法的优点在于它鼓励学习者对自己的学习负责,能充分发挥学习者在学习中的主体作用。在过程教学法中,教师让学生自己通过接触语言素材认识了一些句型,然后使用这些句型进行语言练习。在任务教学法中,教师给学习者设计一些任务驱使学习者在完成任务的过程中学会用外语进行交际。过程法的重点是让学习者理解语言的意义,提高学习者语言表达的流利性。另外,过程教学法把语言的习得看成是一个有机的过程,意思是掌握目标语是一个渐进的过程。随着语言使用的增加,外语学习者各方面的语言技能就会不断地改进,过程法似乎很合乎新的教学理念,即以学习者为中心,然而,过程教学法在语言教学中没有对语法进行显性的教学,它优先考虑培养言语的流利性,过分强调语言的意义,忽视语言的准确性这种做法会使得语言学习者在学习中只注重发展交际策略,而忽略对语言结构的学习,因而无法提高学习者的语言水平。

结果教学法和过程教学法各有各的优缺点,结果教学法注重语言的结构(形式),过程教学法注重语言的意义;结果教学法强调语言的准确性,过程教学法强调语言的流利性;结果教学法重视显性语法知识的传授,过程教学法重视隐性语法知识的传授,这两种传统的教学法给语法教学带不少争议性的问题。

3数据驱动学习法

3.1定义

随着语料库语言学日益发展成熟,将语料直接应用于教学方面的研究也越来越受到研究者们的关注。Leech-直坚持将语料库与教学结合起来。Tim Johns认为“数据驱动学习”可以通过计算机语料最好地体现以学习者为中心的“发现式学习”。Willis从交际法的角度将数据驱动学习定义为一种课堂教学活动。然而目前数据驱动学习的使用已不仅局限于教师指引下的课堂活动,学生可以自行在语料库中检索,解答自己在学习中遇动的疑问,综上所述,数据驱动学习是指以语料库为基础,使用原始语料或能通过语料库检索工具得到的结果来进行语言学习的发现式的探索式学习模式。它可以是以教师为主导,以原始语料或通过语料库检索工具得到的语料编制教学材料和练习,以学习者为中心设计一系列教学活动,引导学生发现目标语的规则,提高学生对有关知识点的敏感度的教学模式;还可以是学习根据个人不同的学习需求和意愿,自己检索语料库中的语料,进行发现式和探索式的学习。

3.2语言习得理论

“语言习得指的是一个人语言的学习和发展,母语或第一语言的学习称第一语言习得,第二语言或外语的学习称第二语言习得”。根据语言习得规律,语言知识的记忆不能保证语言使用的正确,必须有大量的语言输入才能使学习者掌握所学习的语言。Willis总结了语言习得的四个基本条件:一是要有大量的真实的语言输入;二是要有语言使用的机会,要通过语言进行交流,做事情;三是要有学习语言的动机;四是要有合适的指导,使学生有机会注意语言的形式。数据驱动学习可以很好地满足这四个基本条件:(1)在语言输入方面,“语境共观”将大量的目标语呈现给学生,相比传统教学中教科书上提供有限的几个例子,数据驱动学习提供给学生的语言输入量要大得多。另外,由于语料库收集的是实际使用中的语言,它所提供是真实的语言输入,因此,数据驱动学习所提供的语言输入在质和量两个方面都优于传统教学中的语言输入。(2)数据驱动学习所设计的课堂活动是以学生为中心的,学生归纳语言使用的规则,用语言进行交流,完成任务,课堂上的语言交流使学习者努力用自己所掌握的语言结构和词汇来表达自己的意思,交换信息,(3)成功和满足感是激发动机的关键因素,数据驱动学习的教学模式使学生进行探索式学习和发现式学习,语言规律是由学生根据大量的语料归纳出来,学生扮演的不只是语言学习者的角色,而且是语言研究者。(4)数据驱动学习虽然强调以学生为中心,但并没有忽视教师的指导作用,在此教师是教学过程的组织者和指导者,以学生为中心的教学设计的各个环节若想要取得较理想的学习效率都离不开教师的认真组织和精心指导。

3.3一种平衡结果法和过程法的教学方法

如上所述,结果法和过程法各有优缺点。然而,在实际教学中,结果法和过程法并不是两个极端,而是一个连续体,而数据驱动学习法在空间上就位于这两种教学法的中间,它整合了结果法和过程法各自的优点。这三种教学法的关系和区别如上图所示:

数据驱动学习法通过向学生展示大量真实的语料,让学生注意所学语言的形式特征,即大量的“意识提升”(con-seiousness-raising)活动,而不是一味地灌输语法规则。这些活动使学生在学习中成为语言用法的研究者,而不是知识被动的接受者,因此,语料驱动学习法充分吸收了过程教学法关于语言的习得是有机过程的思想和让学生自我发现语言规律的优点。另外,它所提供的语料是以真实的语篇为基础,数量大,既真实生动又具有时代感。说服力强,从而克服了结果教学法的不足之处,数据驱动学习法还能帮助学生兼顾语言的规律性和概率性两个方面,确实是一种,桥接过程法和结果法优点的理想的教学方法。

4结语

篇10:语料库语言学

由于语料库是建立在最真实的语言资料的基础上,所以具有真实客观,可证的特征。将语料库引入英语教学可以改变传统教学模式中学生的被动状态,改善学生的自主学习性。教师不再仅仅是知识的传授者,而是充当引导者。在老师的指导下,学生通过对大量真实语料的检索与分析来解决学习中出现的问题。语料库将大量真实的语料和实例展现给学习者,直接真实。这样可以使学生直观地接触语料,并利用语境获取语义和总结规律。语料库的加入还可以使自主性学习模式得到更好的实现,学生们对语料库的检索与分析都属于自主性的学习,教师只需要做必要的指导与监督。

篇11:基于语料库的网络语言的隐喻研究

基于语料库的网络语言的隐喻研究

采用问卷调查和访谈的方式,对网络语言(CML)交流现象进行研究.通过自行建造的英文文本语料库手段,发现参与聊天的.年轻人网络语言简练,隐喻俯拾可见.认为在观察网络语言的框架中.通过对隐喻处理的认知的、语言的和话语交际的分析,把隐喻能力作为处理网络语言交际的指导.从而建立隐喻理论在网络语言交流中的应用实施框架.

作 者:刘先宽 作者单位:沈阳师范大学,外国语学院,辽宁洗阳,110034刊 名:重庆科技学院学报(社会科学版)英文刊名:JOURNAL OF CHONGQING UNIVERSITY OF SCIENCE AND TECHNOLOGY(SOCIAL SCIENCES EDITION)年,卷(期):2008“”(2)分类号:H030关键词:网络语言 隐喻 语料库 实施框架

上一篇:2024年内容营销策划发展趋势下一篇:让长乐的明天更加灿烂,辉煌182