翻译机器

2024-05-13

翻译机器(精选十篇)

翻译机器 篇1

机器翻译是利用计算机把一种自然语言转换成另一种自然语言的过程。早在上世纪30年代初, 法国科学家CtB.Artsouni就提出了利用机器来进行语言翻译的想法。1946年电子计算机问世之后, 美国工程师W.Weaver在1949年发表了一份以《翻译》为题的备忘录, 正式提出了机器翻译这一设想[1]。1954年美国乔治敦大学在IBM公司的协同下, 进行了俄英机器翻译实验, 这是世界上第一次机器翻译试验。随后, 前苏联、英国、日本、中国等国, 也相继进行了机器翻译试验。

机器翻译发展至今, 已出现了多种基于不同原理的机器翻译系统。总体可以将机器翻译系统从方法上大致分为四类:基于规则的机器翻译、基于实例的机器翻译、基于统计的机器翻译和混合式机器翻译。不同的机器翻译系统各有所长。例如, 基于规则的机器翻译系统擅长于翻译符合规则的句子, 翻译的质量较高;基于统计的机器翻译系统具有通用性, 自动从语料库中学习语言知识。

2 机器翻译的研究成果

2.1 基于规则的机器翻译

基于规则的机器翻译方法是机器翻译领域最初提出的研究方法, 该方法认为翻译的过程是需要对源语言进行分析并对源语言意义进行表示、然后再生成等价的目标语言的过程, 该方法从70年代中期开始到80年代末在机器翻译界一直占有主导地位。

基于规则的机器翻译系统从体系结构上可以分为:直接翻译系统、转换翻译系统和基于中间语言的翻译系统。直接翻译系统是根据源语言与目标语言间的词汇单元的对应关系进行翻译, 因此这种系统带有针对性过强的弊病。转换翻译系统中, 源语言的分析独立于目标语言, 其分析一般只在句法平面上进行。转换时需要一部双语对应词典, 用目标语言单元替换源语言单元时考虑上下文。与直接翻译系统不同, 转换翻译系统的建造需要进行双语对比, 构造复杂的映射规则。基于中间语的翻译系统中源语言与目标语言不直接接触。把源语言的文本用人工设计的无歧义的中间语来表示, 再把中间语言所表达的意义用目标语言的词汇和句法结构表示出来。中间语言系统不需要转换规则, 因为中间语表达式对源语言和目标语言都是一样的。但中间语言的设计非常困难, 即使设计出来其管理也很困难[2]。

基于规则的机器翻译中的规则是语言学家编写的, 因此需要消耗大量的人力物力用于规则的开发, 研究周期长, 实验的代价比较大。虽然研究者们已经建立了含有成千上万个规则的规则库, 然而这种方法仍然具有局限性。在处理大规模真实语料的时候, 效果依然很不理想。

2.2 基于实例的机器翻译

基于实例的机器翻译的基本思想是日本著名翻译专家长尾真 (Makoto Nagao) [3]在1984年提出的。基于实例的机器翻译的基本原理是不通过深层的分析, 仅仅利用已有的经验知识, 通过类比进行翻译。随着语料库语言学的兴起, 越来越多的人对基于实例的机器翻译进行了研究[4,5]。句子相似度的衡量是基于实例机器翻译研究中最重要的一个内容。针对句子的相似度, 田生伟等[6]对维吾尔语句子的相似度进行了研究, 并得出结论:采用词形特征的粗选算法、基于散列单词倒排索引能够有效提高算法的查找速度, 快速从语料库中筛选出候选句子集合;多策略精选算法中采用基于维吾尔语词频的单词区分度算法、连续单词序列抽取算法, 可以有效衡量两个维吾尔语句子的相似程度, 能够有效地从候选句子集合中找出与输入句子最相似的句子。

2.3 基于统计的机器翻译

基于统计的机器翻译方法是20世纪90年代兴起的一种方法, 也是当前机器翻译的主要方法。这种方法自动从语料库中学习语言知识, 再利用这些知识对语言进行翻译。它不需要人工编写规则并且对所有语言都适用, 但其翻译质量依赖于语料库的大小。目前可以将统计机器翻译模型分为基于词、短语和句法的三种模型。

2.3.1 基于词的机器翻译模型

词对齐是统计机器翻译中的重要技术之一。肖桐等[7]提出了一种重对齐方法, 这种方法在IBM models获得的正反双向词对齐的基础上, 确定出正反双向对齐不一致的部分。之后, 对双向词对齐不一致的部分进行重新对齐以得到更好的对称化的词对齐结果。实验结果表明, 相比在统计机器翻译中广泛使用的基于启发信息的词对齐对称化方法, 这种重对齐方法可以使统计机器翻译系统得到更高的翻译准确率。徐春[8]等通过对各种汉维翻译模型的研究发现, 在汉维翻译中, 词对齐问题, 主语、谓语中心词和时态的一致性问题是制约其翻译性能的主要因素。董兴华[9]等对汉维统计机器翻译中的形态学处理问题进行了研究, 研究结果表明:对汉语句法结构的调整及以词干、词缀等更小的词素形式参与训练可以有效提高翻译质量。

2.3.2 基于短语的机器翻译模型

基于词的翻译模型在实用中遭遇到了词对齐噪声的影响且没有考虑句子的结构及上下文信息, 在两种语言的语序相差比较大时翻译效果不好。为了解决上述问题, 基于短语的机器翻译模型被提出[10]。Och[11]提出将对齐短语泛化为基于词类的对齐模板, 并采用线性对数模型作为整体框架。

调序模型是统计机器翻译研究的一个重点。侯宏旭等[12]通过对汉蒙机器翻译中调序模型的研究, 为基于短语的汉蒙机器翻译提出了一种基于词语语序变化分布特点的调序模型, 该模型比较简单, 模型参数很少, 但效果好于传统的模型, 比较适合于汉语和蒙古语这类语序差别较大的语言之间的翻译, 更重要的是能够有效地提高汉蒙机器翻译的性能。为解决基于短语统计机器翻译存在的调序能力不足的问题, 一些研究者尝试利用句法分析器对基于短语统计机器翻译的输入汉语句子进行句法分析, 然后利用转换器进行调序操作, 并对部分类型短语进行预先翻译, 然后再利用基于短语统计机器翻译的解码器进行翻译。

如果基于短语的统计机器翻译模型不将非连续短语的情况考虑在内, 会造成翻译结果在目标语言中的意义变化或缺失。针对这一问题, 孙越恒等[13]以非连续介词短语为例, 提出了一种短语模板抽取算法。该算法采用基于规则的方法, 抽取出中文非连续介词短语模板, 借助双语对齐语料和介词方位词翻译表, 获得模板对应的英文翻译, 最终形成的双语模板被加入短语翻译表中, 使译文更加符合语法规范。为克服传统的短语抽取方法对词对齐信息的依赖性强, 抗噪声能力差这一缺陷, 梁华参[14]提出基于词汇相似度约束的短语抽取策略。王斯日古楞[15]等在对汉语和蒙古语中的量词翻译进行研究的基础上, 提出了使用量词表进行翻译, 总结出了一对一、多对一、一对零和一对多等汉语量词到蒙语量词翻译的对应关系, 给出了各种对应中的翻译方法。这种方法能有效解决翻译中出现的量词错误, 尤其是对临时量词和一对空的量词翻译非常有效。

基于短语的机器翻译中, 传统的估计方法只考虑了双语短语同时出现, 满足对齐一致性的情况, 而没有对其他情况进行统计, 因而短语翻译概率的估计不够准确。因此一些研究者修改了传统的短语概率计算公式, 在估计概率的过程中充分地考虑短语的各种出现情况, 提高了翻译效率。

2.3.3 基于句法的机器翻译模型

基于句法的统计机器翻译模型几乎与基于单词的统计翻译模型同一时间被提出, 但是, 在2000年之后, 基于句法的统计机器翻译研究才逐渐得到人们的关注和认可。

引入句法结构有助于解决基于短语的统计机器翻译本身存在一些固有缺陷, 如短语层次上的全局重排序, 短语非连续性和泛化能力等问题。并且, 有些基于句法的统计机器翻译系统在性能上已经明显超过了基于短语的系统, 如2005年NIST机器翻译评测中的Chiang的Hiero系统, 2006年NIST机器翻译评测中的ISI的系统和中科院计算所的系统。徐春[8]等在对各种汉维翻译模型的研究中发现, 汉语和维吾尔语的句法结构差异对翻译性能也存在着影响。王斯日古楞[16]在对汉蒙统计机器翻译的研究中发现, 对于语序差异较大的汉语和蒙古语, 基于蒙古语语序的汉语句子调序方法对于系统性能的提高相当有效。

2.4 混合式机器翻译模型

近几年来, 针对各种翻译模型存在的缺陷, 研究者开始转向混合式机器翻译。宿建军等[17]根据维吾尔语形态变化丰富的特殊性, 搭建了一个基于Factored的维汉机器翻译系统, 将Factored系统和基于层次短语的Joshua翻译系统以及Moses中基于句法的翻译模型进行系统融合, 构建了混淆网络, 提高了翻译效率。杨宪泽等[18]对混合方法的模块实现以及相关的算法进行了讨论, 之后又对这种混合算法进行了改进[19]。晋耀红等[20]针对专利文本中的复杂现象, 提出了一种基于混合策略的方法, 融合语义分析技术和基于规则的翻译系统, 提高了专利翻译的效果。

3 机器翻译研究展望

机器翻译还不成熟, 需要人与系统的配合。并且, 机器翻译还存在一些问题。一方面, 存在词法、结构及语义歧义, 相同的一句话, 由于断句方式不同, 可能存在不同的语义。另一方面, 有些新的词汇无法解释。

目前, 更多的人还是热衷于统计机器翻译, 尤其是基于短语的统计翻译。近几年来, 人们开始关注混合式机器翻译。由于基于词的机器翻译、基于短语的机器翻译和基于句法的机器翻译各自存在不同的缺陷, 将各种翻译模型融合在一起, 有望解决已有翻译系统存在的不足。因此, 混合式机器翻译将成为今后机器翻译的热点。

摘要:文章讨论了机器翻译研究的历程, 总结了机器翻译的研究成果, 将机器翻译分为了基于规则的机器翻译、基于实例的机器翻译、基于统计的机器翻译和混合式机器翻译四类。并根据这四个研究方向对机器翻译研究成果进行了述评。最后指出目前机器翻译研究存在的不足, 并预测混合式机器翻译将成为机器翻译研究的热点。

机器翻译实习报告 篇2

06级 机器翻译 寇恩波

两个月的实习马上就要结束了,回学校的日子也已经定了,回首这两个月的日子真是感慨万千,此次实习真是获益匪浅,不敢说实习成果丰硕,但自己是真的成长成熟了。五月四日下午我们赶到了实习单位—河北沧州新中联特种钢管有限公司。我们可谓是舟车劳顿,人困马乏啊!公司领导很热情接待了我们。我们被安排在国际贸易部,也就是销售二部,作为销售和翻译人员进行实习,实习期八周。领导也很快为我们解决了住宿等生活问题。

五月五日我们就算正式上岗了,认识新同事,一阵寒暄之后,进入自自己的小格子间开始熟悉公司,首先我们从公司的简介开始看起,公司的简介是中英文结合的,就是每段中午介绍后面都有相应的英文翻译。不得不说公司简介上的某些地方的翻译有十分明显也十分低级的错误,考虑了一下我们并没有指出,因为这极有可能是公司在某种程度上的宣传。必须肯定的是这个翻译从整体上说还是很不错的,假若让我来做,肯定做得还没有他好呢,我也明白这正是我们要学习和提高的地方。

接下来的几天几乎整天对着这本薄薄的简介,情绪有些懈怠,感觉在浪费时间,这么看也不能再看出什么来了。此时我们部长建议我们去车间实践,去看看,因为不管是做翻译工作还是做销售工作,对所要经营的产品必须相当熟悉才行。一进车间,很惊讶,大大小小的管子很多,堆放在材料区,那边还有正在加工的管子,总算知道管子是如何由圆的变成方的了。公司主要是把圆管碾轧成方矩形钢管,是对成品钢管进行二次加工来满足客户市场的需求,其主要用途很多,比如在机械设备,结构制造,桥梁幕墙等都有广泛的使用。

车间主任和生产部长很欢迎我们。我们在车间也很新鲜,我们有时也和他们一起做质量检查,也慢慢对产品有了一定的认识和了解,对产品的材质、型号和用途也慢慢熟悉了。不过毕竟是学生,我们举手投足间都是学生气,连车间的工人都说你们一看就知道是学生了。我们自己也感觉到和他们不一样,和办公室的同事也完全不同,看问题的角度也和我们一同。我们显得很幼稚,最初我们很不适应,连部长也批评过我们。

由于经济危机的爆发,使世界经济受到巨大冲击,再加上甲型H1N1流感病毒的蔓延,也在一定程度上影响了不景气的经济,公司的国外业务也深受影响。这两个月没有一个外商来公司洽谈业务,我们很郁闷,觉得作为翻译专业的学生实习内容与翻译毫不相干,那我们不是在浪费时间吗!这样的实习有什么用啊?我们几乎有点破罐子破摔的感觉了。自己是真的想不明白,于是就和同事、同学和老师交流,也对自己对实习有了正确的认识。实习不是非要和专业对口,当然了相关是最好的了。实习是给大学生从学校走向社会的一个跳板,是给大学生从学校到社会的一个缓冲空间,毕竟学校和社会是完全不同的。尤其现在大学生太多了,一个砖头扔出去砸死十个人,其中九个找工作的大学生,一个是刚找到工作硕士生。而且现在就业形势特别严峻,很多毕业生就是毕业就失业,心理压力很大,容易出现心理问题,万一处理不好,严重后果可想而知。一个人生活不可能只接触和专业相关的问题,谁能保证自己毕业后的工作就一定与专业对口呢?还有实习换一个环境,特别是和学校完全不一样的环境,还可以锻炼自己的很多能力,生活能力,交流能力甚至是工作上发展潜力等。其中不能忽略的还有上下级和同级同事间的相处问题。而且公司的总经理也给我们开了会,会上他语重心长的批评和谆谆告诫也让自己有了醍醐灌顶的顿悟。必须要现实,要正确对待实习,你知道的越多,你就要更加努力的学习,因为你会发现你不知道的也越多!

后来实习,自己发现销售远不是自己想像的那样简单,尤其是现在互联网的大力发展,是公司业务趋于透明化,加上经济危机的爆发,使公司业务受到很大打击不管是国内还是国

外业务,要想做好销售很难啊!

由于公司是对成品钢管进行二次加工成型,有一定得特殊性,相对整个钢管生产还是有一定的竞争力,在沧州只有我们一家公司才能做这样的业务。我很佩服公司领导的独特眼光和远见卓识,能够发现市场上这个需求的空白,且能抓住时机,如今公司成立才两年多,但国内外的业务做的很多也很广,其加工的产品遍布世界各地,和欧洲、非洲等国家都有业务往来。

我们部的同事大部分都是从网上联系业务,在网上发布供求信息,寻找网络上的求购信息,联系发布人,确认产品型号、材质等,再和生产厂家联系询价,给客户报价,商榷是否能成交,若双方达成一致,在拟定合同等。这些环节看起来很简单,但真的实践起来很是能考验一个人的能力呢!

公司业务忙的时候,看他们忙得和陀螺似的,很想帮他们,可是发现我们对产品的认识只是皮毛,甚至连皮毛都不够,真的觉得不知所措!公司有一个同事是今年二月份来的,是个大学毕业生,但是这几个月来一单业务都没有谈成。想想只有两个月实习期的我们想要做出成绩来,岂不是成了蜀道行了,蜀道难,难于上青天啊!这不是不自信,我们不比别人聪明多少,别人也不比你傻多少。每每想到这就很失落,很想放弃。但是转念一想,努力去做不一定能有成果,但不努力一定没有成果!实习是为了学习学校里学不到东西,而这里所有都是学校所没有的,我们还有什么理由不努力呢!

两个月的实习也让我们发现了很多我们存在的问题:眼高手低,想当然,好高骛远,不切实际等。也充分认识到了脚踏实地的重要性,好高骛远只会一事无成,不要把不切实际看成是远大理想。我们必须要从实际出发,从基本出发,一点点积累经验,一口吃个胖子是不可能的,一蹴而就简直是痴心妄想了。要想把工作做好,做到熟练自如,游刃有余必须得付出巨大的努力,必须要有一如既往的恒心,三天打渔两天晒网的纯属浪费时间和生命!

工作不比上学,在发现工作的乐趣的同时也意识到了工作的枯燥乏味。工作就失去了一大部分自由了。像我们以前上网纯属娱乐,看看电影、玩玩游戏、下载歌曲、聊聊QQ,再觉得没意思电脑一关操场上运动去了。而工作的同事们天天对着电脑发布信息、联系业务,搁办公室一待就是就是八个小时,基本不干别的,当然公司规定也不让干别的。忽然想到少年不知愁滋味还强说愁的意境了,不正是我们以前的真实写照吗!

社会很现实,甚至太现实,而我们不够现实。我们所关心的是理想,而他们面对的是生活。不现实就没有工作,没有工作就没有饭吃,都没有饭吃谁还会空谈什么理想!也明白为什么那么多棱角分明的人工作后都被现实的社会变得圆滑世故了。这个世界不是你的,也不由着你,他不会去适应你,你若想生存,你就得努力自己改变自己去适应他。人,首先是生存,然后是生活,再然后才是理想。而我们大部分人为了生存苦苦挣扎拼命奋斗到了生活就只会享受了,早把理想抛到九霄云外了。所以正在实现自己理想的人太少了!而我们现在关心理想貌似是不太现实了一点。

这两个月实习很平静但很充实。虽然没有一次参与接待外宾,但是我们仍然学到了很多东西,虽然和专业不相关,但是所学的必有用,不管是什么,都有可能在日后给你提供帮助。这为我以后参加工作奠定了一个良好的基础,自己的心态也发生了翻天覆地的变化,戒娇戒躁,戒痴心妄想,戒好高骛远,要脚踏实地,要努力从实际出发,正确认识自己,不能妄自菲薄更不能自卖自夸。

两个月的实习虽然没有让自己脱胎换骨,但是让自己从思想和心态上都发生了很大的变化,对社会有了一定认识,对工作尤其是销售有了一定的认识,对自己也有了更深的认识,感觉自己是真的成长了,也成熟了。

机器翻译特点研究及其发展分析 篇3

关键词:机器翻译;基于规则;难点

中图分类号:TP391.2文献标识码:A文章编号:1671-864X(2015)11-0084-01

随着科技与经济的快速发展,人们对于效率的讲求日渐升高,这也在翻译领域有着体现。现代社会,我国对外交流的需求日益增大,社会方面,各个领域对于翻译需求也越来越大,翻译作为文化传播的重要手段也越来越引起了人们的重视,对于其追求和渴望也日渐增加。然而,翻译领域在经历了一个快速发展阶段之后,现有的理论方法和技术模型对于翻译整体性能的提高已开始到了瓶颈阶段。从产业角度和实用角度来看,机器翻译对于整个社会来说是绝对被需求的,对于人类的翻译事业来说呢,目前的机器翻译与预期中的效果差距仍然非常大。现有的机器翻译在理论方法和整体性能方面提升的空间呈减小趋势,对于用户的实际需求来说更是有很大的提升空间。那么,面对社会和人们的期望、面对日渐增长的需求,机器翻译之路应该如何走呢?它的特点和难点又是什么呢?本文将一一进行简要阐述。

一、翻译事业的发展

人类对机器翻译的研究已经持续了50多年。追溯到上个世纪40年代电子计算机诞生之日,计算机应用于语言翻译的探索就不曾被停止探索。在这几十年的探索过程中,先后出现了各种基于双语字典的直接翻译型、基于抽象表达式的中间语言型和基于规则的转换型翻译系统。现代社会,机器翻译领域的研究主要包括基于语言学的规则研究、基于语料库和统计方法(如KDD技术)的研究、基于记忆的方法(translation memory)研究和基于受限语言的研究等方面,这些元素显示了我国现在的翻译现状。作为世界上第5个进行机器翻译实验的国家,翻译事业从一开始就得到了我国的高度重视,早在1956年,它便以“机器翻译/自然语言的数学理论”列入了当时的《科学发展纲要》以后则列为“六五”、“七五”,以及“863”等重大科研项目,引起了一代又一代政府和人民的高度重视。在这个过程中,我国的翻译事业先后集结了多家科研院所和许多部委的研究人员,大家进行协同攻关,并与国际上享有盛名的机译研究机构进行过合作和交流,不但加强了人才的培养,积累了重要的资源,更使中国机器翻译研究的总体水平站在了世界的前列,并在不断地发展和探索中取得了一个又一个傲人的成绩。

二、基于规则的翻译方法(Rule-based Machine Translation)

从Chomsky提出转换生成文法的方法之后,基于规则的方法就一直是机器翻译研究的主流,Chomsky的观点认为,一种语言中,无限的句子可以通过有限的规则被推导出来。早期的机器翻译系统,从体系结构上来看,可以分为直译式、转换式和中间语言式,它们所存在的不同之处就在于对源语言分析的深度,它们的相同点就是都需要很大规模的双语词典、大量的源语言推导规则、语言转换规则和目标语言生成规则。同时,对源语言分析得比较深的是转换式的基于生成方法,它涉及到词汇结构分析、语法分析、语义分析三种,并完成词汇、语法、语义三层结构从源语言到目标语言的转换。相对于中间语言方法来讲,这种方法更容易获得高质量高水平的翻译结果。显而易见的是,规则的翻译机器翻译的核心问题是如何构造构造完备的或适应性较强的规则系统。但是,如果想要建立规则库的话就要花费大量的人力物力和财力,即便真的做到了这样规则的完备性却依旧不能得到充分的保证,规则库依然很难全面覆盖所有复杂的语言现象.然而,随着规则数量的不断增加,各个规则之间的冲突毕竟难以避免;用系统化的分类规则也很难。

三、难点所在

机器翻译的存在确实给我们带来了很多便利,当然,它的发展前景也足够吸引人,不得不承认的是,它的翻译质量还是不那么令人满意的,对于其讽刺性的评价也不在少数。转眼间,机器翻译已经走过了五十年的风雨艰辛,我们不难发现,它的发展还是相对迟缓。那么,机器翻译的难点究竟在何何处呢?

机器翻译最大的的难点就在于它研究的对象,因为自然语言本身存在复杂性,它的结构和文法也绝非单纯的符号堆砌,而是各种语言符号通过复杂的作用结合到一起。来源于现实世界的语言忠实地反映了客观世界和人类社会多变得复杂性,如汉语是讲究意合的语言,生动形象,不会有太多过于直白的描述。一般都通过使用虚词、词序的手段来表示。一些在汉语中有英语所没有的丰富的量词(如个、根、只、块、片等)和语气词(如吗、呢、哩、嘛、了等)。然而,作为综合和分析参半语言,英语有着多变的数、格,以及汉语中所没有的冠词、关系代词及关系副词,包含很广。同时英语中应用得非常广泛的引导词和虚词在汉语中更是没有明确对立的译文或结构。英汉语言不同的特点就使机器在分析转换这两种语言时遇到很多问题如:汉语同形歧义严重、定语从句的语序混乱、英语动词形态的生成、省略成分的确定、英语冠词的生成和英语名词单复数的确定等。这些问题严重影响了译文的可读性,特别是在处理上下文相关联的篇章时尤为突出。

四、总结,发展和展望

近几年来,机器翻译在统计方法的推动下,其发展有了很大的进步,涌现出了很多让人印象深刻的新理论和新方法。相比从前,翻译质量有了很大提高,远远超过传统方式。同时,因为可以从大规模语料库中自动获取翻译知识,不再依赖于人工撰写规则,使得机器翻译系统的开发周期得到了缩短,机器翻译的应用也得到了很大程度上的拓展,这更大大降低了机器翻译研究的门槛,以至于更多的研究者愿意投入到机器翻译研究中来,整个研究领域也充满充满了生机与活力。现在看来,统计机器翻译中用到的语言知识相对来说还是很有限的。基于词的方法和基于短语的方法几乎没有用到任何常见的语言知识,而是采用了一种词汇化的概率计算方法,使所有的语言知识直接通过对词语的概率统计表现出来。目前来看,基于句法的统计翻译方法开始逐渐成为研究的热点,特别是在基于语言学句法的翻译模型中,种种句法知识得到了充分的利用,已经开始超越单纯基于短语的方法或者基于形式化句法的方法。同时,现在还很少有人用基于语义的方法,仅有一些基于词义排歧的工作。这种种都证明,词义排歧可以使得现有的机器翻译性能略有提高。我们应该看到的是,如果不对更复杂的语言知识进行引入,机器翻译存在的问题是不可能真正得到解决的。这都有待于研究工作者进行更加深入的研究。我们更坚信,随着研究层次的不断深入,更多的语言知识将能够有效地融入到统计机器翻译之中,使得机器翻译的水平更上一个台阶。

注:基于机器翻译平台的土建类工程翻译实践训练,项目结项使用。

浅谈机器文本翻译 篇4

关键词:机器文本翻译,人工翻译,磨合共进

机器文本翻译是涉及人工智能、数学、语言学、计算语言学和语音技术等多种学科和技术的综合性课题。随着经济全球化和互联网时代的发展, 克服语言障碍, 成为国际社会共同面对的挑战, 机器文本翻译为此铺设了一条可行性道路。

我们重点回顾一下在过去的几十年当中那些杰出的科学家们在该领域所做出的重大贡献。被誉为机器翻译鼻祖的美国数学家、工程师沃伦·韦弗 (Warren Weaver) 于1947年的各类交谈和信件中多次提到机译的设想, 并于1949年7月发表了其具有广泛而深远影响的备忘录——《翻译》, 正式提出了机器翻译理念。中国开始这项研究也并不晚, 自然语言处理领域的国际著名学者苏克毅 (Keh-Yih Su) 教授曾于20世纪80年末期在沃伦·韦弗提出的机器翻译思想的基础上率先阐述了基于噪声信道模型的统计机器翻译方法, 而成为这一方法的奠基人之一。他及其所领导的Arch Tran研究小组建成中国第一个英汉机器翻译系统, 称之为“Behavior Tran”。

机器翻译研究现如今虽然进入了全面发展的黄金时代, 但仍然面临一些严峻问题, 机器翻译系统的译准率和译文可读性不尽人意。中国机器翻译软件市场采用工作原理基本是大同小异的。现在我们有必要去了解和熟悉这种新的翻译工具, 因为机器翻译的市场是巨大的, 前景也是远大的。

一、机器文本翻译热门的主要原因

20世纪90年代, 全世界已经形成了一个新的研究和发展机器文本翻译热潮。许多国家和公司近几十年持续关注和投入大量的人力和物力。这种现象产生最明显的理由如下:

1. 互联网的发展

在资讯快速膨胀、国际贸易兴盛的时代, 能快速掌握大量外文资讯, 也就相对地增加一份力量。通过互联网服务, 用户可以随时随地获取国内外各种可用的信息。虽然英语是世界通用的官方语言, 但是, 更多的是非英语的自然语言源信息。普通互联网用户不太可能掌握多种外语, 快速处理大量的外文资料, 已是一种普遍的需求。在这种需求带动之下, 用机器翻译系统来协助人们快速翻译、建档, 也就成为无法避免的趋势。

2. 国际业务的需求

随着经济全球化的出现和发展, 跨国企业之间的合作和交流日益成为日益紧密。各种技术文件, 产品说明书, 国际组织和政府发布的文件和政策, 都需要被翻译成目标国的官方语言。机器文本翻译具有省时省力, 效率高, 保持原格式翻译等优势, 因此受到许多有国际业务往来的企业的欢迎。

3. 电子商务的需求

电子商务是从事商业活动的一种新型的商业运营模式。通常包括消费者的网上购物、商户之间的网上交易和在线电子支付以及各种商务活动、交易活动、金融活动和相关的综合服务活动。电子商务急需突破的瓶颈是语言障碍。除了大量的笔译和口译从业人数的增加, 人们非常期待机器翻译可以解决这一难题, 人们期望在未来可以突破时间和空间的限制, 高效地追踪和规范实时业务流程。

机器翻译即使不能作到全自动、高品质翻译的境界, 只要能应用得当, 仍可扮演强而有力的辅助性角色, 协助人们在省时省力的情况下, 获得与人工翻译相当的品质。至于机器翻译与人工翻译之间的差距, 可透过专业的译后修缮人员, 将其差距弥补到与人工翻译相同的品质。如此一来, 在机器翻译系统的辅助之下, 传统的翻译工作可减缩到只剩审校译稿的工作, 翻译的速度自然大幅提高, 而翻译的成本也可望降低。使客户能以较短的时间, 获得与人工翻译品质相当的译稿, 在与时间竞争的资讯社会中, 赢得先机。

二、机器文本翻译以及人工翻译的优缺点

机器翻译是由计算机程序设计, 模拟人类智能的语言和概念的翻译。其方法之一就是基于句法结构的翻译, 分析句法结构, 把自然语言中的句子划分为几个部分, 然后通过另一语言替代相应的词和短语。翻译软件需包含一些必要的相应语义参数来避免歧义。例如, 在"I'm a student"这个句子可以分成三部分:I、am、a student。这三个部分可以相对应地用别的语言翻译出来。另一个方法是基于实例模式翻译。例如, "How do you do"这个句子, 如果我们运用句法分析的方法来翻译就不太适合。因此, 基于实例模式的翻译方法可以通过匹配收集的例子库来辅助和简化翻译过程。

一些特定的行业翻译过程中我们发现某些常见问题: (1) 许多短语、句子和段落或多或少是类似的; (2) 很多句型是彼此相似的; (3) 大量的精力和时间都被花在查字典、写作、打字和编辑这些过程。如果计算机拥有特定的记忆机制, 收集和存储相同或相似的句子, 它将可以节省大量的资源。一旦这些句子再次出现, 记忆机制将分析和对比这些句子, 然后在几秒钟内通过搜索内存数据库给出参考。翻译记忆 (Translation Memory) 将在很大程度上减少重复劳动, 节省大量的时间, 提高翻译、校对和编辑的速度。这在翻译一些产品的说明书方面特别地高效。因为同类产品的专业术语和基本功能大体上是相同的, 如果产品需要升级, 那些曾经被翻译过的操作指南甚至可以直接使用。例如, "除冰/防冰‘禁止喷涂’区域"译为"de/anti-icing'no spray'areas"等等。当这些句子或者词组再次出现时, 机器文本翻译系统可以根据预先设定的匹配率自动挑出译本。它也会用不同的颜色标记两者之间的不同之处, 这有利于译者快速找到需要重新翻译润色的部分。

然而, 机器文本翻译之所以难以达到高水准的翻译水平存在以下这些制约因素: (1) 源文进行句子分析时, 语法结构和语义结构存在歧义; (2) 多义词在不同语境中存在译词选择问题; (3) 译文生成时存在介词、助词的多义选择问题; (4) 译文生成时还存在性、数、格一致性问题、时态、语态、语气、尊称选择问题和符合母语语言习惯、语序选择问题; (5) 代词指代问题、相关词照应问题、省略成分复原问题, 等等。而且在维护和提高整体系统方面需要投入大量的人力和资金。虽然机器文本翻译的大体内容可以被人们理解, 但句法结构和措词的翻译是不太符合自然语言的用法习惯。机器文本翻译与人工翻译存在共通之处, 但也存在差异, 毕竟它只是仿造人工智能创造出来的机制项目, 难以真正超越人类智慧。随着机器翻译技术的提高, 也许在未来机器翻译也能达到“信、达、雅”的程度。

纵观机器翻译的特征, 它主要有以下的优点和缺陷: (1) 高速度和低成本的翻译; (2) 应用广泛, 不同行业都可以采用相应的专业翻译; (3) 机器翻译受限于源语言的语法结构, 相对地对语境的关注度低; (4) 机器翻译的过程是机械的和僵硬的, 套用一句俗语也就成了"Jack of all trades, master of none" (门门精通, 样样稀松。) .同样, 人工翻译的优缺点如下: (1) 译文能够摆脱源语言句法结构的束缚, 译者可以更多考虑语境问题; (2) 翻译是一个动态的再创造过程, 这只能通过译者来完成; (3) 没有全才的译者, 只有专业的译者; (4) 人工翻译速度相对较慢而成本较高。

三、机器文本翻译和人工翻译的合作和共同发展

国际间的交流迫切需要人们能够早点克服语言障碍。然而机器文本翻译发展历史还不够悠久, 理论不够成熟, 实验和实践还需要进一步的创新和完善。它需要人们进一步认识和研究, 付出更大的努力来促进这个技术的广泛的应用。

基于前述各项机器翻译的特性和优缺点, 一般而言, 机器翻译较适合应用于以下方面。首先, 对于翻译服务文稿数量庞大, 必需靠大量的人手才能完成。一些大型进出口项目的文件通常重达数百斤。如果这些文件只是由译者来完成的话, 我们可以想象其工作量的繁重。其次, 文稿时效性强, 必需在短时间内完成, 或需正确预估翻译时程。再次, 文稿用语之一致性要求严格。对于专业术语要求较严格的文件, 如技术命令、使用手册等, 机器翻译系统可以提供较好的解答。最后, 文稿机密性高, 经手人员越少越好。利用机器翻译系统, 则可以降低机密外泄的可能性, 确保资料安全。以今日的机器翻译技术而言, 正确使用机器翻译的确可以达到预期经济效益。在机器翻译系统的辅助之下, 整个翻译流程只剩下译后修缮及审稿的工作, 使得整体速度比人工翻译快, 成本也较低。

纵观社会发展概况, 一方面, 人们因对外交流和联系日益扩大和紧密而对机器文本翻译的需求越来越迫切;另一方面, 由于传统的外文教学 (特别是翻译教学) 并未囊括系统详细的机器文本翻译的课程, 很多有志于从事翻译的学生未能及时了解掌握这一技能, 以至他们走上岗位时需花较长时间来学习和熟悉这方面的知识和操作步骤, 浪费了大量宝贵的精力。随着计算机和互联网的迅速发展, 新的SOHO一族阵容愈加强大, 身兼数职已不再是稀有现象, 在家办公的翻译人员 (或是和外语打交道的相关人士) 必须具备相应的硬件软件设备方能更好地在众多自由工作者中拔得头筹。翻译领域的竞争一直都很激烈, 现在更有越演越烈的趋势。这种竞争不仅存在于人机之间, 更存在于是否会合理运用机器翻译。竞争的焦点并不是谁在使用机器翻译, 而是谁能够更好地运用这一技术来节省时间, 提高工作效率。

经由本文粗略的介绍, 我们能对这一新技术有一个总体思路。随着信息交换和共享速度的持续飙升, 这种人机交互技术的模式肯定会迎来新的发展阶段。未来我们要在翻译部门、机构、组织和学校, 通过举办培训, 拥有更多的机会去创造、测试和更新不同版本的机器翻译软件。还应该有更多的国内外会议将相关专家聚集在一起, 交流讨论机器翻译的问题。对于那些与外语接触的个人而言, 他们应该与时俱进, 采取机器翻译软件作为学习工具。在编辑处理机器翻译的译文的过程中, 他们也将获益匪浅。

参考文献

[1]Chung Ling Shih.2002.Materials Development and Task Design for an MT Course[J].Studies of Translation and Interpretation.Vol.7.2002.Taiwan:Translation Association of Taiwan.

[2]Dollerup, Cay.2007.Basics of Translation Studies[M].Shanghai:Shanghai Foreign Language Education Press.

[3]Gentzler, Edwin.2007.Contemporary Translation Theories Revised Second Edition[M].Shanghai:Shanghai Foreign Language Education Press.

[4]Schuttleworth, Mark&Cowie, Moira.2004.Dictionary of Translation Studies[M].Shanghai:Shanghai Foreign Language Education Press.

[5]冯志伟.机器翻译研究——翻译理论与实务丛书[M].北京:中国对外翻译出版公司, 2007.

[6]鲁孝贤.机器翻译语义排歧方法[J].中国科技翻译, 2007 (4) .

[7]杨沐昀, 李志升, 于浩.机器翻译系统[M].哈尔滨:哈尔滨工业大学出版社, 2000.

屋顶清扫机器人外文翻译 篇5

这个主要符合条件的项目有很大的潜力在WPI的项目上。因此本节是面向未来MQP团队对于机器人和升降器的设计改进。

设计动力传动系统和控制系统: 当前动力传动系统和控制系统受限于其组件。重新设计动力传动系统和控制系统将提供更高效的能源消耗,更好的处理,更简单的计算机代码。

替换窗户马达使得可以改善电力消耗和处理: 驱动机器人的窗户马达不是最优的,因为它们运行太快,有大量的反弹。马达运行非常接近最低速度,导致可怜的功率效率。这个反应限制控制回路的响应时间,导致很难避免控制回路震荡。

用正交编码器替换当前光学编码器来简化代码:

机器人上的光学编码器是无方向性的,这意味着它们只能告诉车轮的速率,而不是速度。一个正交编码器可以感觉速率和速度,并且将大大减少计算机代码的复杂性。

移动光学编码器接近轮系的运动来改善处理:

目前光学编码器安装在车轮的边缘附近,底盘的外侧,暴露在外和未受保护的。此外,机器人能够非常精确控制车轮速度是非常重要的,特别是在低速。如果编码器安装在发动机前面,通过蜗轮减速,它将提高编码器的分辨率,从而缩短响应时间的控制回路和改善处理。

取代Vex和维克多速度控制器来提高处理和简化代码: 脉冲宽度调制(PWM)信号发送到维克多速度控制器的过程包含在发送到电动机的信号在两个方向和工作周期的模拟信息。为了避免与输入信号从发送到接收过程的交叉问题,维克多有死区。这个死区减少处理低速性能的能力,并且引进了令人难以置信的用于寻找计算机程序工作空间的复杂问题。所有信号由Vex发出的速度模拟PWM控制器都有相同的问题。唯一的解决办法就是用另一处理器和速度控制器之间有更紧密的集成的微控制器更换Ve,以此避免这个问题。

将Vex单片机替换为更强大的东西: 这个项目的初衷是使用qwerkbot单片机控制机器人。后几个月我们试图调试它以适应我们的使用,我们坚决认为使用从我们早期的原型中得来的Vex单片机将更有效率,尽管其局限性。Vex,它能够支持我们所有的信号处理,但是它的控制有很大的局限性,它不能记录或传输任何数据操作符。因为屋顶机器人的目的是检查屋顶,所以很有必要纳入一个更先进的控制器,如qwerkbot,到屋顶的下一代机器人读取和传输传感器数据。

用高分辨率设备取代X10相机: qwerkbot控制器的优点之一是它支持传输网络摄像头信息到笔记本电脑。网络摄像头现在能够提供在一个像素的分辨率的提要与视频。当我们决定不使用qwerkbot控制器必须提供另一个带有独立的发射器的相机。提供视频反馈的最简单的方式是通过合并一个X10无线家庭安全摄像头进入设计中。X10是整套的发射机和电池组。不幸的是这个相机的分辨率不是很清晰——一个好的相机应该具备的。

有单独的导航和检查摄像机: 现在的相机,由于它现在的位置在机器人的桅杆上,不适合近距离视觉检查。我们建议保持相机有导航的目的,可以看到机器人领域的视图和有一个更好的视野环境,但出于对目视检查的目的,我们建议有一个专门的相机在机器人的前面。相机将会以一种更理想的位置观察屋顶,可以发回目标区域的高分辨率照片。

将X10相机发射机换成一个更强大的发射机: 从X10到笔记本电脑的视频传播是通过广播频道。X10的提供天线是定向天线。信号在发送机没有面向接收器的情况下变得模糊或者信号不存在。X10已经被其他人修改使用全向天线;然而我们没有时间把这个装置合并到屋顶机器人中。因此我们推荐更合适的发射机被发现,或者用更合适的机器取代现有的相机。

添加额外的自主研发的传感器,以防止操作员诱导翻: 目前,机器人没有特性来防止操作员诱导进入一个不稳定的地点,导致机器人可能滑到。额外的传感器,如一个加速度计,可用于检测这种情况。其他情况下可能诱导机器人车轮卡住,导致机器人主卡轮和翻转机器人。为了防止这种情况,我们建议额外的传感器来检测什么时候车轮与地面不紧靠在一起。

重新评估电池需求和改变单个电池功能: 目前电池组的能量以12伏特提供机器人运行。有三种电池组连接并联以全功率为我们指定的半小时的操作提供电力。这些电池不是通过一个电缆连接。当前设置要求每个电池组单独充电,直到充满了。重新布线终端将简化这个过程。此外Vex控制器需要在九伏特电池下运行。这有自己的单独的电池组。X10相机还使用自己的24V电池组。通过一些相对简单的电路这三个系统:传动系、控制器和摄像头可以由同一个电池组驱动。这也简化了程序打开机器人的过程,这个过程目前需要通过三个独立的开关才能打开所有的系统。

改善联合组件的耐久性: 联合组件有两个观察失效模式需要纠正。第一个是连接转轴一和绞盘的焊接条。在大的转矩负载下轴会断裂,这将导致机器人失去旋转的能力。此外连接杆A和杆B的螺旋也会突然断裂。这是由于联合A和B之间的公差过于宽松。这造成的差距意味着所有与机器人的重量相关的力会直接作用在这个195毫米的螺栓上。如果这个螺栓断裂则这个联合组件会掉下来,导致机器人分成两部分。为了修复这个轴A和B,应该制造一块合在一起的装置,这样就可以完全消除了螺栓。

进一步研究车轮的摩擦材料: 虽然机器人与屋顶保持静态摩擦稳定在指定的45°角,但如果它滑动了就没有一个令人满意的阻止滑动的安全系数。尽管我们在对材料的测试中我们没能找到任何比摩擦系数比三元乙丙橡胶泡沫更优的材料。为了防止滑动我们应用了电子牵引力控制系统,这提高了牵引能力,但它不是十分安全的。还应该进一步测试倾斜的和潮湿的屋顶板瓦,看看这些条件下的摩擦性能。建议的解决方案之一就是开发一个有效的摩擦材料,在这样的屋顶表面壁虎的脚趾能够抓住一个垂直的墙。

翻译机器 篇6

“近年来,语言服务业保持着高速增长,全球化、产业化和信息化的趋势愈发凸显,中国市场经济的发展壮大也为中国语言服务业的发展提供了难得的机遇。”商务部服贸司副巡视员王惠英称。

据统计,截止2013年底,全国在营语言服务及相关企业达到5.6万家左右,2015年,产值超过2600亿元人民币,年均增速15%。未来一段时间,中国将推进新一轮高水平对外开放、“一带一路”愿景、“互联网+”和创新驱动发展战略的实施,这些将为中国语言服务业注入新活力。

语言服务业需求快速增长

4月份,由对外经济贸易大学英语学院和国际语言服务与管理研究所发布的《中国企业“走出去”语言服务蓝皮书》( 简称《蓝皮书》)指出,全球语言服务市场为高度分散的垄断竞争市场。全球语言服务企业数量大,单个企业影响力小,富有竞争色彩。2015年全球语言服务市场规模为381.6亿美元,其中全球百强语言服务企业(108家企业)营业收入总计47.34亿美元,占12.41%。全球语言服务受经济贸易影响大,经济贸易往来、出入境旅游、移民潮、网上购物主要集中在经济发达和经济发展快速的地区,导致这些地区的语言服务需求量很大,直接表现为地区分布不均衡。

尤其是近两年“一带一路”愿景从提出到形成共识,越来越多的国家在开展“一带一路”经贸互通合作,其中语言服务的市场需求十分巨大。

在“一带一路”沿线国家的投资中,行业领域大多采用东道国的本国语言,因此对东道国语言的掌握和提供相关语言服务尤为重要,很多中国企业在“走出去”时没办法与东道国进行面对面交流。

语言服务业是中国文化“走出去”的助推器和润滑剂。优质的语言服务业不仅能提高文化服务和产品的附加值,还能有效规避跨文化融合过程中的风险,从而有力地带动出版物、影视艺术作品、文化信息传输服务和文化创意设计等出口,有利于中华文化的对外传播和国家文化软实力的提升。

王惠英认为,大力发展语言服务业势在必行。

“近年来,中国文化贸易和文化领域对外直接投资增长迅速。这与中国语言服务业的发展密不可分。同时,也为语言服务业取得新的增长创造了机遇。”王惠英表示。

王慧英表示,语言服务业为高科技产业技术研发提供平台。近年来,以云存储、语音识别、人工智能辅助翻译为代表的高科技信息技术不断应用于语言服务业,正逐步走向市场化,并取得大规模的商业效益。语言大数据的集成为语言服务业的发展提供了广阔的发展前景,而语言服务业市场需求的不断增加又为新兴产业技术的研发提供了广阔平台。

多家巨头为“走出去”配备机器翻译

当前全球有80%的非中文网页,中国网民规模达到6.88亿,手机网民规模达到6.2亿。出境游人数1.2亿,排名前20的出境游目的地有12种语言。有了将近7亿的网民基数,中国的语言服务业正在成为需求量庞大的产业。

众多的语言服务业在“一带一路”倡议和“互联网+”的大背景下,积极的调整企业发展战略,不断更新迭代语言服务的产品,为语言服务行业带来新气象。

“不论哪种语言,机器翻译的质量都是低于人工翻译的。但是,机器翻译在很多场景下是更便利的,大多数时候,用户更多会选择机器翻译。”微软翻译总经理Chris Wendt认为,在浏览网络信息时经常会看到外文消息,并不是每个人都具备这样的专业能力。即使高等教育非常普及,但大部分人也仅仅是对英语比较熟悉。如果看到俄语、法语等其他语种的网页,需要快速获得信息,人工翻译可能没办法满足需求,自动翻译却可以快速提供答案。

在企业国际化方面,外贸网站的信息会不断更新,人工翻译耗时长、成本高,这给中小企业带来很高的成本。引入机器翻译,就可以快速提供信息。

近二十年以来,华为公司一直都有自己的翻译团队,每年最大的工作就是培养翻译人才。1996年,华为第一次在俄语区拿到业务。现在华为的业务已经扩展到全球170多个国家,并建立了1500多个运营商网络。

“华为建立的语言技术平台系统,包含了机器翻译。四年来,累计翻译了30亿字。哪里的语言服务强,我们在那个地方的市场就会强。”中国翻译协会副会长、华为技术有限公司翻译中心主任陈圣权称。

阿里巴巴的国际化从一开始就离不开对语言服务的重视。阿里把商品卖到全球,少不了三个基础设施,一是物流,二是支付,三是信息,而翻译就是信息流中的基础设施。

阿里巴巴语言服务平台技术负责人骆卫华介绍,机器翻译在阿里巴巴已经有实际应用场景,而且应用范围很广。在阿里巴巴平台上做生意的商家在不断进行商业模式的创新和尝试,这些尝试都是需要成本的。而对于需要使用翻译服务的商家来说,目前机器翻译是成本最低的方案之一。

“从阿里的角度来说,我们为用户提供最基础、成本最低的解决方案,是建设这个平台的初衷。对阿里平台以及阿里平台用户走向国际化,机器翻译是不可或缺的一个工具。”骆卫华称。

另一巨头,百度近年来加强了在人工智能领域的投入,通过技术和理论的创新,实现了大规模的产业化。除了为企业服务,百度还通过翻译APP为更多的个人提供帮助。

“大家在出国旅游时遇到语言问题,需要点餐或是乘坐交通工具,翻译软件是非常有用的。”百度翻译负责人蓝翔表示。

中国语言服务企业应有针对性制订“出海”战略

“让全世界的消费者喜欢中国制造,是翻译公司、翻译团队义不容辞的工作,翻译人员有责任和义务告诉这些企业怎么让世界爱上‘中国造。”中国国际商会合作发展部部长韩梅青表示,中国语言服务业潜力巨大、前景广阔,中国未来的发展离不开高质量的语言服务。

《蓝皮书》项目负责人、对外经济贸易大学英语学院院长王立非表示,“一带一路”战略的实施加速了我国企业“走出去”。伴随着“走出去”的语言服务需求不断增加,如何了解中国企业“走出去”语言服务需求,如何从语言角度服务中国企业“走出去”,如何帮助中国语言服务企业更好地“走出去”,如何设定中国“走出去”的终极目标,针对这些问题进行研究迫在眉睫。

针对全球语言服务市场高度分散的特征,为让中国语言服务企业更好“走出去”,《蓝皮书》提出如下建议:第一,对于非洲、拉美、大洋洲等语言服务欠发达地区,采用劳务派遣方式“跟船出海”,随客户一起前往目的国;第二,对于亚洲、欧洲、北美等中等发达或发达语言服务地区,通过语言服务外包方式“借船出海”,同时也考虑承接发达国家语言服务外包业务,扩大国内语言服务企业规模与利润;第三,由于欧美等国主导语言服务行业,建议中国语言服务企业“买船出海”,在目的国设立或并购当地语言服务企业,近距离接触国际大客户与国际语言服务巨头,承接境外优质业务;第四,“语言服务+”能够助力中国语言服务企业“提前出海”,构建细分领域竞争优势,通过增加融资或采取并购策略来提升行业地位,成为更为强劲的竞争者。

浅谈高职翻译教学中的机器翻译 篇7

机器翻译是利用翻译软件把文本内容从一种自然语言转换成另一种自然语言的过程。机器翻译是克服信息时代语言障碍的不可缺少的手段。它在现代信息社会中的巨大作用也越来越明显。随着计算机的不断升级换代, 机器翻译的文字处理能力也随之增强。在一些发达地区, 机器翻译分担了很大一部分以前由翻译工作者承担的日常工作。机器翻译目前的应用范围越来越广, 比如一些分门别类的专业、学科、各种说明书、使用手册等。因此, 在高职翻译教学中, 机器翻译也是不可忽视的一课。

2. 机器翻译的优缺点

机器翻译 (以下简称机译) 的争议历来存在, 且一直很大。机器翻译的优点在于它快捷方便, 请看下面两个例子:

1) 请把糖递给我。

机译:Please pass me the sugar.

2) The family has five members.

机译:家庭有五个成员。

机器翻译存在着诸多问题和弊端, 如译文生硬、机器味过浓, 影响译文的可读性和准确性等, 请看下面两个例子:

’ties and I don’t think that should stop just becauseyou have reached a certain age.

机译:时尚是人的个性表达, 我不认为应该停止, 因为你已经到了某个年龄。 (金山快译2000)

分析:显然, 机器还是没能识别是一个词, 机器把两个词分开翻译了。而just because是一个词组, 意为“正因为, 仅仅因为”。因此该句较为准确的译法是“时尚代表着人的个性, 我认为人不能仅仅因为年龄渐长就放弃对时尚的追求。”

2) Amy: Auntie kissed me.

Mother: How nice! Did you kiss her back, dear?

机译:艾米:阿姨吻我。

母亲:太好了!你吻她的后面的, 亲爱的人? (雅信CAT2100)

分析:单从字面意义看, kiss her back可以理解为“回亲她”, 也可以理解为“亲她的背”。

从上面的例子可以看出, 机器翻译是有缺陷的。不过它虽然不是十全十美, 但它使外语专业以外的人能够粗略了解相关文本内容。当然, 要让机器像人脑一样处理语言绝非易事, 但我们可以很好地利用机器翻译。根据所学的语言知识及翻译技巧, 将机器翻译与人工翻译有机地结合起来应该是目前最好的翻译方法。

3. 翻译教学中的机器翻译

随着机器翻译的发展, 加之翻译人才缺口, 开展机器翻译教学, 使翻译人员了解并运用相关的机器翻译软件, 提高翻译的效率, 成为当务之急。对于高职学生来说, 机器翻译的学习尤为重要。

3.1 机器翻译的理论教学

机器翻译教学应简单介绍机器翻译的基本理论, 如机器翻译的定义、机器翻译简史、国内外机器翻译的发展、机器翻译过程。教学重点介绍机器翻译的软件及词典种类, 让学生了解并利用。

网络词典 :爱词 () 、词海 (http://www.dict.cn/) 、雅虎乐译 (http://zidian.cn.yahoo.com/) 、百度词典搜索 (http://dict.baidu.com/) 等

2) 芯片词典:快译通、好易通、商务通、名人、锦囊、佳能等

3) Google在线翻译 (http://www.google.cn/lan-guage_tools) 、百度在线 翻译 (http://site.baidu.com/list/104fy.htm) 、爱词霸在线翻译 (http://fy.iciba.com/) 、自由翻译网 (http://www.freetranslation.com/) 、以及外语时空 (http://www.langsky.com/trans/) 等

3.2 机器翻译的实践操练

在翻译课程中介绍完各类软件极其安装使用方法后, 实践操练是关键。在翻译实践中能够灵活地运用它们进行查词, 提高翻译质量和效率, 是机器翻译教学的最终目的。当然, 机器翻译的局限性显而易见, 还应与人脑有机结合。人机交互的机器翻译也是贯穿整个翻译教学的核心目标。例如:

1) I wonder whether he is a Trojan Horse.

机译:我对他是特洛伊木马感到不可思议。

人译:1) 我不知道他是否是个内奸。2) 我不知道他是否是匹特洛伊木马 (希腊兵藏在木马腹中进入特洛伊城, 最后取得战争的胜利。此典故被用来告诫人们, 谨防打入内部的敌人) 。

分析:机器倒是把Trojan Horse直译出来了, 只是没对其文化内涵作任何说明。而且, 机器对whether引导的从句也无法分辨。加之文化常识, 便可以改译得当。

2) It is no good hoping to read all these books.

机译:它没有希望读完这些书。

人译:期待看完所有这些书也没什么用。

分析:机译有部分的意思正确, It is no good do-ing sth.是习语, 意为“做什么事是没用的”。两者结合, 变成了完美的翻译。

3) We have also admired your exceptional intel-lectual qualities, your experience and your kindness.

机译:我们还羡慕你的特殊知识的品质, 你的经验和你的好意。

人译:您才智过人、阅历丰富、宅心仁厚, 我们很是钦佩。

分析:机译翻出了大致意思, 根据人脑加工, 我们可以翻得更好。

4) 您女朋友很漂亮。哪里哪里。

机译 :Your girlfriend is very beautiful. Wherewhere.

人译:Your girlfriend is pretty. Thank you.

分析:显然机器翻译还缺乏文化转换。中国人喜欢说“哪里哪里”, 表示客气谦虚。而英美国家对赞美接受后表示感谢。因此我们还应做适当文化转换。

4. 结语

机器翻译是时代发展的产物。随着国内外机器翻译的发展, 现在的机器翻译越加是翻译工作中必不可少的。因此, 我们应积极开展机器翻译教学, 认真开展这一方面的研究, 使高职学生能够善于利用机器翻译软件进行翻译, 为日后工作带来便利。

参考文献

冯梅, 刘荣强.2000.英汉科技翻译[M].哈尔滨:哈尔滨工业大学出版社.

张政.2004.机器翻译刍议[J].中国科技翻译.

毛颢.2004.若干实用机器翻译软件与网站评介[J].中国科技翻译.

机器翻译探讨与研究 篇8

机器翻译(MT)是计算机科学与人工智能领域中的一个重要方向,是利用计算机把一种自然语言转换成另一种自然语言的过程[1]。在机器翻译的研究过程中,不仅涉及到人类对语言认知方式的研究,还涉及到对计算机科学、数学、信息论、知识工程、语言学等多门学科进展的关注及其知识在机器翻译中的应用[2]。机器翻译的核心是语言分析技术,即一种将句子变换成由词语及其抽象形式构成的、并用某种数据结构表示成内部形式的技术。

1 机器翻译面临问题分析

1.1 MT的机械性

计算机系统是硬件子系统与软件子系统的组合体,其运行过程由预先设定好的程序指令来控制。在翻译的过程当中,计算机系统并没有像人类大脑那样灵活的思维能力,也不具备自主的判断和推理能力。翻译的方法是进行直接的词汇转换-语法转换-语义转换,最后得到目标语言的过程。而人工翻译的过程比较复杂,译者需根据自己的知识、文化、地理、历史、风俗习惯等进行词汇重组,同时又掺杂着对语句的雕琢修饰以及丰富感情色彩的渗透和作用。资料显示,机器翻译在一些简单的翻译任务中收到了一定的效果,比如网页浏览,而要达到任意文本的高质量全自动翻译,目前还很难实现。

1.2 复杂的自然语言

自然语言是人类特有的用于交流的方式和手段,是人类区别于其他动物的重要标志。世界上大部分民族都有其独特的民族语言,理解语言不仅依赖语言学方面的知识,还需要与话题相关的背景知识。必须对这两种知识进行较好的应用和组合,才能建立起高效、智能的自然语言理解程序。作为自然语言理解技术的重要应用,机器翻译旨在使用计算机自动将源语言表示的语句转变为目标语言表示的语句。

自然语言的形式与其意义之间通常呈现为一种多对多的对应关系。因而从计算机处理的角度看,就必须消除歧义,即将具有潜在歧义的自然语言通过输入计算机而转换成某种不具歧义的计算机内部表示形式。

歧义(Ambiguity),即同一语言形式可能具有不同的意义,这是自然语言中普遍存在的现象,也是自然语言与人工语言的主要区别之一[3]。歧义现象的广泛存在使得消除歧义就需要运用大量的知识和推理,这就给基于语言学的方法、基于知识的方法带来了巨大的困难,因而虽然几十年来,以这些方法为主流的自然语言处理研究在理论和方法方面取得了一定的成就,但在能处理大规模真实文本的自然语言处理系统的研制方面,成果却并不显著。因此,消除歧义业已成为机器翻译中需要重点解决的主要问题之一。

1.3 机器自身的局限性

为了完成一项任务,计算机必须受到指挥与控制。即使最复杂的计算机,都必须接受指令才能工作。计算机与人类不同的地方是,人们可能因灵感、直觉而自发地找到一个问题的答案,并不需要进行很多详细的计算过程,但是计算机却只能按照已输入的程序机械地运行。因此在机器翻译的过程中,就难免会出现漏译、错译或直译等情况,其翻译结果将完全反映不出自然语言的魅力所在。

2 机器翻译方法

自然语言的机器翻译一般以句子为基本的翻译单位,而句子又可分为句、短语和词三个层次。自然语言分析阶段一般包括分词法分析、句法分析、语义分析、语境分析、语用分析等几部分,其中以词法分析和句法分析为主。下面,首先阐释了目前现有的几种机器翻译方法,然后则重点分析基于实例的机器翻译。

2.1 基于分析和转换的机器翻译方法

基于分析和转换的机器翻译方法就是自动实现源语言到目标语言的转换,通过采取一系列的分析和转换的生成层次,使得一个源语言句子经过不同的中间表达形式,最终达到目标语言句子。其目的是最大限度地加深对源语言的理解,生成最为恰当的目标语言形式。这种方法比较全面地体现了语言学知识在机器翻译中的应用,是了解机器翻译实现过程的非常合适的模式。对于标准的机器翻译系统而言,句子和短语层次的结构转换是翻译转换部分的研究重点。这方面一般采用产生式的转换规则形式[4]:

S是SL(源语言)的某个待翻译单位(句子、短语等等),S1~Si是S中的下一级组成单位,对于S,如果满足条件,则TL(目标语言)中有T1~Tj译文构成了相应的等价物T。

这种方法有两个特点:一是面向源语言分析,因为源语言中的句子已经由句法、语义分析等阶段分析完毕,生成了关于源语言句子的某种中间表示,转换就以这种源语言的中间表示作为输入;二是直接转换,T1~Tj可以直接包括目标语言的词汇,也可以是对应于S1~Si的译文组块。

2.2 基于中间语言的翻译方法

基于中间语言的翻译方法是利用一种中间语言(interlingua)作为翻译中介的表示形式,整个翻译的过程分为“分析”和“生成”两个阶段。分析阶段的任务是把源语言转化为中间语言,然后在生成阶段再将中间语言转化为目标语言。分析过程只与源语言有关,与目标语言无关,而生成过程却与之相反,只与目标语言有关,而与源语言无关。这种方法的优点在于,进行多语种翻译时,只需要对每种语言各自开发一个分析模块和一个生成模块,而不需要在每两种语言之间都开发一个转换模块。

对于多语种的机器翻译来说,使用中间语言作为翻译的中介是可取的。在理想状态下,中间语言应该没有或极少有歧义,且结构严谨,词汇单义,便于计算机处理。

2.3 统计机器翻译方法

统计机器翻译也就是基于语料库的机器翻译方法,不需要人工撰写规则,而是从语料库中获取翻译知识。具体来说,就是将某个原始句子按词拆开,然后全部单词存储;翻译就是将词语取出,按概率统计的方法重组句子,组合后的句子就是统计方法的翻译结果。

统计机器翻译方法的翻译机制需要建立统计模型,把翻译理解为搜索问题,即从所有可能的译文中搜索、选择概率最大的翻译结果作为译文。该方法与基于实例的翻译方法的区别在于,基于实例的机器翻译中,语言知识表现为实例本身;而统计机器翻译中,翻译知识则表现为模型参数。

2.4 基于实例的机器翻译方法

在基于实例的机器翻译系统中,系统的主要知识源是双语对照的翻译实例库,每输入一个源语言句子时,系统把这个句子同实例库中的源语言句子逐字段进行比较,找出与输入句最为相似的句子,并模拟与这个句子相对应的译文,最后输出译文。

基于实例的机器翻译系统中,翻译知识以实例和义类词典的形式来表示,易于增加或删除,系统的维护简单易行。如果利用了较大规模的翻译实例库并进行精确的对比,还有可能产生高质量译文,而且避过了基于规则的传统机器翻译方法必须进行深层语言学分析的难点,在翻译策略上是具有相当吸引力的。这种机器翻译方法直接使用语料库对齐来作为知识表示形式,虽然知识库的扩充非常简单,但是因而造成系统需要的实用语料库的规模将会极大。

3 机器翻译实例分析

目前,许多翻译引擎所采用的翻译方式如图1所示。这种模型机制是将语言学专家已经制定的翻译规则和词典的译文输入、存储在翻译系统之后,按照系统预制的运转规则对原文进行相应处理,并输出翻译结果给用户。

目前比较流行的在线翻译系统有Google、有道、爱词霸等。下面通过几个例子来比较、分析Google在线翻译系统和有道在线翻译系统的异同和优劣。

例1:

原文:喜马拉雅山之所以被称为世界屋脊,是因为它的最高部分(主脊带)的平均海拔在6 000米以上,群峰争艳。地球上大部分7 000米以上的高峰都云集于此。

(1)Google译文:Himalayas is known as the roof ofthe world,because it is the highest part of the(main ridge of the band),the average elevation of 6,000 meters above the peaks of blooming.Most of the Earth to the peak 7,000 meters above the set here.

(2)有道译文:The Himalayas are called the roof ofthe world,because of its highest part(the Lord with an average elevation of the ridge)in the 6000 meters and above,the mountain peaks bloom.Most of the earth is7000 meters above the peak to set in the this.

分析:由以上两个系统的译文可以看出,对于一些专有名词,如“世界屋脊”,现有机器翻译系统都能进行很好的翻译,对于每一个句子也基本能够达到翻译的要求。但是从整体来看,句子缺乏必要的润色以及句与句之间的贯通,这种翻译方法产生的结果是直译,而非意译。

例2:

原文:语言学起来很费事。

(1)Google译文:Linguistics it is very cumbersome.

(2)有道译文:Linguistics up very trouble.

分析:原文的意思是“学习一种语言是很麻烦的一件事”,然而这两种系统都把“语言学”当作了一个整体来处理,这就导致两个系统的译文都是在说“语言学”怎么样,而不是“语言”怎么样,因而两种系统的译文都与原文的意思大相径庭。有道译文甚至单独将“起来”与前文割裂译为up,最终的译文无法理解。

例3:

原文:It was Edison who invented electric bulb.

(1)Google译文:这是爱迪生发明的电灯泡谁。

(2)有道译文:是爱迪生什么人发明了电灯泡。

分析:原文的意思是“爱迪生发明了电灯”,但是两种翻译系统都没有做到翻译正确,原因就在于这两种系统都不能正确理解who在本句中的作用,Google将其直译为“谁”,有道系统把who理解为“什么人”,导致译文语句不通顺。

例4:

原文:I wonder whether he is a Satan.

(1)Google译文:我不知道他是。

(2)有道译文:我想知道他是一个撒旦。

分析:正确的译文应该是“我不知道他是不是一个恶魔”。Satan是《圣经》中堕落的魔王。在这句话中,不能将其简单地翻译成名词,而是一个代称,代指所有的敌对者。机器翻译不能很好地结合词语的文化内涵,在翻译过程中遗失大量的文化信息,以至于进行了直译,显然不能达到语言所希望表达的真实效果。

4 MT问题与展望

由于自然语言的复杂性,语言之间存在着程度不同的歧义,使得机器翻译的译文很难取得满意的效果,现对机器翻译中出现的主要问题做如下小结:

(1)词语直译。多义性是中西方语言普遍存在的问题。不同的词语在不同的语境中会派生出多种引申义,从而导致了一词多义。机器不能理解具体的上下文语境,从而不能做到一词多译。

(2)结构分歧。短语也是构成句子的主要成分,短语中又包括着名词、介词等成分,不同的分解方法会得到不同的语义。由于机器无法更深入地对自然语言进行分析理解,因而造成翻译上的结构歧义,这种歧义也是普遍存在的问题。

(3)语句直译,缺乏逻辑。词语的异义和结构的歧义制约了句子质量的提高。

(4)机器难以把译文与人物的身份、习惯、个性及特定的环境、场合相结合,也很难具备将上下文联系起来进行理解和翻译的能力。

(5)机器翻译存在文化缺陷,如信仰、习俗等纯精神方面的内容,离开了相关文化,对应的词汇就失去了意义。

面对MT现存的一些问题,笔者拟从以下几个方面入手,浅谈MT在今后发展的任务:

(1)机器翻译是一门边缘学科,以语言学、数学和计算机为基础学科。其中的语言学又是人文科学与自然科学的桥梁,因此上,要注重研究语言的共同规律,汇集语言使用的知识,不能只注重计算机科学方面的研究,更要重视计算机科学与语言学的有机结合。

(2)强化词义分析,做好词义消歧。词义消歧属于自然语言理解的底层研究,在许多高层次的研究和应用上,词义消歧都是其重要步骤或关键环节。

(3)注重多种翻译方法的融合。如前所述,单一的基于分析和转换的机器翻译方法或者基于中间语言的翻译方法都很难得到高质量的译文。既然单一的方法无法实现,就可以采取多策略的翻译方法,即采取多种翻译方法的优势于一体来构建翻译系统,以期得到高质量的译文。

5 结束语

经过了几十年的发展,机器翻译取得了较大的进展,各种翻译系统也相继出现,很大程度上节约了人力和物力。但是由于自然语言的多样性和多变性,机器翻译仍然面临着很多难题,如:一词多义、结构分歧、知识获取问题以及语言的文化背景和社会背景等,完全意义上的高质量的全自动翻译还远远没有达到。所以在研究中,应该重新定位机器翻译的实现目标,不应该将其作为一门独立的系统,而是起着辅助人工翻译的作用,在某些领域寻求生机和进展。目前,人类对语言的认识是无尽的,对机器翻译的研究也是没有止境的,因而,机器翻译始终具有挑战性。现在完全有理由相信,机器翻译技术一定会越来越成熟,翻译质量也必定会越来越好。

参考文献

[1]邵艳秋.机器翻译相关术语简介[J].术语标准化与信息技术,2010(1):1-2.

[2]张政.机器翻译刍议[J].中国科技翻译,2004,17(1):1.

[3]张政.机器翻译难点所在[J].外语研究,2005(5):1-3.

翻译机器 篇9

20世纪以来, 我国的翻译研究进入了以结构主义思想为指导的阶段。这是将我们的关注点从主体移向客体的一个阶段。结构主义给人们带来分析的方法, 使人们通过对客体的分析, 认识其内部的层次与结构从而更好地把握认识的对象 (吕俊, 2004) 。

典型的机器翻译系统通常表现在两个方面:第一, 传统机器翻译将词作为基本翻译单位, 机器先将源语言句子分解成词, 再将词转换成目标语言的词, 然后根据目标语言语法结构特征将词连接起来;第二, 传统的机器翻译对语境没有给予充分的考虑 (何莲珍, 2007) 。基于以上问题Teubert提出了translation unit概念, 李文中把这一提法称为“翻译单位”。

2 翻译单位的概念

Teubert将翻译单位定义为“包含节点词和其搭配的清晰的表述”, 并认为翻译实践中译者群体构成了一个特殊的语用话语社团, 一切翻译活动和行为都在这一特定的话语内进行 (李文中, 2010) 。

翻译单位应是一个可以在平行语料库中对应的意义单位, 而翻译单位概念的确立也为翻译, 特别是术语翻译提供了依据。而在此基础上李文中进而提出了对应单位, 并认为对应单位是平行文本中意义对应完整, 并具有清晰边界的任何片段或序列 (李文中, 2010) 。

3 现代机器翻译

3.1. 概念及发展

机器翻译 (machine translation) 又称自动化翻译。其概念虽提出较早, 但在上世纪60年代由于美国科学院对机器翻译采取否定态度, 使机器翻译研究转入低潮。70年代初, 由于现实的需要及技术的进步, 又重新兴旺。

3.2. 机器翻译的局限性

由于迄今为止还没有一种可靠的消歧方法, 因而在传统理论指导下的机器翻译中就会出现种种翻译失误 (何莲珍, 2007) 。现以“塞翁失马, 焉知非福”为例, 以下是不同机器翻译的对应文本。

例1.Weng Cypriot missing horse, non-blessing in disguise. (google翻译)

例2.When the old man on the frontier lost his mare, who could have guessed it was a blessing in disguise? (译典通字典)

由以上译本我们可以看出这例句都基本上达到了真正的形式对等, 但翻译出来的意义则与原文出入较大, 且直译使译文丧失了原文的意义, 例如对“塞翁”一词的翻译在google上译为“Weng Cypriot”。Cypriot原为“塞浦路斯”之意, 所以该翻译非常不妥。且“塞翁失马, 焉知非福”是指一件事情具有两面性、有很深的哲理, 而以上翻译作品完全丧失了这句话的深层含义。

但我们也应看到以上这些译本的可取之处, 例如:在对a blessing in disguise的使用上基本表达出了原文的涵义;另外, 也有一些译本采用意义对应形式取得了较好的翻译效果, 例如:

On one hand, loss imply gain;on the other hand, gain imply loss.

Nothing so bad but might be a blessing

以上这些翻译有其优势, 同时也存在不足。但其结合了西方文化特征中原有的表达方式, 因而译文具有较强的可读性。例如, 在以上译文中对imply一词的使用上, 利用语料库对imply进行检索, 其周边多为具有积极色彩的词汇。因此, 在传统理论指导下, 有很多机器翻译译本采用了词与词的对等, 从而导致译文虽在形式上做到对等但在意义上大相径庭。

4“翻译对应单位”的运用

把对应单位概念引入机器翻译中可使译文达到更好的翻译效果。在平行语料库的翻译中所遵循的原则为取大原则, 在此原则的制约下双语语料库首先对比已有数据, 然后找出已存的对应单位, 例如:

打击非法投机活动Strike out at speculation

大碗茶stall tea

安家费settling in allowance (李文中, 2010)

如果仅将以上汉语进行简单意义上的词汇对等, 那么根本不可能翻译出原文所要表达的含义。

5 结语

对应单位的提出是对翻译单位和意义单位的进一步阐释。将对应单位引入平行语料库的建设及机器翻译中, 会对机器翻译起到独特的作用, 而利用网络和语料库技术, 也会使现代机器翻译的准确度有质的提高。

参考文献

[1]何莲珍.基于汉、英语平行语料库的翻译数据库设计[J].现代外语, 2007 (191) .

[2]李文中.平行语料库设计及对应单位识别[J].当代外语研究, 2010 (22) .

翻译机器 篇10

机器翻译(Machine Translation)是利用计算机将一种自然语言自动转换成另一种自然语言的过程。机器翻译真正意义上的出现是在20世纪50年代,然而到60年代由于美国科学院公布的ALPAC报告几乎彻底否定机器翻译的作用和成果,机器翻译步入萧条期。90年代随着网络的发展,传统的人工翻译无法满足迅速增长的翻译需求,人们对机器翻译的需求空前增长,众多公司也相继推出一系列机器翻译软件,因此机器翻译取得了快速发展。

计算机辅助翻译是指人在计算机的辅助下完成整个翻译的过程。与机器翻译相比,其翻译质量要高于单单利用机器翻译的应用领域。其翻译几乎等同于人工翻译,但翻译效率要比人工翻译高一倍以上。计算机辅助翻译产生于机器翻译之上,其作为语料库技术一个重要的领域,近年来也得到了迅速发展。可以说,计算机辅助翻译是在机器翻译遇到阻力后的产物。

二、机器翻译的原理及其局限性

所谓机器翻译,即整个翻译过程中没有任何人工的参与行为。其过程分为原文分析、原文译文转换和译文生成三个阶段。

(一)机器翻译的原理

机器翻译的实现技术主要有两大原理:

(1)基于语法的分析是指计算机通过对源语言单词、语法、句法等进行分析并进行判断和取舍,然后重新进行排列组合,最后生成目标语言。虽然计算机具有庞大的存储记忆和反应能力,在词义的翻译上比人脑快无数倍,但是计算机至今没有达到如人脑一般良好的思维功能,因此机器翻译基于语法分析的译文可读性并不理想。

(2)基于语料库是近年来十分受重视并在越来越多的产品开发中得到应用,但其难点也存在:首先,由于自然语言也在不断发展,要构建一个庞大的语料库并尽可能存储某一自然语言的所有句型其可实现性比较低。其次,即使构筑如此庞大的语料库可以实现,如何使其有效运行依然存在困难。

(二)机器翻译的局限性

自然语言十分灵活,人工翻译过程中,为了目的语的可读性,译者在目的语的选词上具有较大的灵活性,这一点是机器翻译无法比拟更无法超越的。比如翻译“机器翻译的研究历史可以追溯到20世纪三四十年代”,有道词典的机器翻译为“The research of machine translation history can be traced back to the thirties of the20th century”,谷歌在线翻译为“Machine translation studies dating back to the 20th century,three forties”,其中有道翻译的翻译引擎基于搜索引擎,采用搜索引擎后台数据和“网页萃取”技术,谷歌翻译采用了源自全球范围内样本的“统计机器翻译”技术,究其本质两者都是基于语料库的机器翻译,也能看出两个译文都对词义和语法的辨析出现错误。再以英译汉为例,由于机器翻译技术蓬勃发展和改进,如今很多机器翻译软件对英语简单句的翻译都比较准确且符合目的语的语言习惯,但是倘若一个句子中出现了较多个句子成分,如定语、状语或者补语等等,一旦机器翻译对于这些部分理解不正确,译文就会出现问题,甚至让人难以理解。以某次翻译作业中的句子为例,“The second point is that the idea that the Industrial Revolution was“British”and that Europe was just a“follower”seems overstated and,in some sense,wrong.”在有道词典的译文为“第二次,认为工业革命是‘英国’,只是一个‘追随者’,欧洲似乎夸大了,从某种意义上说,错了。”谷歌在线翻译为“第二点是,有观点认为,工业革命是“英国”,而欧洲只是一个“跟随者”似乎夸大了,在某种意义上,是错误的。”该例句是个复合句,其中包括宾语从句和定语从句,因此两者的机器翻译结果都让人觉得莫名其妙。

三、计算机辅助翻译——翻译记忆(TM)

计算机辅助翻译与机器翻译的本质区别在于计算机在翻译过程中不是唯一的主角,主角是译员,计算机在翻译过程只是通过各种各样的手段给予译员辅助。计算机辅助翻译的核心是翻译记忆,它的原理是在译员翻译的同时,计算机辅助翻译软件会在后台建立翻译记忆库,运用翻译记忆和数据库功能,把译文文本内容加以储存。在翻译过程中,当有相近或者重复的术语、短语、句型、词组等出现时,系统通过自动搜索、比对,为译员提供记忆库中相近的译文,让译员自行决定是否采纳、编辑或者拒绝使用。翻译记忆其实是提供了一种翻译建议,在提高效率的同时,提升了翻译品质。

据相关统计,在不同行业和部门,资料的重复率达到20%—70%,倘若利用传统人工翻译,便意味着译员有20%以上的劳动属于无谓的机械重复劳动。翻译记忆技术的应用一方面极大提高了译员翻译的效率,另一方面也提高了翻译的质量。目前比较受欢迎的计算机辅助翻译软件有Trandos,Memo Q,Transit,Omega T等,国内主要有雅信、雪人等。以CAT软件鼻祖塔多思(Trados)为例,在利用Trados翻译的过程中机器会自动记忆翻译结果,当译者再次翻译时,翻译机遇会搜索记忆库并进行对比,挑出相似的译文作为参考译文,并且译者只需要一次性建立一个或者多个标准术语列表,翻译时,术语库会自动识别出已入库的术语并给出相应的术语译语,保证术语的统一,节省翻译时间,提高翻译效率和翻译质量。关于计算机辅助翻译的翻译引擎在下一章节会详细展开。

四、机器翻译和计算机辅助翻译的对比分析

(一)不同的设计理念

机器翻译软件设计的理念是让机器彻底代替人工翻译,由于其可读性和准确性较差,因此机器翻译主要是针对外语基础比较差的用户,其目的是解决基本的语言障碍问题。如今有很多人在阅读外国文献时都会先通过机器翻译来了解大致内容,并且有相当一部分人对翻译的需求仅限于基本了解即可,并不需要花费人力、物力将其准确翻译出来,译文的质量取决于软件技术。

计算机辅助翻译软件则是针对外语水平比较高的用户群体,强调的是机器翻译的辅助作用,而不是完全取代人工翻译。计算机辅助翻译软件在翻译过程中起的作用是提高翻译人员的翻译效率,减少或者避免简单的重复劳动。

(二)应用范围不同

从机器翻译的角度来看,日常翻译的材料主要分为以下6类:1.文学作品;2.非文学出版物;3.法律文件;4.网页及计算机相关材料;5.情报资料;6.文摘。其中非文学出版物,如产品说明书等一些基于专业语料库的材料翻译都可以使用机器翻译。另外,由于有些文件过于庞大,比如网页及计算机相关材料每日的更新都数以万计,倘若使用人工翻译根本应接不暇,因而需要使用机器翻译。此外,对于有些文本读者不需要仔细阅读整篇文章,只需要读懂大概的内容即可,此类文本翻译也可以使用机器翻译。

法律文献对措辞和术语的准确性要求极高,拥有庞大的专业法律语料库的机器翻译软件可以勉强胜任此类翻译。但是为了避免不必要的麻烦,尤其是涉及到法律方面的纠纷,还是应当采取计算机辅助翻译,以专业译员的翻译为准。最后,文学翻译由于其问题的特殊性,因此只能用计算机辅助翻译,通过译者问文学作品的理解辅以计算机辅助翻译软件进行翻译。总而言之,哪种材料运用哪种翻译技术还是要根据材料的性质来定,但是在翻译过程中,无论机器翻译还是计算机辅助翻译都是不可或缺的翻译技术。

(三)翻译引擎不同

机器翻译软件更注重综合功能,因为机器翻译没有人工的参与,也没有审核等环节,译文即最终结果,因此为了保证翻译效果,机器翻译软件对语法库、专业词库等要求比较高。在前面已经介绍了机器翻译技术原理的两个分支,基于语法分析和基于语料库,此处不再赘述。

计算机辅助翻译的翻译引擎包括四个方面:1.在翻译过程中软件会自动存储翻译结果,在之后的翻译中自动搜索记忆库,并将当前句子与库中存在的翻译单元进行对比和匹配,筛选出一定程度上较符合的译文作为参考译文。2.术语管理功能。术语管理是计算机辅助翻译软件的另一个重要特点。据统计,目前市场上有95%的翻译是非文学翻译,也就意味着几乎每篇文档都包含很多的专业术语,例如科技、法律、经济等。而翻译记忆软件中有一个术语管理工具来规范所有的专业术语,以Trados为例,Trados系统中包括Multi Term软件,该软件可以将目前市场上的主流格式文档制作成术语库并添加到Trados软件中,在翻译时,它会自动搜索该术语库,如果该术语存在,它的翻译就会显示在Workbench的窗口。

五、结论

如今虽然机器翻译的发展和受重视程度越来越不如计算机辅助翻译,且机器翻译中依然存在着这样或者那样的问题为很多人诟病,但是它的易用性为人们提供了极大的方便,对于大量并且精确性要求不高的文本机器翻译要优于计算机辅助翻译。而另一方面,计算机辅助翻译先进的记忆技术、可共享交流的翻译记忆库和术语库为专业翻译人员提供了一个高效率、高质量的翻译平台,从而大大提高了译员的翻译效率和翻译质量。

参考文献

[1]李鲁.机器翻译与计算机辅助翻译研究与探索[J].东南大学学报(哲学社会科学版),2002(03):175-179.

[2]赖怡霏.机器翻译与计算机辅助翻译的比较研究[J].德宏师范高等专科学校学报,2014(02):97-99+85.

[3]李艳勤.浅析计算机辅助翻译中的翻译记忆技术和软件[A].福建省外国语文学会.福建省外国语文学会2010年年会论文集[C].福建省外国语文学会,2010:13.

[4]薛文枫.中国机器翻译软件与计算机辅助翻译软件的发展与现状[J].西南民族大学学报(人文社科版),2008,S1:56-57.

[5]张治中,俞可怀.“机器翻译”还是“机器辅助翻译”——对“机器翻译”之管见[J].大连理工大学学报(社会科学版),2002(03):54-58.

上一篇:文化保守主义者的命运下一篇:兰州水污染