谈述机器翻译机器翻译论述可行性

更新时间:2024-04-04 点赞:4565 浏览:12855 作者:用户投稿原创标记本站原创

摘 要:机器翻译作为人工智能研究的重要领域之一,已走过了几十年的风雨历程。本文以综述的形式,着重讨论了机器翻译的发展历程、机器翻译的理论方法及存在的问题此三个方面,以期对机器翻译的可行性进行综合分析。
关键词:机器翻译;发展历程;理论方法;存在问题

1.机器翻译的历程

机器翻译(MT)又称自动翻译,是借由计算机程序把一种自然源语言转换成为另一种自然目标语言的过程。简单来说,就是通过将一个自然语言的字辞取代成为另一个语言的字辞,并借由语料库等技术达成更加复杂的自动翻译。机器翻译属于计算语言学(Computational Linguistics)的范畴,与自然语言理解及自然语言处理之间有着密不可分的关系。

1.1机器翻译简史

机器翻译从其思想提出至今,其走过了一条曲折而又漫长的道路。随着信息时代的到来,经济全球化不断发展及互联网的高速普及,国际间的交流日益频繁,网络信息急剧膨胀,以各种语言为载体的信息大量出现,语言障碍问题愈发凸显,单纯依靠人工翻译远远不能满足信息需求,因此语言的自动翻译也显得极为迫切。
在人类的文明史中,能够找到一种媒介,让使用不同语言的人能够实现无障碍的自由交流,一直是人类的一个梦想。早在古希腊时期,人们就试图设计出以一种理想化的语言来代替种类繁多且形式各异的自然语言,以方便不同民族之间的思想文化交流,其中就包括怎样使用机械手段分析自然语言。在其后的几个世纪里,人们设计了各种方案,如我们所熟知的中间语,世界语等等。而机器翻译的历史,可以追述到1629年笛卡儿主张的一种“泛语言”(universal language),就是对各种不同语声而有相同含义的词赋以同一个符号.这实际上就是语言转换和语言翻译最初的设想。《通用语言的历史》一书中指出德国学者里格(W. Rieger)曾提出过一种数字语法,这种语法加上词典辅助,可以利用机械将一种语言翻译成多种语言,并首次使用了机器翻译这一术语。
1933年,法国工程师阿尔楚尼(George Artsouni)提出了用机器进行翻译的想法,并获得一项“翻译机”的专利。同年,苏联发明家特洛扬斯基(PetrSmirnov-Troyanskii)设计了一种语言翻译机器,用机械方法把一种语言翻译成另一种语言,并在同年9月登记了他的发明,但由于各种原因,他的翻译机没有得到支持。1946年,世界上第一台电予计算机ENIAC问世后不久,美国科学家沃伦·韦弗 (w.Weer)和英国工程师布斯(A.n Booth)就提出利用计算机进行语言自动翻译的设想,借由机械的辅助,机器翻译的可行性大为提升。
自1949年沃伦·韦弗 发表《翻译备忘录》,正式提出机器翻译思想至今,机器翻译已走过风风雨雨历程,学术界一般将其划分四个阶段。1947至1964是机器翻译的开创期,1954年英俄机器翻译实验的首次完成向世界展示了机器翻译的可行性,进而拉来开了机器翻译的序幕,至50年代后期60年代前期一度出现热潮。1964年至1975年机器翻译受挫,ALPAC报告全面否定了机器翻译的可行性,使其陷入停滞的局面。进入70年代后期,科技、计算机及语言学的发展从技术层面推动了机器翻译的复苏。90年代,随着因特网的普及和国际社会交流的日益频繁,给机器翻译提供了广阔的市场及前景,商用机器翻译也迈入市场,进入摘自:毕业论文前言www.618jyw.com
了机器翻译的新时期。

1.2国内机器翻译

国内进行机器翻译的历史可以追溯到上世纪50年代,早在1956年,我国就把这项研究列入了全国科学工作发展规划,1959年中国科学院语言研究所和计算研究所共同努力完成了我国第一个机器翻译实验—俄汉机器翻译实验。在经历了的萧条期后,机器翻译研究再次被提上日程,70年代的“748”工程给予了机器翻译足够的重视,并在1980年召开了中国首届机器翻译研讨会。90年代后,是我国机器翻译蓬勃发展时期,在研究出许多优秀的机器翻译软件的同时,也开始了一些新应用领域对话翻译系统的机器翻译研究,发展十分迅速。

2.机器翻译理论方法概述

机器翻译是一项复杂的工程,随着科技的进步和相关学科的发展,其翻译技术和方法也在不断完善并日趋成熟。现代机器翻译系统一般由语法规则库、翻译模块和词典库三部分构成,其过程可简化为原文分析、原文译文转化和译文生成三个阶段。机器翻译无不力求翻译结果的准确性,而这实质上归结于机器翻译所采取的方法论问题。

2.1基于转换层面的机器翻译方法分类

按转换层面划分,机器翻译课分为直接翻译法,转换法和中间语言法。
2.

1.1直接法

直接法即词对词的互译法,是通过词语翻译、插入删除和局部的次序调整实现翻译,不进行深层次的句法和语义分析,是早期机器翻译系统常用的方法,比如著名的机器翻译系统Systran早期就是采用典型的直译法。但这种译法译文质量不高且通用性不强,比如大家熟知的“How old are you?”机器翻译采用直译法译文结果为“怎么老是你”,与原文意思大相径庭,鉴于其缺点明显,现代机器翻译已基本上不使用。
2.

1.2转换法

转换法根据深层结构所处的层面又可分为句法层转换和语义层转换。整个翻译过程先对源语言结构进行层次分析得到源语言的深层结构,在词对词翻译的基础上,根据不同语言的规则生成相应的目标语译文。比如在进行中英人名互译时,中文是姓在前,美国是名在前,机器翻译时会通过字典中特定描述将顺序调整,实现顺利转化。再如将“她放桌上一本书”翻译成英语时,我们要进行句法层面的转换,英语中是主谓宾结构,要将一本书提前至动词后作宾语,后加介词短语表地点,如下:
她(N)放(V) 书(N)上(P)桌(N)
She puts a book on the desk 2.

1.3中间法

中间法也是一种基于规则的方法,即利用一种中间语言(interlingua)作为翻译的表示形式,中间语言独立于任何一种具体语言。其翻译过程包括从源语言到中间语,再从中间语到目标语两个阶段,在其分析过程中只与源语言有关,生成过程只与目标语有关。这种翻译方法在需要多种语言翻译的时候优势特别突出,可以直接通过中间语翻译到目标语言,而不需要每一种语言都设立一种规则程序。

2.2基于知识便是形式层面的机器翻译方法分类

此外,按知识便是形式划分,机器翻译又可分为基于规则的方法和基于语料库的方法。考虑到其背后的哲学背景,常把基于规则的方法成为理性主义方法(rationali),而把基于语料库的方法称为经验主义方法(empirici)。

2.1基于规则的方法

基于规则的方法及采用规则作为知识的表示形式,包括切分规则,标注规则,语义分析规则,词语转化规则,结构生成规则等,由词典和语法规则构成翻译阵。其优点是可以对句子进行深层次的理解,便于处理复杂的结构如照应、依赖等问题,但是要实现这一点就必须需要大量的语言知识和翻译知识,单纯依靠语言工作者人工编写规则似乎满足不了实际应用的需求。

2.2基于语料库的方法

基于语料库的方法是以语料的应用为核心,由经过划分并具有标注的语料构成知识库。这种方法又可以分为基于统计和基于实例的方法。基于统计的翻译方法基本思想是通过对大量的平行语料进行统计分析,构建统计翻译模型,进而使用此模型进行翻译。基于实例的方法即不经过深层分析,仅通过已有的经验知识通过类比进行翻译。其知识源主要是双语对照的实例库。这种方法对于相似文本效果很显著,但由于受语料库的限制,很难达到较高的匹配率,但与其他方法想融合使用,可以提高翻译质量。

3.存在问题

尽管机器翻译从初期至今已有几十年的历程,翻译方法及各方面技术都在不断进步,给我们带来了诸多便利,但是机器翻译仍存在着诸多问题,其译文质量很大程度上不能够让人满意,尤其是文学作品的机器翻译。
语言是人类思维的工具,更是一个复杂的系统,怎样将人类的语言机制赋予计算机以便机器在运行中能够模仿人类及学习人类认识世界的方式是个难题。尤其对于文学作品,翻译时不仅要充分传达原作的思想内容,而且在修辞、风格上与原作等值。诸如戏剧、诗歌、小说等民族色彩浓厚的作品来说,翻译者不仅要有扎实的语言知识,还要掌握不同文化间的差异,如地域、历史、风俗、宗教等文化差异往往是翻译的最大障碍,而机器恐怕做不到深刻理解不同的文化,因此机器翻译在翻译此类作品时,很难理解某些句子的真正含义而达不到原作的思想意图。以下是选自互联网及其翻译的一个例子。
They fall all night, while the voice of the Teal River becomes more and more hushed and the noises of the forest die away. By dawn, the whole world of stream and wood and mountain has been kindled to a white flame of beauty. 《初雪》
金山快译:他们下了一整夜,而奔腾的梯尔河变得越来越安静和噪声的森林消逝。黎明时,整个世界的溪流、树林和山地已燃起一片美丽的白光。
Google: 他们属于所有的夜晚,而鸭河的声音变得越来越寂静,森林的噪音消失。由黎明,全世界已流和木材和山区一个美丽的白色火焰点燃。
Click2 Translation:他们整个夜晚落下,而水鸭河的声音变得越来越多的安静和森林的噪音减弱。到了黎明,溪的整个世界和森林和山被点燃了到美丽的白色火焰。
Systran:他们落整夜,而小野鸭河的声音变得越来越安静,并且这个森林的噪声消失。 由黎明,小河全世界和木头和山被点燃了对秀丽白色火焰。
有道翻译:他们仆倒的通宵,而声音波形的河流变得越来越安静和噪音的森林消失。 黎明时分,整个世界的小溪和木材和山起一个白色的火焰的美丽。
人工译文:一整夜的雪啊!那奔腾的梯尔河(Teal River)开始渐入宁静安逸,那喧嚣的森林也逐步销声敛迹。到了黎明时分,整个世界里,溪流川谷、林木群山,早已是银装素裹,皑皑动人。
通过对比我们发现有的机器翻译软件连基本意思都传达不到位,更不要对意境的体现。文中梯尔河(Teal River)只有金山快译给出了正确名称,这也凸显了语料库的知识及常识覆盖问题,即使不局限于文学作品,翻译涉及的也往往是海量的知识,这使知识库的建造和维护代价都很高。而且在知识库的扩充中,如何把词典资料加以完善,并且使其规则协调一致,不互相冲突,也是个耗时耗力的高难度问题。
此外,自然语言中也有大量歧义现象,比如语义歧义,句法结构歧义。人类可以轻而易举的处理歧义现象,而机器由于缺乏客观经验知识以及整合上下文信息的能力,消歧就成了机器翻译的一大瓶颈,如英中翻译时量词歧义,以及一词多义歧义。
机器翻译的过程中也设计到很多环节,每个环节都不能尽善尽美,因此错误累计也不利于译文的正确性的提高。目前的机器翻译多以句子为单位,语篇连贯问题及语用也有待研究。因此要达到全自动高质量的机器翻译,还存在着一系列的瓶颈制约。
4.结语
总而言之,在以今后相当长的时期内,机器翻译仍将是人工智能领域的难题之一。尽管目前虽没有一种机器翻译系统能能够实现机器的完美翻译,但并不说明机器翻译一无是处,它在生活工作中许多场合中仍发挥着重要的作用,其现在的价值不在于它可以完全取代翻译家,而是在一个完整的翻译过程中有所贡献。今后人们对其方法论的探索、对机器翻译研究的深入以及飞速的科学发展会源源不断的给机器翻译注入动力和活力,并促进其自身的成熟与完善。
[参考文献]
冯志伟,《机器翻译与研究》。中国对外翻译出版公司,2005,78-82.
杨宗泽,人工智能与机器翻译[M]城都:西南交通大学出版社,2006,123-130.
[3]杨宪泽,句型转换的消歧语译文生成处理研究[J].计算机工程与科学,2007,29(4):88-90
[4]冯志伟,机器翻译——从梦想到现实[J].中国翻译,1999,9(5).
[5]徐斌,郑桂芝,浅谈Google机器翻译在商务英语翻译中的应用[J]。山东水利职业学院院刊,2011,1(3):34-37.
(作者单位:河南大学外语学院,河南 开封 475001)
相关文章
推荐阅读

 发表评论

共有3000条评论 快来参与吧~