2.3缺乏高质量军事英汉汉英平行语料库建设工具 进行平行语料库的建设,需要充分利用自然语言处理技术。不管是句子对齐、词对齐,还是词性标注,都应该先利用自然语言处理技术自动实现,然后进行人工校对,否则非常费时费力。针对非计算机专业人员,软件工具还应该有图形界面,否则普通用户不容易掌握其使用方法。麻丽莉(2009)中很多文本预处理工作都是手工进行的。虽然求助计算机专业人员,采用了一些计算机辅助手段,但总体效率不高。例如,英语句子边界识别程序输出的错误断句较多,采用的句子对齐技术简单,仅仅是先由计算机按句子序号对齐,再进行人工校对排除对齐错误。在她建设句子对齐平行语料库期间,互联网上已经出现多款Linux系统下的非图形界面的英语句子边界识别工具和英汉句子对齐工具,一些机辅翻译软件也提供双语句子对齐工具,但是正确率有待提高。崔卫、李峰(2014)的俄汉汉俄平行语料库对齐加工系统则是基于句长关系开发的。 3.我军军事英汉汉英平行语料库建设问题的对策 3.1以需求牵引带动军事英汉汉英平行语料库建设 尽管我军对双语平行语料库建设的需求看似不如美军那样紧迫,但是实际上我军对双语平行语料库建设的需求很大,尤其在军事英汉汉英平行语料库建设方面。 首先,军事翻译需要相关的双语句子对齐平行语料库。新军事变革需要翻译大量的外文军事资料,军事外宣需要大量的对外翻译,日常军事科研也需要翻译,包括跨国军演和国际维和在内的对外军事交流不但需要笔译,还需要口译。这些翻译大多数是军事英汉汉英翻译。尽管军事翻译任务应接不暇,然而,基于翻译记忆库的机辅翻译技术近两年才在繁重的军事翻译任务压迫下得到重视。句子对齐平行语料库可以很方便地转变成翻译记忆库,为相同语种和领域的机辅翻译提供快捷的参考。大量的英汉汉英军事翻译任务需要对应领域的具备一定规模的军事英汉汉英句子对齐平行语料库。 其次,军事翻译研究需要军事双语平行语料库。得益于计算机技术的发展,利用语料库进行翻译研究已经成为一种不可或缺的手段,甚至被称为翻译研究范式(胡开宝2012:59)。语料库是语料库翻译研究的物质基础,其中双语平行语料库是重中之重。在大规模军事双语平行语料库基础上进行军事翻译研究,无疑会有效促进军事翻译研究的发展。 另外,其他像军事翻译教学和培训、军事外语教材编写、军事外汉汉外双语词典编纂等同样需要大规模的军事双语平行语料。 3.2充分利用自然语言处理技术辅助军事英汉汉英平行语料库建设 平行语料库可以在篇章、段落、句子、短语、词汇等多个层次上实现平行对齐。篇章对齐没有难度,收集整理资料的同时就能实现。当平行语料段落不对齐时,人工对齐段落比较费事,但是利用双语段落的长度关系,机辅人校,能够较快实现100%的段落对齐。不主张采用段落重组对齐的方法。毕竟段落是重要的语言单位(梁茂成、许家金2012:37),要使语料库建设发挥最大效益,平行语料库应尽量保留段落标记。 (责任编辑:admin) |