语言文学网-学术论文、书评、读后感、读书笔记、读书名言、读书文摘!

语文网-语言文学网-读书-中国古典文学、文学评论、书评、读后感、世界名著、读书笔记、名言、文摘-新都网

《圣经》助力计算机语言学发展

http://www.newdu.com 2018-01-20 中国社会科学报 侯丽/编译 参加讨论

    中国社会科学报综合外媒报道 机器翻译系统(machine translation systems)在进行词汇解释或翻译时,往往只能输入英语、法语等使用人数多的语言,对一些生僻的小语种常常无能为力。目前,科研人员正试图通过《圣经》破解这一难题。 
    丹麦哥本哈根大学的研究人员正在研究如何通过分析《圣经》中的语法结构等,帮助机器翻译系统对小语种进行开发。计算机语言学中一个重要内容是基于搜索引擎的机器翻译系统,英语、法语、汉语等使用人数多的语言在进行交互翻译或词义自行解释时,人们可以直接对手机讲话,通过手机搜索引擎获得初步的机器翻译结果,因为英语等语言使用人数多,互联网存储信息众多,相关计算机语言技术开发得也较完善。然而,如果你使用的是小语种,如法罗语(Faroese)、威尔士语(Welsh)或加利亚西语(Galician),可能就无法轻松地从搜索引擎中获得更多资源。 
    机器翻译系统的开发基于大量的数据,包括手动添加的注释文本,是一个搜索资源逐渐丰富的过程。以英语为例,基于一些历史原因,对英语词汇的解释和翻译,多出于长期以来英文报刊上积累的文章和素材,但人们很难从历史报刊数据中找到更多的小语种数据,即使有使用人数较多的语言,如超过280万人使用的非洲语言约鲁巴语(Yoruba),该语种词汇的相关注释也难以被搜索到。 
    在哥本哈根大学“低谷”(LOW-LANDS)研究项目中,语言学家希望通过分析一些互联网“低资源语言”(Low-Resource Languages)的语系和语言的语法结构,来获得一些小语种词汇在相应的“大语种”中的注释,进而丰富搜索引擎的资源。其中的关键便是找到一种合适的、具有参考价值的翻译文本。《圣经》迄今为止已经被翻译成1500种语言,包括使用人数较少的小语种,经过历史的变迁和考验,《圣经》在各种小语种中的语法结构相当考究,比如其中的一些律诗,翻译得“保守”而规范,结构严谨,适合成为机器翻译时的一种文本参考模型。 
    研究人员表示,分析《圣经》中的小语种语法和表达方式并将其引入计算机语言中,可以帮助人们找到并开发一种相对精确的计算机模型,弥补机器翻译在小语种翻译方面的不足,促进计算机语言学的发展和完善。  (责任编辑:admin)
织梦二维码生成器
顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
栏目列表
评论
批评
访谈
名家与书
读书指南
文艺
文坛轶事
文化万象
学术理论