国际计算语言学界的这些讨论涉及到深刻的方法论问题,值得我们高度关注。这些不同的学术思想碰撞使我们更清楚地了解超学科的重要性,引导学者们对于计算语言学超学科研究的问题进行更加深入、更加富于理论意义的思考。令人欣慰的是,在超学科思想的指导下,基于统计的方法中更加自觉地引入了语言学信息,主要有如下两个方面(Koehn 2009;冯志伟 2012):首先,在统计机器翻译中提出了基于短语的统计机器翻译模型,这种模型把语言学中的短语作为翻译的原子单元。短语翻译表可以从词对齐中通过机器学习而自动获得,与词对齐一致的所有短语偶对都被添加到短语翻译表中。其次,为了在基于统计的方法中引入语言学信息,统计机器翻译还提出了整合语言学知识的问题,其中包括利用句法标注的语言学信息来提高统计机器翻译的质量,在基于短语的统计机器翻译中融入字母翻译、词汇翻译和句子结构等语言学知识。 由此可见,在基于统计的方法中引入语言学信息,可以弥补统计方法的不足,进一步完善基于统计的方法。因此,在大数据环境下,把基于统计的方法与基于规则的方法紧密地结合起来,是计算语言学超学科研究的关键。 7.结 语 语言学在现代认知科学、自然语言处理中有着重要的地位。由于语言现象的复杂性,研究领域将语言学分为不同的学科,而现代科学技术的发展使语言学中跨越学科界限的研究成为必然,研究方法也从单一层面、单一维度发展到多层次、多维度。超学科强调知识的统一与合作,要求生产出有助于解决社会问题的知识。语言学的超学科命题并不摒弃语言学的各学科,而是以一门学科的深入知识作为基本结构基础,每个相关学科都会贡献自己的基础知识,进而创造出新的行为模式,推进语言学的发展。计算语言学是自然科学和人文科学间界面的融合,在本质上结合了语言学、数学和计算机科学,其研究方法和研究成果都体现了协同作用并具有整体效应。在计算语言学研究中,应当把基于规则的方法和基于统计的方法结合起来,充分利用语言学、数学和计算机科学,取长补短,相得益彰,这样的研究才能充分发挥超学科研究的优势。 (责任编辑:admin) |