语文网-语言文学网-读书-中国古典文学、文学评论、书评、读后感、世界名著、读书笔记、名言、文摘-新都网移动版

首页 > 学术理论 > 语言学 > 语言应用 >

语言官能研究的核心问题及其对自然语言处理的启示(6)


    4.语言官能研究对自然语言处理的启示 
    从语言官能的研究历程来看,生成语法理论不只满足于描述语言现象,还要进一步解释现象,找到最本质的特征,并最终解释语言为什么具有这些特征。我们认为,这种探索对自然语言信息处理主要有如下两方面的启示: 
    第一,自然语言处理需要描述性的规则,它需要语言学为文本分析、句子切分、词语标注、信息检索与提取和机器翻译等自然语言处理任务提供简洁的语法规则。而这些语法规则不应该是人为规定的,而应当以语言官能的初始状态(即普遍语法)中的原则和参数为基础。原则部分为人类所共有,也就是自然语言共有的语法规则,语言间的差异只体现在参数值的设定上。如果我们通过对语言官能的研究找出这些原则和参数,并将其作为语法规则写入计算机语言中,将很可能实现 计算机对人类语言的“描写充分”,对于自然语言处理有着重要意义。举个简单的例子,要通过计算机将“John ran away quickly.”这句话译成汉语,其中可以给计算机写出的一条规则是“副词可以修饰动词,但不可以修饰名词”,这是适用于所有语言的普遍性原则。但如果没有合理的设置参数,计算机会将其翻译为“约翰逃走迅速地”。这说明我们还要写入一个参数,即“中心语参数”(head parameter),使英语和汉语对该参数取不同的值,英语的取值是中心语在前,而汉语的是中心语在后,这样我们才能在汉语的翻译中得到正确的语序。因此,要最终实现机器翻译等自然语言处理任务,应该要借鉴生成语法对语言官能、特别是原则和参数的研究成果。 
    第二,要实现真正意义上的人机互动或机器翻译,计算机所产出的自然语言要符合人类的认知要求,也就是说,必须能够为人类的认知系统所解读,满足“界面条件”的要求。根据最简方案的构想,人类语言是以最经济、最简洁的方式满足“界面条件”,因此要通过计算机最终实现对人类语言能力的模拟,不仅要考虑语言结构和语义搭配上的限制,还要考虑语言设计的“完美性”。如果语言官能确实是以语段为单位将表达式移交给外部认知系统去解读的,那么可以说语段是人类理解语言的基本单位,据此,我们似乎也应将语段作为计算机加工和处理自然语 言的基本单位,将“界面条件”作为衡量计算机产出的语言表达式是否合法的唯一标准,并将内部合并、局域性和最小搜索等操作规程纳入计算机指令,作为计算机生成自然语言的基本手段和方法,以便最大限度地实现计算机对人类语言官能的模 拟和重构,更好地实现人机互动。 
    总之,自然语言处理仅靠形式语法系统提供的范畴化、规则化的语言知识是不够的,计算语言学的研究不应仅停留在语言现象的观察和描写上,还必须以模拟和重构人类的语言能力为最终目标,为自然语言处理系统提供全面的解释性的语言知识。从这个意义上讲,生成语法对语言官能的研究对自然语言处理具有重要的启示和指导作用。  (责任编辑:admin)