语文网-语言文学网-读书-中国古典文学、文学评论、书评、读后感、世界名著、读书笔记、名言、文摘-新都网移动版

首页 > 学术理论 > 语言学 > 语用学 >

语言学理论对自然语言处理的影响和作用(2)


    目前自然语言处理发展的瓶颈就是对语言所表达的意义的处理;(14)究其根本,还是语言学发展不平衡的一个结果。语言学中偏重句法和音系研究的现象局限了语言学的发展,同时造成句法和音系构成主要语言规则系统的假象。以至于,语音词汇语法被认为是构成语言的全部内容;自然语言处理也不过就是对这些内容的处理。(15)简化来说,人们认为,语言就是一个大词库加一些组词造句的规则,这些构成语言的“中心系统”,而将这些系统翻译成语音和意义的是“外围系统”。(16)这种观点是落后的语言学观点,但仍然在很大程度上支配着自然语言处理的一些理念。例如,在进行语义处理的时候,自然语言处理的研究工作还集中在词汇短语和句子的层次上,没有意识到语境语义的重要性,以至于脱离了言语交际的现实,不但事倍功半,还可能误入歧途。
    早期的语义学是“词汇语义学”,即,确定每个词的“词典意义”,也就是脱离了具体语境的概念意义,其现实应用自然是词典的编纂。语言使用者参考词汇的“词典意义”来对具体的言语进行理解。语言的传情达意的功能,传统上被认为主要由句子来承担。因此,“句子”的定义是“用词和词组构成的,能够表达完整的意思的语言单位”(17)。但是,所谓“完整的意思”是一个模糊的概念。多“完整”为“完整”,怎样衡量和确认,尽在不言之中。事实上,人们认为某一个句子传达了某一个意思,恰恰是因为词汇的抽象意义在句子中被具体化了,更容易与现实世界中的事物联系起来了。严格来讲,说话人对一个句子的理解完全依赖对这个句子过去的经验和类似句子的过去的经验。这就是为什么“语言习得”总是需要一定的输入和一定的时间。乔姆斯基的“瞬间习得”(18)(instantaneous acquisition)只能停留在哲学层面;在接近现实的层面,其最强表述也不过是“贫乏输入”(impoverished input),而不能完全没有输入。不管语言的生物基础是否具体到语法的层次,语言的使用总需要经历一些经验性的认知过程。
    我们可以接受“无色的绿色想法愤怒地睡觉”(19)可以在“无语境”的情况下表达一定的“语法意义”的说法。甚至可以接受有关“语法意义”可能来自人脑的某些构造特征的说法。但是,无可辩驳的是,任何句子,一旦说出来,就构成了一个特定的语境。在语言学界,上述句子可能传达某些意义。对于没有语法学知识的普通说话人来说,该句子是否“表达完整的意思”则不可判断。任何话语,由何人对何人为何所说,都构成语境的一部分;对话语的理解也都依赖对语境的了解。
    20世纪的结构主义语言学的起点是对“语言”和“言语”的区分,(20)而话语是“言语”的一部分,因此受到冷落。“句子”是“语言”的重要结构单位,因此受到重点的研究和分析。其结果,不仅是图书馆中排满了句法学的书籍,而且,任何一个自然语言处理的机器,基本都可以处理以句子为单位的语言文本。然而,迄今为止,即使是最先进的自然语言处理也还不能充分理解所处理语言材料的意义。(21)
    
    表1展示了自然语言理解的层次性模型。自上而下分别表示人类对人际互动、言语互动、话语和无语境的语言形式的理解。目前的自然语言处理基本停留在最低层次的理解。不同的语言理解层次对应不同的“规范和规则”、不同的“知识库”和“理论”。任何语言结构,例如短语、句子、段落,只能表示抽象的语义,只有在具体的语境中体现为话语时才成为具有交际价值的信息。言语社区的规范包括一系列约定俗成的场合语境,其基础是特定社会的社会行为规范。所以,人类的社会行为和言语互动行为总体上是一组规范性的模型,是可以有预期的选择范围的。然而,目前的自然语言处理还没有将其纳入语言处理模型。 (责任编辑:admin)