30多年前,许国璋先生提出了自然语言的计算复杂性究竟有多大的问题,本文试图回答许先生提出的这个问题,讨论正则语法、上下文无关语法的计算复杂性,说明交叉系列依存结构的计算复杂性,以此作为对许国璋先生百年诞辰的纪念。 作者简介: 冯志伟,杭州师范大学。 1982年,我参加了《中国大百科全书》语言文字卷第一版的编辑工作会议。当时我刚从法国留学回国,才43岁,是编委中的年轻人,而其他编委大多是中国语言学界中德高望重的长辈,我自知学问不高,怀着对各位长辈敬重的心情,给自己安排的工作是给长辈们倒茶,所以,在开会的时候,我总是提着茶壶来回倒茶,充当服务员的角色。主编季羡林先生对我说,“志伟,你不要总是倒茶啊!你刚从国外回来,能不能在会议上给大家介绍一下你在法国做的机器翻译研究工作,开阔一下大家的眼界呢?” 根据季羡林先生的安排,我在编辑工作会议上简要介绍了自己在法国格勒诺布尔理科医科大学研制的把汉语自动翻译为英、法、德、日、俄5种外语的FA-JRA机器翻译系统。许国璋先生和王宗炎先生听了我的介绍后,对我的工作产生了浓厚兴趣,问我能不能给他们具体演示一下。 当时微型计算机还没有普及,我从法国带回来的FAJRA系统需在中国科学院计算中心的IBM-4341大型计算机上运行,在编辑工作会议上无法演示,于是我带着许国璋先生和王宗炎先生驱车前往中国科学院计算中心观看我研制的FAJRA系统。 他们仔细观看了我的演示,并且亲自试着在计算机终端上用 FAJRA系统翻译了他们自己想出的一些比较复杂的中文句子,对于我研制的这个多语言机器翻译系统赞赏不已。但是对于一些更为复杂的中文句子,FAJRA系统仍然翻译不了,由于当时这个系统对于多义词和多层嵌套结构的处理能力不高,有的中文句子的翻译结果甚至是很可笑的。 观看结束之后,许国璋先生问我:“自然语言实在太复杂了,看来你的这个系统的机器翻译能力还不太强,你还要继续努力啊!关键的问题是要解决自然语言的计算复杂性问题,志伟你要好好地想一想,从计算的角度来看,自然语言的复杂性究竟有多大呢?” 许国璋先生学贯中西,具有哲人气质,他提的这个关于自然语言计算复杂性的问题是很深刻的,引起了我的深思。当时我还没有能力回答许先生提出的这个问题,不过,多年来我一直在思考这一问题,阅读了不少材料,在许国璋先生诞生100周年之际,我把自己对于自然语言计算复杂性的学习心得写出来与大家分享,作为对许先生的纪念。 (责任编辑:admin) |