张、黄氏在图论原理下采取了下面的具体做法: 对于一部词典,可以用下面的方式将它唯一的对应于一个有向图。 1. 对于词集中的每个词w2,在图中有且仅有一个节点n与它对应;[32]且图中的每个节点n,在词集中有且仅有一个词w与它对应。 2. 对于词集中的任意两个词w1,w 2,(其中w1对应于n1,w2对应于n2)。若w1的定义串中出现了w2,则图中从n1到n2有一条有向边;否则,图中从n1到n2不存在有向边。[33] 这样,充当释义词的机会愈多,其实就是充当“边”的端点的机会就愈多,也就有愈多的“边”集聚在它身上。转换成释义语言,也就是充当释义词的频率愈高,释义词的特征愈突出。这就是运用图论来提取释义元语言的最基本演算原理。应该说这是有很大合理性的。 3.统计结果 经使用以上方法,共得出“定义原语”3856条。研究者对这3856条释义词作了义类分布调查,参照依据是《同义词词林》(下面简称《词林》)。义类标注及分布调查成为研究者对统计结果所作的唯一加工及评价。研究者的说明是这样: 我们对定义原语集中原语义类分布进行了统计来观察由属于哪些义类的词或概念可以构成一个定义原语集。我们选用梅家驹等人主编的《同义词词林》中给出的义类代码。 这是汉语释义元语言首次“有形”地完整出现,无论从那个方面来说,它都是很值得让人高兴的事情。不管它是清晰还是模糊,也不管它是漂亮还是丑陋,它的存在就说明一个新生命的存在,更何况是“新新人类”的第一个。当然,我们接下来的工作就是要评价它的生命力如何,评价导致它产生的生物基因如何。相信这一工作是很值得做的,因为这将使它的生命在更广阔的空间中得到延续。 在充分肯定这个研究结果的同时,还要看到它存在着若干明显的不足。对此本文做出以下四点评论。 之一:以《词林》作为义类标码的参照系是可以的,但释义词的有无以它作比较对象则显得大而无当。为什么这样说呢?《词林》是现代汉语的第一部义类词典,它把现代汉语词汇共分出了12大类,94中类,1428小类及3927小小类。虽然汉语分类词典后来还陆续出了一些,但分类之全面、妥贴,还是以《词林》为首推。这就是分类上以它为参照点可以的根据。又说它不可以指的是它的收词范围。《词林》收词7万多,从篇幅上看与《现代汉语词典》、《当代汉语词典》、《新华词典》等现代的、中型的、语文性的词典收词大体相当或略大,但收词内容其实相当的杂芜。古今并收,雅俗同列,通方齐存,比比皆是。再从词汇单位来看,词与语、词与词素、词与短语,随处可见。因此,以统计出来的释义词见还是不见于《词林》,实在是没有什么参考价值。我们前面在说明《朗曼》2000释义词特点时,把它与《朗文》作了对比,这是因为《朗文》的词语具有通用性、常用性、基础性等特点,而且全书的收词规模不大,精选程度高,而《词林》则离这样的要求相去甚远。 之二:对释义词资格的怀疑。上面我们说了《词林》的收词是多而滥,相当的杂芜。但即使是这样,3856条释义词中仍有相当多的不见于《词林》:去掉重复的58组,[34]不重复的词语是3790条,不见于《词林》的多达1110条。再与《现汉》对比,不见于其中的多达797条。这么多连如此规模的语文词典都不收录,它们怎么有资格成为释义元语言的一部分?下面我们来看看3856条释义词的语义分布。所有释词的义类分布见下表,并举出若干例词(接音序择选)。[35] 八路军、兵、兵役、兵种、驳壳枪、步兵、陈胜吴广起义、冲锋、抽丁、初战、传爆线、弹壳、导弹、导弹快艇、第二次国内革命战争、第三次国内革命战争、第一次世界大战、短枪、法国大革命、反坦克炮、弓、海军、核武器、护卫艇、火焰喷射器、机关枪、甲午战争、歼击机、简师、局部战争、军队、军籍、军舰、军事、军衔、抗日战争、空降兵、来复线、榴霰弹、芦沟桥事变、炮弹、炮钎、炮塔、起义、枪弹、侵略、氢弹、燃烧弹、上校、生物武器、生物战、坦克兵、特种战争、铁甲车、退伍、无烟火药、武昌起义、武器、瞎炮、新四军、无后坐力炮、战列舰、战争、战争状态、中国工农红军、中将、中尉、作战。 “语文”类大体上都是通用词语、一般性词语,可它只有1295条,仅占总数的三分之一,非语文类词语却占64.5%。而在“no_code”类中,非“语文”类的专有性名词则高达89%。 之三:专有名词过多。对这个问题可从一个侧面,即词长来看出。这里的释义元语言的平均词长与《现汉》比较接近。下表是张、黄词语集的词长统计: 奥林匹克运动会、博斯普鲁斯海峡、超外差式收音机、第二次国内革命战争、第三次国内革命战争、第一次世界大战、各尽所能按劳分配、各尽所能按需分配、共产主义青年团、共产主义者同盟、古典政治经济学、广西壮族自治区、和平共处五项原则、流行性脑脊髓膜炎、流行性乙型脑炎、马克思列宁主义、马克思主义哲学、美尼尔氏综合症、朴素的唯物主义、人民代表大会制、社会主义所有制、新疆维吾尔自治区。 (责任编辑:admin) |