又如在断代词汇研究中,共同语词汇与各种不同来源的词汇之间如何分清处于过渡状态的成分,如何区分二者的性质,确定其身份一直是一个难点,也是词汇理论进行说明最为含混的部分。现在则可以利用这份语料作出相当清楚的论述。例如先调查第二版中的方言词,统计它们的来源方言及所占比重,再与第三版对比,看有哪些方言词退出了共同语,哪些仍作为方言词保留下来,哪些被共同语所同化,又新增了多少方言词,新增方言词的来源地如何。通过这样封闭、穷尽的专题研究,将可以清楚地观察到方言词汇与普通话词汇之间的关系及演化过程。[13] 又如词汇研究的核心是词义问题。通过观察词典的释义可以了解这个时代的词义状况,通过同一词书前后两个不同时期释义的对比可以逼真地了解到词义的历时演变情况。在对照《现汉》三版对二版的修订中,最突出的一点就是克服了阶级时代人们自觉与不自觉地加载在词义理解与运用上的那种阶级意识。[14] 词义诠释中阶级意识过强不仅仅是词典释义的问题,其实也是词义自身内涵的再现。通过它可以考察一个词语在不同时代表现出的升浮沉降、广狭宽窄的变化。这是时代变迁最实在的写照。 3,现代汉语规范词典的编纂与完善 以上所有关于词汇状况与理论的研究,都将为现代汉语规范词典的编纂和修订提供有力的理论、方法和材料。《现汉》数据库的计量研究将给词典编纂带来大量新的课题、材料与数据,对规范词典编纂的完整、精确、严密化将起到重要作用。 首先,通过数据库的计量研究,可以发现、归纳、总结《现汉》在词典编纂上成熟的、经验的、带有规律性的东西。如《现汉》收了不少成语,而全书的四字词共有4365,如何区分成语与非成语,一直是颇令人挠头的问题。以往人们多从结构的稳定性、可替换性、来源、字面义词里义等角度来区分,现在通过数据库调查,发现成语类词语的释义表现出一个显著的释义特征,就是有释义“专用语”,如“比喻”“引申”“指”等。使用了这类专用语的约占成语类词语的百分之七十,而在非成语类的四字词中则极少出现,它们绝大多数采取的是对语素义直接说明的释义方式。[15] 其实释义“专用语”正是立足在成语的词义内涵与词义特征之上的,是《现汉》编纂者们在大量释义实践中使用并趋于定型的释义方式。现在通过对所有四字词的计量分析,发现并总结出这一释义特点,使得对成语的区别与认识又多了一个内在的、易于把握的认知标准。 又如96年的修订版对83年版的修订到底作了哪些工作,除了词目的增删外在释义方面还作了哪些变更。通过数据库“不匹配功能”的查询,发现所作的修订远远超出人们的估计。试以“面”字同语素词为例,两个版本共收323条“面”字词,其中83年版收253条,96年收297条,两版共有的词语是229条。也就是说96年修订时删了24条,增了68条。在继承下来的229条中,作了修订的有87条,高达40%,其中绝大部分就是对83版的匡误、订正、补充、完善。[16] 其中,除了增减例句、参见条例的完善等,最值得注意的是对释义的修改。如【面纱】83版是“妇女蒙在脸上的纱”。96版是“(1)妇女蒙在脸上的纱。(2)比喻掩盖真实面目的东西:揭开宫廷的神秘~”。看起来这是义项数量的增减,其实它牵涉着这个词的存在与否。如只有前一个义项,它只是一个单纯的指物名词,大可不必收入语文词典,正因为有了后一个义项,它脱离了具体的指物性,成为具有普遍使用价值的再生的派生义,才使它显得与其它单纯的指物名词不一样,才成为一个社会性的语文词语。又如【面黄肌瘦】,83版释为“形容人脸色发黄、肌肤消瘦”,96版改为“脸色发黄、肌肤消瘦、形容营养不良或有病的样子”。“脸色发黄,肌肤消瘦”是对“面黄肌瘦”的逐字解义,诠释的是它的字面义,而“营养不良或有病的样子”才是它的形容对象。这里的修改显然是后出转精。96年版所作的修订幅度是相当大的,在“花”字、“白”字、“人”字等的同语素词调查中,发现所作的修订都在25~40%之间。目前96版的修订工作只有不多的简要概述,尚无系统的总结说明,[17] 而现在数据库技术却使这一切昭然若揭。词典的修订不单单是一个技术问题,这是弥足珍贵的一份词汇词义与词典理论研究的材料。全面总结96年版的修订工作,对规范词典的编纂理论和编写实践,都有着很好的启迪与借鉴作用。 另一方面,通过数据库的计量研究,也会发现《现汉》还存在着许多的不足。数据库技术的应用使得《现汉》中许多藏而不露或若隐若现的毛病都显露出来。如收录词目是词典编纂中的第一大问题,收词稳当、妥贴、均衡一直是规范词典编纂家们致力于追求的高目标。无论是在《现汉》的编纂之初,还是修订之后,编纂者们在这方面都花费了大量的精力,也有许多经验之谈。然在数据库的查询中仍时时可见收录中的不妥,该删未删,该收未收,收与未收之间的失衡,类与类之间不对称,不在个别。如96年版对83年版删复音词4790条,新增复音词9845条。说它都删去了这么多,并不尽然,有的原来单字下只有一个复音词的现在归入单字的释文,只是变换了一种存在形式。说新增的都是新词语,做到词典的与时俱进,也并非如此,因为不少属于以前该收而未收的漏收词语。如新增词语中有四字词1059条,其中属旧有成语的不在少数,如“笔走龙蛇”、“匕鬯不惊”、“拔刀相助”、“白璧无瑕”、“斑驳陆离”、“饱以老拳”、“杯盘狼藉”、“辅车相依”、“覆水难收”。再把新增收复音词与二版基本同时代的《辞海》(1979)相对照,发现竟然有1700多条词语见于后者。可见说它们为“新增词语”可以,说它们皆为“新词语”则否。假如能对这些或删或增的词语作一详细调查,并参之以其它有关词频词典、专科术语词典、方俗语词类,相信规范词典在收录词语时将会有更扎实的理据,并通过这一增一删的语料可以窥伺到规范词典的语文性与稳定性是如何体现的。 又如对词语性质的认定也是如此。对(方言词语、文言词语)“这些词语冠以[方][书]等特殊标记后,使词典的规范部分‘好比一个盒子装在另一个盒子里面’,‘凡是没有标记的就可以视为标准描写词典中的规范成分’。这样做,在增强词典实用性的同时,又保持了词典的规范性。”[18] 对词语属性进行标注,是一件功能无量的好事,也是极见功力的,可它在词典编纂的手工操作年代很难做到尽善尽美。数据库显示,《现汉》在标与不标,标这类与标那类,仍存在着不少可商可议之处。如标了[方]的有2332条,但一些明显是方言词的却未按此例处理。如“乌拉草”“乌涂”“无任”是《现汉》两个版本都收了的方言词,分别使用于东北地区、粤方言区。词典的释义是这样: 【乌拉草】:多年生草木植物,叶子细长,花单性,花穗绿褐色。茎和叶晒干后,垫在鞋或靴子里,可以保暖。主要产于我国东北地区。 【乌涂】:(1)水不凉也不热(多指饮用的水):~水不好喝。(2)不爽利;不干脆。 【无任】:[书]非常;十分(用于‘感激、欢迎’等)。 三个词都未标[方],另用了三种不同的处理方式。首例是说明使用地区,中例未作任何标示,末者标为书面语。这种参差在编纂词典的手工劳动中是难以避免的。 又如,作为一部现代汉语规范词典,对所收录的汉字也都应该是通用的现行汉字。但通过数据库调查,发现这个问题在现在包括《现汉》《新华字典》《中华字典》《现代汉语规范字典》在内的几乎所有“现代”“规范”的中小型字典词典,都未解决好,或说是根本就还没有引起注意。以至于在所收录汉字的字量与字数上,在对“古字”“僻字”的属性标注中,都表现出相当明显的交叉与混杂,使得“现代汉字”这样一个很有学术价值与现实意义的命题,变得在脱离了“现代汉语通用字”这个依傍后成为无确定数量、无确定边界、人言人殊的一个汉字混合体。[19] 而这些在有了大规模语料统计材料的今天,是应该得到顺利解决的。 (责任编辑:admin) |