《现代汉语词典》词汇计量研究系列论文——
现代汉字的范围及其属性标注
“现代汉字”作为一个学科术语其内涵已经确定,以它为研究对象的“现代汉字学”已经建立,但“现代汉字”的范围有多大,包括多少汉字?哪些汉字?却处在若隐若现、似有若无之中。1988年3月25日国家语委、新闻出版署公布了“现代汉语通用字表”,共有7000字,其中包括一级常用字2500,二级次常用字1000,剩下的3500字可以称之为三级字。7000通用字作为国家标准颁发,称之为现代汉字大概是可以的,这就是说“似有”的原因。但又说它“若无”,是因为没有一部现代汉语的字典词典是按照这个范围的汉字来编写的,即使是称之为“现代汉语的”、“规范的”、“标准的”、“权威的”字词典也是如此。下面就来详细看看几部字词典的收字情况:(刊《汉字文化》2001年第2期) 苏新春 廖新玲 厦门大学 《新华字典》(商务印书馆,1998年版),《修订说明》:“修订后的字典计收单字(包括繁体字、异体字)10000余个”。 《中华字典》(中华书局,1999年版),《凡例》:“以……《现代汉语通用字表》为主体,适当补充若干经过选择的在现代汉语中仍有实用价值的字。” 《现代汉语规范字典》(语文出版社,1998年版),《凡例》:“收录《现代汉语通用字表》全部7000个通用字和一部分现代汉语中能见到而又不十分生僻的字。为了便于读者查考,在正编外酌收一部分生僻字作为备查字。正编及备查字共收单字10000个。” 这三部书的性质和规模都差不多,它们大体上都是“以收录现代汉语通用字为主要内容”(《规范字典》),“主要供中小学教师和学生使用,中等文化程度以上的读者也可参考”(《新华字典》)。但它们的收字都在1万上下,比7000通用字多出3千。现在问题在于,究竟是通用字的范围定得小了点,既然中小型字典收的都是1万字,为什么不就把那3千字放入通用字呢?还是这些字词典名不符实,贪多求大,多收了约三分之一的非现代汉字?当然,字词典有一个查考的功能,但如果真正是“在现代汉语中仍有实用价值的字”,那现代汉语通用字就不应将它们排斥,而应将其纳入其中,再分出个四级或五级;如果这些汉字只是专业人士,读专业书籍才用得上,那就不应该在如此性质与规模的字词典中收录。正是由于这一矛盾未能解决好,才使得“现代汉字”一直处于一种朦朦胧胧的状态,才使得作为国家标准的“现代汉语通用字”难以落到实处,才使得现代规范字典在收字上各行其是,没有明确的标准。 造成这一困惑的关键在于对超出7000通用字到1万字这个范围的汉字该如何看待。对它们的看法直接关系到对“现代汉字”的认定。现有对这部分汉字的说法五花八门,有“难僻字”、“古字”、“文言字”、“书面语的文言字”不等。这些说法看似明确,实则含混;单看清楚,横向比较则参差不齐。下面就以《现代汉语词典》(下面简称《现汉》)的收字情况来作一深入些的分析,因为《现汉》的主旨就是反映“现代汉语”的词汇,“为推广普通话、促进汉语规范化服务的”,它的收字收词应该更符合现代汉语的规范性要求。为了更好地说明问题,文章还将前后隔了13年的《现汉》第二版与第三版作了一些对比。 1983年的第二版《现汉》收词56000余条。经笔者统计单字条目为10540条,除了一字多条的情况,如“克1”“克2”“克3”“克4”,使用的单字是8600个。其中有1467个汉字出现了一字多条的情况,出现最多的是“角”与“和”,分别出现了8次。8600个汉字比7000通用字多出了1600个,因为通用字表出现得晚,其中有几个列入通用字表的字不见于《现汉》(二版),但这只是个别现象。那么《现汉》(二版)对那些在7000通用字以外的汉字是如何认识的呢? 《现汉》(二版)“凡例”的说明是这样:“一般条目中,标[口]的表示口语,标[方]的表示方言,标[书]的表示书面上的文言词语,标[古]的表示古代的用法。[口]、[方]、[书]等标记适用于整个条目各个义项的,标在第一义项之前;只适用于个别义项的,标在有关义项数码之后。……有些单字条目,在释义前加⊕,表示是现代不常用的字。”《现汉》(二版)的标注在8600个单字身上有这样几组数据值得注意: 1,标了[方]的方言词487个,其中整字为方言义的271个,某个义项属方言义的216个。譬如:“【浜】[方]小河(多用于地名):张华~(在上海)。”“【柴】¶柴火:木~丨~草。· [方]干瘦;不松软。¸姓。”487个方言单音词中有286个在7000通用字之中,不在其中的是201个。 2,标了[书]的书面语文言词语有1671个,其中整字为文言义的1289个,某个义项属文言义的382个。如:“【霭】[书]云气:烟~丨暮~。”“【秉】¶〈书〉拿着;握着:~笔|~烛。·[书]掌握;主持:~政。¸古代容量单位,合十六斛。Í姓。”1671个文言词语中有1215个在7000现代汉语通用字的范围,不在其中的是456个。 3,标了“⊕”的不常用字(即难僻字)有852个,如:“【浡】⊕振作;兴起。”其中160个在7000通用字的范围之中。 把上述数据用表格反映是这样: |