《现代汉语词典》词汇计量研究系列论文——
关于《现代汉语词典》词汇计量研究的思考
《现代汉语词典》词汇定量研究是在数据库基础上对该词典的所有词目、字形、释义、注音进行专题、封闭、量化的统计性研究。下面就这一课题研究的开展谈几点认识。(刊《世界汉语教学》2001年第4期) 苏新春 厦门大学 一、开展《现汉》词汇定量研究的出发点 1,对传统词汇研究的更革 半个多世纪以来的现代汉语词汇研究,在词汇的诸多方面取得了长足的进步,但审视过去,也发现其在大观上存在若干不足,主要表现为:定性式的研究方法、非整体的词汇研究观及取材的非充足性。 所谓定性式研究方法,即研究主要凭借的是研究家对材料的主观感受与判断。研究中个人的识断起着主要作用,所依据的主要是典型性、富于个性的语料。这种以识断选例、从个案窥全局的特点,必不可免地会带来个别结论与普遍规律、个人见解与普遍材料之间的矛盾。在词汇学史上,各宥所见、见仁见智的现象屡屡可见,使得词汇研究长期处于“人治”阶段,难以走上科学化的道路。如对是否存在词汇系统,看法长期得不到统一,直至有人把词汇系统明确地,尽管不很清晰、不很完整地描述了出来,意见才趋向一致。[①]又如普通话词汇系统的来源与状况,尽管人们普遍认为有五大来源、六大来源,但每一种来源词汇与普通话词汇在进与退、量与质、渗透交融与沉淀同化的关系如何?有着什么样的演化规律,有无富于操作性的量化标准,至今都还是蒙胧中来蒙胧中去。在这样的基础上再来说普通话词汇的整体状况,当然离而远之。 又如词典,无论是专科术语类还是断代的语文类词典,都有着属于自己的核心词汇部分,也都存在着分布于边缘地区的过渡成分,可现状却是对词目的收录、保留、删除都缺乏对过渡成分严格的区分标准,成为又一个典型的“定性”领域,处处可见“吾辈数人,定则定矣”的痕迹。新词新语研究由于缺乏量的分析与说明,以致于旧词当新词者有之,偶用词作常用词者有之,误用词当定型词者有之。在对现代汉语词汇整体面貌还缺乏清晰、完整描述的情况下,所建立起来的词汇理论也就难免粗疏、缺漏。 2,频率研究在词汇研究中具有直观、可靠的作用,是词汇内在规律的体现。 定量研究在词汇研究中具有直观、可靠的作用,它能直接、真实地反映词汇的内在规律。语言是一种符号系统,是人类使用的交际工具,它所有的价值上的重要性,结构上的通用性,使用上的常见性等“质”的内涵都会在语言要素的“量”上反映出来。词汇的定量研究正是立足于语言的这种质与量的关系特征之上。词汇的量化研究主要体现为词的频率研究,如结构频率、分布频率、使用频率等。在语言的各种要素中,词汇是体现频率特征最突出,相对来说也是较易进行量化研究的,可惜长期以来人们却宥于词汇是一盘散沙的观点,在研究中一直缺乏系统、整体、量化的观点。近10多年来,在汉语史的研究中人们开始重视了专书专人的研究,但对断代词汇的计量研究,特别是基于断代词汇计量研究之上的词汇理论研究,却迟迟难以进入状态。其实这项工作在理论上确立起了正确而明晰的认识,并与当代成熟的计算机数据库技术结合起来,它就变得自然、必然了。 3, 《现汉》在反映现代汉语词汇面貌上的代表性 在确定了词汇计量研究的认识后,选取有足够容量、富于代表性的、系统自足的断代词汇材料,就成为关键问题。词汇研究与词典有着天然的联系。词典是词汇材料的聚合体,它反映的是具有普遍的社会性、定型成熟、并经过人们整理的系统的词汇材料。对现代汉语词汇研究来说,《现汉》有着难以替代的特殊价值。这不仅仅是因为它是一部语文词典,收录的主要是人们日常使用的生活词语;也不仅仅因为它是中型词典,收录了5万多条词语,现代汉语的基本词、常用词都见于其中;也不由于它有着极广的流传面和极高的权威性。最重要的是因为:它是致力于以反映现代汉民族共同语词汇系统为己任的词典。 规范型词典全面反映语言的词汇体系,就要对词语作全面收录,不因某些词语无需查检而不收。……规范型词典如果把数以万计的常用词排除在外,它将是一部残缺不全的词典,也就谈不上为民族共同语规范化服务。而单纯以释疑解难为目的的词典,在收词上就不一定照顾到词汇系统的全面,一些很常用而不需索解的词可以不收。 规范型词典对民族共同语词汇的记录是全面的,但不是穷尽的(在理论上和实践上都是不可能的)。《现汉》是一部中型词典,它在收词上既是全面的,又有较强的选择性。选词的依据,主要不是看查考的需要,而是看词语在语言使用中出现的频率。[②] 以上是《现汉》编纂者对词典功能、选目依据的说明。正是这种说明成为最终影响本课题把《现汉》作为分析材料的最重要因素。 《现汉》的编纂者多是造诣精深,学有专攻的行家里手,他们从上百万张资料卡片中反复基酌,层层筛选,最后确定收录的五万多条词语,无疑是对现代汉语词汇的一次全面整理和规范。[③] 这标明,《现汉》所收纳的词目很大程度上反映着现代汉语词汇的构成与概貌。正因为此,后来以反映现代汉语词汇系统为己任的《同义词词林》[④]、《汉语类义词典》[⑤]等,都把《现汉》作为不可或缺的收录对象。 (责任编辑:admin) |