当代汉语外来单音语素的形成与提取
提要:收集了16部新词语词典的30327条词语,从中筛选出了876条外来词,提取出了所用汉字557个,其中记音汉字186个。分析了记音汉字演化为音义兼表的语素字,复音外来词凝固为单音语素的过程,提出了“独立使用”与“重复构词”的两条鉴定标准。认为外来单音语素的出现是汉语语素演变的结果。外来新观念、新认识正在源源不断地充实着人们的认识,正在进入汉语的最底层单位。汉语在演变规律强大运行力的影响下,一些最重要的、常用的基本概念与基本词汇,总会以单音语素的方式凝固、沉淀下来。刊《中国语文》2003年第6期 苏新春 厦门大学 关键字:语素 外来词 单音节 汉字 一、问题的提出 20世纪70年代末以来的20多年间,新词语的大量出现成为当代汉语演变最突出的一种现象,人们倾注了相当大的热情来讨论新词语给汉语词汇带来的种种变化。但我们可以发现,这些议论所言及的大都属于词汇系统中表层的问题,其实,对当代汉语词汇如此大规模牵筋骨、动全身的演变,人们完全有理由提出更为深层些的问题。语素是语言的最底层单位,它是音义结合的最小结合体,是最稳定的语言成分,所有的语言运用都是在它的基础上来组合、衍生、运行的。汉语的这一语言底层或核心层是否会发生变化,是否会因受到外来词的浸润而出现新的语素成分?如果有的话这种影响又是如何实现的?这就是本文关心的问题。 我们可以先看看学术界对语素的一些普遍性的看法: 一,汉语语素的存在形式。人们认为汉语语素的基本存在形式是单音节,少数是多音节的。 “汉语语素在口头上表现出来是音节,在书面上表示出来是汉字。汉语语素多数是单音节的,写出来就是一个汉字;也有双音节或者多音节的,写出来就是两个或者两个以上的汉字。”[1] 二,汉语语素的来源。人们认为绝大多数是从古汉语继承而来的,少数是近现代从外语借来的;从古代继承而来的是单音节的,从外语借来的则是二音节、三音节的复音节语素。 “汉语语素绝大多数是单音节形式,吸收外来语言成分形成的语素一般是双音节或多音节形式”。[2] “汉语语素一直是以单音节为主的。单音节语素在汉语语素的总数中占绝对的优势,同时又有极强的构词能力,可以繁衍出成千成万的词语。”“双音节语素是由两个音节表示的语素。双音节语素主要有两种:一种是从古代汉语中继承下来的联绵语素,一种是近代、现代用音译的办法产生的外来语素”,“多音节语素是由三个或三个以上的音节表示的语素。这类语素主要是外来语素”。[3] 三,汉语语素的数量。人们从不同的角度提出了看法,认为在一万个左右。 “《新华字典》收单字11000个左右,据粗略统计,其中的97.8%都是单音节语素,都可跟别的语素组合成许多新的词语。多音节语素数量少,有的根本没有构词能力,有的构词能力有限能力,一般只跟一些表示类属意义上的语素组合。”[4] “《语素库》现有6671个记录,登录的都是不成词的语素。”“到目前为止,《现代汉语语法信息词典》以覆盖通用文本为目标,以常用的词语作为主要收录对象。词典中词语总数已达5万多,其中单汉字的词语约有3000多个。”[5] 从上面的论述可以看到,人们一般都认为汉语语素主要是单音节的,单音语素基本上都是本土的;少数语素是外来的,外来语素为复音语素。而本文提出的疑问则是,在当代汉语词汇的巨变中,有没有从外来语素中产生出单音的语素?近年学术界已经开始注意了这种现象,论述到多音节外来语素出现了简化现象,其中尤以高燕同志的文章提得最为明确。[6]但这种多音节语素在使用中的简化与蜕变为语言结构中的单音语素还有着本质的不同。特别是外来单音语素是如何衍生出来?可以运用什么样的方法来检测与判断?外来单音语素形成的最后标志是什么?这是本文要致力于讨论的问题。 二、外来单音语素的测定与提取 语素是最小的音义结合体。要判定一个外来单音语素的形成,就必须要认定这个本来纯粹是记音的汉字也具有了表意的作用,本来由几个音、几个汉字来表示的意义凝集在一个音、一个汉字上;这个音、这个汉字要最终具有表意作用,完成与意义的结合,也必须具有在不同场合、不同环境中稳定表意、重复使用的功能。根据这个认识,我们提出了外来单音语素这样的演化过程: 复音外来词->单音节式简化->独立运用;重复构词->单音语素的完成 把这个过程图形化,则为: 1.单音节化。就是它的外部形式必须由复音节转变为单音节。这是一个必要条件,必然具备的外部形式,却不是语素形成的充足真假必然关系条件。 2.复现率。复现率是指这个单音外来语素要能重复出现在不同的场合。场合分两种,一种是句子环境中的灵活的语法搭配,一种是词结构中的固定构词搭配。复现率是一个语素形成的重要指标,只有达到一定程度的复现率,单音节才能完成与语义的紧密结合。复现率是一种频率标志,反映出与意义结合的紧密程度。 根据这样一种认识,我们对所收集到的新词语,特别是外来词,一一进行了鉴别。步骤如下: 1.新词语集之分析 收集了这一时期出版的16种新词语词典,最早出版的是《汉语新词词典》(1987),最晚出版的是《现代汉语新词语词典》(2000),收词规模最大的是《新语词大词典》(11288条),规模最小的是《1991汉语新词语》(335条),[7]这16种新词语词典基本反映了这一时期新词语的面貌,共收录新词语5万余条,不计重复是30327条,用来构词的汉字共2765个。下面引用的新词语,如没作特别的说明都在这个范围之内。出现频率最高的新词是11次,只有“空调”一词,出现10次的有13个词,是“创收、农转非、利改、调资、群体、欧佩克、南南合作、短线、武警、违纪、一国两制、乡镇企业、四化”。按见于各部词典的次数,分布频率如下表。见于不同词典的次数愈多,说明这个词语的流行愈普遍,曾受到人们更多的关注。 在新词语中筛选出外来词876条,主要包括三部分:字母词、音译词、意译词,其中以音译词为多。由于本文的目的是为了考察外来语素,着眼点在单个的汉字,只要词的内部有一个构词成分是外来的,某个汉字是单纯用来记音的,都计算在范围之内,如“迪斯科舞综合症”“京剧迪斯科”。这样它的范围比通常理解的要宽些。876条外来词在16种词典中重复出现的次数,其分布情况与总体分布大体接近。 把876条外来词切分成一个个单字,共有557个汉字(不包括英文字母)。这是一个很有价值的数字,因为如果有外来单音语素的话,肯定出现于其中。 557个汉字在所有的新词语中共构词52030条(次)。这个数字比30327多,是因为有的一条词语用到了几个汉字的缘故,如“大包大揽”、“大男大女”,每条用了两个“大”字。构词最多的前五位是“人924、会848、大834、工735、三728”。这一统计数字显示出汉字一般性构词的能力,而本文更关心的是下面这组数字。 557个汉字中属于记音性的汉字只有186字。如“艾滋病”,里面用了3个汉字,但属于只用于记音汉字的只有“艾”“滋”两字,“病”用的是汉字原有的意思,不属记音用字。186个汉字共构词1159条(次),这个数字比876多,其原因如上。如“京剧迪斯科”,里用了“迪”“斯”“科”三个记音汉字,分别记在三个字下面,一条就变成了三条。构成外来词最多的前五位是“斯55、尔51、克40、巴37、尼35”。这186个汉字对本文有着重要意义,因为它直接表示出判定单音外来语素的范围(见附表)。之所以说它只起到指示范围的作用,是因为这时还不能说它们就是单音外来语素,还得分辨每个字在其中起着怎样的作用。区分它们是一个单纯表音的汉字,还是单音语素,主要就是看它是否已经具有了表示固定的、单一的语义对象的功能。这里有两条标准,一条是句法标准,即“独立使用”;另一条是词法标准,即“重复构词”。 (责任编辑:admin) |