二 表音文字中的语义、语法编码 我们这里首先来分析一下决定一种文字是否容易阅读的基本原理。 首先要承认,拼音化应该是语言的书面编码的主要形式。事实上这已经是世界文字的主流。不过,现行各种主要拼音文字中,虽然以表音为主,但其文本中其实都包含了大量语义、语法信息,而这一点往往被忽视。 语义信息和语法信息,两者界限不是绝对的,如专有名词首字母大写,可以说是语义信息,但由于“专有名词”是个语法范畴②,因此也可以看作一种语法信息。但句首字母的大写,表示一个作为语法单位的句子的开始,完全是种语法信息了。 以英语为例,语义信息主要是同样的语素写法相同。英语中,同一个语素,可以有不同的变体,如capable跟capacity中的同一个词根语素cap,读音差别很大,但写法相同。法语语素的韵尾辅音,往往在条件变体中不发声,但书面上仍然要写出。这里反映了“语素拼写同一性”的原则:同一个语素的不同形式变体,尽量反映出其同一性。显然,这个原则跟“表音精确性”原则有冲突,但从认知上看,对阅读理解有帮助,对于计算机的自动处理也有帮助。即使不是文字而仅仅为注音工具的汉语拼音,处理儿化字时也同样遵循这个原则,如“盖”和“干”的儿化“盖儿”和“干儿”实际发音都是gar,但是教材一般都依据原字发音分别写成gair和ganr。 在书面表达中,语法信息的表达首先是标点符号,这是所有现代文字都采用的语法信息编码。标点当然也反映了节律停顿这一语音信息,但远不止于此。首先,一些没有停顿的地方也有标点,如书名号、专名号、着重号等。其次,不同标点的分化并不完全按照停顿大小,而主要是根据语义、语法功能。 标点之外的语法信息,以英语文本为例,其中的语法信息主要是句首字母和专有名词的首字母大写。此外,德文中则所有名词都大写。日文用汉字表达一般实词,用表音的片假名表达西方借词(主要是专有名词和科学术语),用平假名表达各种虚词(格助词、各种后缀、语气词等等)。此外,日语中宾格助词发如お/o/,但用没有其他用处的假名を(历史上代表/wo/音,但现代日语也发成/o/了)专职表示,也有增加语法信息的作用。 阿拉伯语文本这方面很有趣,以辅音字母为主,元音用小点、小圈加在辅音字母上下方作为辅助形式,且常常省略,如。这其实也是反映语法信息的一个手段。因为阿拉伯语中词根由辅音串构成,元音主要表示形态和词缀,基本上是虚词性质的。例如表示“书写”这一概念的词根,其基本音素是k-t-b三个辅音,填进不同的元音或附加词缀后,构成kataba(他写了)、yaktubu(他正在写)、uktub(你写!命令式),以及名词性的katib(书写者、作家、文书)、kitab(书、经、作品)等。这样,辅音表达主要的词根词汇信息,而元音表达次要的词缀语法信息;两者分别用高低、大小不同的字母表示,能够明确反映词根的连续性、整体性和同一性,便于读者一目了然地区分词汇信息和语法信息。但是阿拉伯文采取不同高低的二维形式,又跟口语语流的一维形式不一致。阿拉伯文如果采用字母一维线性排列格式,又要保留这种区分词根和语缀、虚实分明的处理格局,笔者认为就应该如上面例子所显示的那样,把作为词根的辅音字母串用粗黑体印刷,而作为语法标志的元音字母用细、浅一些的字体印刷。这样虽然不能维持词根辅音串的整体性,但至少凸显了这些辅音之间的密切关系。 (责任编辑:admin) |