5 词汇的地域变异与语义知识的表达 地域词汇的变异尽管纷繁,语义知识的表达原则却是可以确立的。汉语语义知识系统目前只有少数几个。应用发展方面还待开展。词汇语义的描写应该有多精细,目前还没有答案。笔者对知网比较熟悉,就此略作讨论。Gan & Tham (1999) 曾利用中国董振东先生建立的知网来标注取自台湾中央院语料库的语料(一般性内容),发现地域概念的增补并不困难,毕竟地域词汇的变异还是在人类知识的有限范围之内的。这也说明知网的义原还是可靠的。我们可以通过这篇文章里所引的对人工标注误判例子的纠正看到知网的语义概念有其精细之处,如: 例句:上次扫黑行动中的漏网之鱼 概念“上”误判为时间观念(属性值,时间,近,昔,),实际上是指序列中的一点,应定义为:“属性值,次序,前,“。 例句:将两百万元现款交到位於桃园县芦竹乡…八十六巷内一部废弃小货车内。 概念“将”误判为{content};正确定义:{possession} –可以通过“交”的概念检查出来。“交”属于变领属关系中的细类,动态角色订为:agent, possession, target。[2] 在分辨近义词方面,知网的定义描述有点意思。以上文所举的“侧目”例。词典里边的释义有比较复杂的色彩,知网2000版只是按概念定义为“Look|看{agent, content}”。由于区域用例含有“注目”之意,我们查到知网2000版的“注目”也是定义为“Look|看{agent, content}”。不过那是概念上的同义,两者的英文对应并不同: 侧目的英文对应词-glance (N, V) 同义词:侧目 注目的英文对应词-fix one's eyes on; gaze at 同义词:盯(+stare at),盯着(+stare at),注目 似乎已经从概念上粗略处理了“侧目”一例的词典释义和实际区域用例的矛盾。而进一步从英文对应词来复查,我们发现glance, fix one's eyes on, stare at 在知网2000版里也定义为Look|看,可是“gaze at“ 则多了一个概念:Look|看,manner=attentive|细心。侧目和注目在某种意义上的差别还是显示了。 董振东先生在发给笔者的一则电邮中指出知网是概念之间的网络,不涉及具体语言的用法也不涉及语用的[3]。 这和强调结合语义和语法进行描述的系统,诸如台湾的MARVS(张丽丽等,2000;Huang et al., 2000)大相径庭。尽管如此,两者仍然有互补之处。如MARVS从语料库大量检索例证,通过同义动词对比的方式得出的部分结论和知网的相关参与角色定义是一致的: MARVS 例:“高兴”“快乐” 快乐:经验者 => 只带一个论元 高兴:经验者、事因 => 句宾 知网: 快乐:1. aValue|属性值,circumstances|境况,happy|福,desired|良 2. Joyful|喜悦 {experiencer, ~degree, cause} 高兴:1. aValue|属性值,circumstances|境况,happy|福,desired|良 2. Joyful|喜悦 3. willing|愿意 {experiencer, content} 我们希望依据地区语料进行的词汇语义研究可以根据不同的思路继续探讨,等这些系统比较成熟时,我们就可以通过比较看出地域词汇变异的各种形式如何启发最终的语义知识描述架构的建设。 主要参考资料: 1.张丽丽、陈克健、黄居仁《汉语动词词汇语意分析:表达模式与研究方法》,2000, Computational Linguistics and Chinese Language Processing. Vol 5:1:1-8. 2.张普《信息处理用语言知识动态更新的总体思考》,《语言文字应用》2000年第2期,页42-9。 3.Huang, Chu-Ren, Kathleen Ahrens, Li-Li Chang, Keh-Jiann Chen, Mei-Chun Liu and Mei-Chi Tsai. 2000. “The Module-Attribute Representation of Verbal Semantics: From Semantics to Argument Structure.” Computational Linguistics and Chinese Language Processing, Vol 5:1:19-45. 4.Huang, Chu-Ren, Keh-Jiann Chen and Zhao-Ming Gao. 1998. “Noun Class Extraction from a Corpus-based Collocation Dictionary: An Integration of Computational and Qualitative Approaches.” In B.K. Tsou , SWK Chan & E.S-Y Wang. (Eds), Quantitative and Computational Studies on the Chinese Language. Hong Kong: LISRC City University of Hong Kong. 5.Gan, Kok Wee and Wai Mun Tham. 1999. “General Knowledge Annotation Based on How-net.” Computational Linguistics and Chinese Language Processing, Vol 4:2:39-85. 6.刁晏斌,2000,《差异与融合--海峡两岸语言应用对比》,南昌:江西教育出版社。 7.张志毅、张庆云,2001,《词汇语义学》北京:商务印书馆。 8.Hownet 2000 版,www.keenage.com 9.中华民国教育部《重编国语辞典》修订本光碟第三版. 2000. 10.中研院平衡语料库网上版http://www.sinica.edu.tw/ftms-bin/kiwi.sh 。 11.香港城市大学语言资讯科学研究所LIVAC共时语料库网上版http://www.rcl.cityu.edu.hk/livac/chinese/index.htm。 [1] 知网2000版中的“抓”和catch 的对应有两个:1. 捉住。2. 捉住,警。例(5)的上半句有“办体育”,这个“办”,根据知网2000版,可以定义为“管理,商”,那下半句的“抓选才,抓教练”的“抓”就不会是和catch 相对应了。 [2] 此文用的是旧版知网。知网2002版的概念定义已经改用显性的树状描述。如:病:{desease|疾病}{phenomena|现象:{doctor|医治:content={~}}, {SufferFrom|罹患:content={~}}, RelateTo={medicine|药物}{Health|健康}{HealthValue|健康值}, domain={medical|医} [3] 这是知网和格语法的不同之处。格语法所描述的格只限于句法层面上能和法出现的格。知网考虑的是一个事件中可能有的参与者以及这些参与者在有关事件中所担任的动态角色。参阅Gan & Tham (1999), p.42.
|