另外,经过如此标注的语料还可以使用有关软件自动进行语法切分(parsing),生成句子结构树形图,揭示短语结构关系。(图4为上一例句的横式树形图,系由伦敦大学的大学学院高级研究员Alex C.Fang先生研制的软件自动生成。) 图4 语体分析 最基本的方法是利用电脑的强大统计功能,提供有关词语在书面语材料和口语材料中出现的频率。至于词语的其他语体特征和修辞用法,机器是很难识别的,目前只能依靠人工分析。《朗文当代英语词典》(1995年版)已经将有关单词在口语和书面语中的使用频率在词典条目中加以图示(见图5),能够指导读者从修辞的角度正确使用词语。 搭配分析 搭配信息也是非常重要的语言使用信息。对于学习外语的人来说,这方面的信息对于解决语言表达问题具有非常重要的指导意义。《朗文当代英语词典》(1995年版)已积极利用电脑的自动分析处理功能,采集有关数据,在词典中展示出来(见图6)。 语义分析 如果能按照词义检索例句,词典编纂则更加方便。然而词义自动分析目前尚无可操作性强的客观标准,没有取得突破。将来的解决方案可能是给语料库中的多义词标注义类(semantic categories),因为义类的概念在1995年出版的《朗文当代英语词典》和《剑桥国际英语词典》中已经积极应用。例如,《剑桥国际英语词典》把make分为如下义类: 毫无疑问,语料库的使用价值取决于语料分析的深度。因此,很有必要大力加强自动化语言分析研究,拓展语料库的服务功能,提高语料库的使用效率。 (责任编辑:admin) |