我国辞书编纂很早就重视书证的使用。据有关学者统计,《说文解字》中引用儒家著作的词句就达1085条,《康熙字典》中的书证则更为丰富。20世纪出版的《辞源》《汉语大词典》等严格遵循历史主义原则,在书证使用方面提出了更为严格的要求,对忠实记录祖国语言历史、展示词义演变过程起到了积极的作用。(关于书证的作用和选配,详见李开《现代词典学教程》第328-339页。) 进入计算机时代,词典编纂中语言材料的准备一般通过建立大型语料库来完成。早在20世纪60年代,英国伯明翰大学英语系就意识到计算机技术对语言研究的巨大辅助作用。他们首先建立OSTI项目,把13.5万单词的非正式会话语料整理成电脑数据,研究词汇搭配问题。70年代添进3.5万单词的课堂会话、100万单词的应用科学文字资料和75万单词的经济学文字资料。随后发现,百万单词量的语料对于句法研究来说可能足够了,但对于词汇分析和语义研究来说是远远不够的。进入80年代,他们与柯林斯出版公司合作,建立了“英语语料库”,逐步扩充到2亿单词的规模。在此基础上开发了一系列英语学习词典、用法词典、语法书籍及其他英语学习书籍。 20世纪90年代初,牛津大学出版社、朗文出版公司、钱伯斯-哈勒普出版公司与牛津大学计算机中心、兰开斯特大学、英国图书馆通力合作,在英国工贸部以及工程与自然科学研究委员会的资助下,建成了“英国国家语料库”(British National Corpus,简称BNC),所收语料总量达1亿单词。1995年问世的新版《牛津高级学生词典》《朗文当代英语词典》《钱伯斯基础英语词典》均使用了这个语料库的最新资料。从1994 年开始, 该语料库及其检索软件SARA (SGML Aware Retrieval Application)就制成光盘,向欧洲发行;2000年开始, 这套软件的第二版已授权牛津大学人文学科计算机中心向全世界发行。 毫无疑问,在电脑设备大为普及、语料库技术比较成熟的今天,词典编者如果不重视语料库建设,收词释义仍因袭旧作,例句仍随意编造,那显然是不妥的,是与现代词典编纂的科学性要求相差甚远的。 (责任编辑:admin) |