语文网-语言文学网-读书-中国古典文学、文学评论、书评、读后感、世界名著、读书笔记、名言、文摘-新都网移动版

首页 > 学术理论 > 语言学 > 词典学 >

语料库驱动词典学、语料库词典学与语料库辅助词典学——论语料库在注释专科术语词条时的局限性(6)


    六、专家参与编纂词典
    下文讨论奥胡斯大学词典学研究中心在编纂专科词典和普通词典时是如何选条和撰写术语释义的。例如,在编纂《音乐词典》时,除了一般概念的阐释,音乐家Inger Bergenholtz承担了所有的工作,包括挑选术语词条、撰写释义、改编释义使其适合音乐学院的学生和对音乐感兴趣的外行理解。词典选条时,作者并未依赖语料库,而是如Bergenholtz & Tarp(1995:93)所荐,参照了音乐教材和音乐手册上的目录。该词典的理念是帮助用户阅读文本和拓展知识,因此词条内提供了长短两类释义。简短的释义是可视的,用户阅读文本时只需参照简短的释义。详细的释义则以折叠的方式隐藏,供那些想了解更多知识的用户使用。下页图3展示的是词条cello完全展开的内容。
    另一个例子是奥胡斯大学词典研究中心编纂的《基因工程百科词典》。这部纸质词典是丹麦、古巴的词典学家和专家共同合作的成果。该词典为多功能性词典,目标用户包括半专家,见识广泛的外行(Tarp 2005)。编纂者在挑选术语时参考了已出版词典的词条、索引及西班牙语和英语分子生物学文本。这些文本是根据Bergenholtz & Pedersen(1994)提出的标准挑选的。选条(对等语)由经过词典学专门训练过的专家完成(Bergenholtz,Kaufmann & Tarp 1994)。下文以词条gene中的释义为例进行讨论。这一词条包含了用以帮助文本产出和翻译的语言信息,不过在例子中并未显示。
    gene A gene is a DNA sequence encoding a protein.tRNA or rRNA.For eukaryotes a gene can also be defined as a transcribed DNA sequence or transcript unit.In prokaryotes two or more proteins are often encoded in the same transcription unit,and such a transcription unit plus its associated regulatory sequences is termed an operon.
    这条释义和其他的释义都是分子生物学专家和词典学家反复讨论后撰写的,力图符合目标用户的特点。词典学家认为应该使用大众化语言,但是专家们却担心大众化的语言会影响释义的科学性。最后,双方达成一致,根据目标用户的特点来决定用哪种表达方式撰写释义。在词典编纂过程中,专家们并未查询语料库来撰写释义。当然编纂过程中,词典学家曾利用语料库协助选条、挑选搭配和使用实例等。
    相对而言,《丹麦语网络词典》是专为外行编纂的普通词典。下面是该词典中丹麦语单词gen(基因)的两个释义,一个释语偏科学化,另一个释语偏大众化。
    
    1.arveligt anleg,som knytter sig til kromosomer i mennesker og dyr
    2.tendens til eller disposition for noget bestemt
    1.hereditary systems related to the chromosomes in female or male sex cells in human beings and animals
    2.tendency or disposition for to like to do something
    这两个释义中,第二个释义是分析语料库得来的,第一个释义是词典学家根据所具备的专业知识撰写的。这种注释方法似乎和上文所讨论的英语词典的释义方法不一样。
    本文开头质疑了Lees和Itkonen对语料库的否定看法,认为事实并非如此,语料库对于词典学有巨大的实用价值,许多词典编纂都要求以语料库为实证。然而,本文也发现Lees和Itkonen看似武断的说法也有几分道理,因为语料库分析的结果也有可能不准确、有误导性。虽然这些问题多出现于普通词典领域,但是也和专科词典研究息息相关。简而言之,专科词典选条和释义有两种方式:一方面,词典学家可以在语料库中搜寻相关的术语和释义;另一方面,可以让专家(经过基本的词典学训练后)来做此类工作。只有当专家根据个人从事的专业领域的知识来评判语料库中的数据时,语料库才能在词典编纂的挑选数据阶段有所帮助。
    词典学家或者术语学家通过查询语料库来确认某个术语是否正确的做法是不可取的。学科专家们可以立即判断该术语是否正确或者是否与某个学科有关,但是外行(例如词典学家或者术语学家)则可能意识不到某些术语应该属于某一学科范畴,因此会忽略许多术语词汇及相关的搭配组合。另外,语料库里的释义有可能过于陈旧、不正确或者不相关。专门建立一个即时的专科语料库也不太可行,因为释义常常受语境所限而不全面,只有专家才能判断实情。经常有言论称,使用语料库是为了证实收录在专科词典中的术语和释义的真实性。很明显,用户总是想要知道他们是否可以信任这类词典里的信息。然而,语料库既无法确保这些术语适用于某一部待编词典,也无法判定其中释义的质量优劣。
    一般说来,编纂一部专科词典最好在两年内完成,以避免在完工之前前期工作成果已过时。对于那些在两年内无法完成的大型词典的编纂,建议分模块进行,例如按词典功能分步编纂,或者是按信息类型分步编纂,同时按照学科变化(诸如科技创新、发现和现行法律的修订等)来修订已经完成的部分。但是,只有具备基本专业知识的专家才能完成这样的工作。毋庸置疑,语料库可以协助词典学家完成相当一部分词典编纂任务,但是,人在词典编纂过程中的积极因素不容忽视。“语料库驱动词典学”或者“以语料库为基础的词典学”的说法和看法有待商榷。相较之下,“语料库辅助词典学”的说法更为准确地描述了语料库运用于词典学的现实。 (责任编辑:admin)