语言文学网-学术论文、书评、读后感、读书笔记、读书名言、读书文摘!

语文网-语言文学网-读书-中国古典文学、文学评论、书评、读后感、世界名著、读书笔记、名言、文摘-新都网

谈汉语中介语语料库的建设标准(6)

http://www.newdu.com 2017-11-16 《语言文字应用》2015年第 张宝林 崔希亮 参加讨论
 
    (3) 有声性与有图像性 
    这条原则针对口语语料库和多模态语料库的建设。与笔语语料库相比,口语语料库的价值在于:除了可以考察学习者口语中词汇、语法、语义、语用等方面的实际表现之外,还可以了解学习者实际的汉语语音面貌,可以对其进行声、韵、调等方面的考察与分析。多模态语料还有视频材料,可以对言语交际中的体态语进行研究。这是口语语料库和多模态语料库的最大特点。因此,口语语料库必须具备“有声性”特点,多模态语料库还须具备“有图像性”特点,配备与文本文件相对应的声音文件和视频文件,以满足语音和口语教学与习得方面的研究需要。(张宝林,2012、2014) 
    2.语料录入标准 
    为了保证语料的真实性,在语料录入阶段应采取“实录”原则,对语料中字、词、短语、句、篇、标点符号等方面的偏误及书写格式均须原样录入,不能做任何更改,以最大限度地保持语料原貌。对于笔语语料来说,错字是录入的难点,因为电脑字库中没有,无法直接录入。录入时可先以代码标示,后期加工时则应体现其原貌。对于口语语料库来说,在把口语形式的语料转写为书面形式的语料时,还应如实反映口语表达中的停顿、重复、语音偏误等。对于多模态语料库,还应描绘与口语交际相伴随的表情与肢体动作。 
    (三) 语料标注 
    1.全面性与相对性 
    作为通用型汉语中介语语料库,语料标注的内容越丰富、越全面,就越能满足各种基于语料库的研究需求。为此,应在汉字、词汇、短语、句类、句型、句式、语篇、语体、语义、语用、修辞乃至交际文化因素等各个方面、各种层面上对相关的语言文字现象进行标注,以保证语料库功能的全面,更好地为汉语教学与研究服务。(张宝林,2013) 
    由于汉语本体研究与习得研究的局限,所谓“通用型”语料库的建设也必然受到某些限制,难以做到百分之百的“通用”,因而语料标注又有一个相对性问题。例如语义问题,从某些实例来看,是应该也是可以标注的。以“时常在家里弄得乱七八糟”为例,“家里”并非动作的处所,而是动作的受事,因而是典型的语义问题,可以根据语义角色关系进行标注。但由于语义和语用在本体研究上的研究尚不够充分,有些现象难以区分,不易甚至无法标注。例如:“老师,你媳妇漂亮吗?”究竟是学生不了解该词含有的不严肃、不庄重之意而造成的语义偏误,还是其使用场合不对导致的语用偏误? 应该说都有可能,操作上应该如何标注似难把握。另一方面,这方面的“大多数问题都可转化为词汇、语法问题来解决”(侯敏,2013),例如前一例可处理为把字句的回避偏误,后一例可处理为词汇误用。在这种情况下,为了避免“不仅加大了标注员的工作量和工作难度,还会增加语料标注的错误率,影响语料库的信度和形象”(侯敏,2013) ,语义标注就应暂缓,待语义语用方面的相关研究取得进一步的成果后,再考虑其标注问题。交际文化因素的标注与此相类。 (责任编辑:admin)
织梦二维码生成器
顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
栏目列表
评论
批评
访谈
名家与书
读书指南
文艺
文坛轶事
文化万象
学术理论