从教材的选字情况看,使用郭曙纶(2013:48-51)提出的方法,可以统计得出,《博雅》1045字中,有1024字属于国家语委1988年发布的2500常用字范围(见数据库附件2),重合率为97.99%。而依据汉语水平考试中心编制的《汉语水平词汇与汉字等级大纲》的划分标准,则可以统计出《博雅》1045字中汉字等级分布情况如表1所示: 数据显示教材所要求掌握的汉字符合“初级”标准,尤其是全部800个甲级字在教材中出现了725个。以上两种统计数据保证本研究所调查的汉字习得情况具有较大的普遍意义。 对于学习者而言,《博雅》全部汉字的习得是一个历时1年的过程,适合采用纵向研究,而为了结论的普适性,我们又希望数据来源于尽可能多的学习者。因此,研究采用跟踪多名个体学习者后再汇总数据的方式展开。我们将1学年分为四个时间段,分别在第一、第二学期期中考试后、期末考试后这4个节点,采用纸笔测试的方式进行数据收集。若一名受试完成整个测试过程(4个节点共8套试卷),则该份数据生效,登记为数据01-30中的一个编号。8套试卷的代号和对应的内容如表2所示: 试卷体例方面,认读卷(A卷,1A-4A见附件3)采用呈现单个汉字,请受试写出拼音并举一例(可以为生词、短语或句子)来说明其用法。例如: character pīnyīn word/phrase/sentence 包 ________ ________ 在计分时,还记录该受试未能得分的汉字属于认读错误(如将“白”认读为“百”)还是无法认读(留空白)。 而书写卷(B卷,1B-4B见附件4)则采用呈现一个生词的拼音和英译,请学生写出对应汉字的方式。例如: pīnyīn (translation) Character(s) lǎoshī teacher ________ 对于未能得分的汉字,记录其究竟属于无法书写(留空白)、错字(写成不存在的字符)还是别字(如将“体”写成“休”)。 我们花了3年多时间收集到30份完整的数据(全部来自非汉字文化圈学习者)。在手工批阅、校对后,将这30名受试的习得情况汇总输入SPSS软件,得到数据库的首批变量,包括:汉字(共1045字,即数据库包含1045项个案)、(该汉字)认读错误数、无法认读数、认读得分(=30-认读错误数-无法认读数)、空字数(无法书写)、错字数、别字数、书写得分(=30-空字数-错字数-别字数)。上述数据都是从30份完整数据中得到的。此外,对于单个汉字,可以进行多项属性的标注,这些我们将在第三、四部分中具体论述。 三 学习者汉字习得情况分析 3.1 数据分析 我们先来看看30名学习者的总体得分情况(总表见附件5)。因为以往的研究(如刘丽萍2008;王骏2009)多次证实,汉字的认读和书写无论从认知心理还是从实际掌握情况来看,差别都很大,所以我们依靠研究设计(AB卷)来分别观察这两者的实际情况。 数据显示,汉字认读方面,30名学习者的平均认读得分率(百分比)随时间推移逐步下降(见图1),其中1A-2A及2A-3A这两组数据对比呈现显著性差异,3A-4A这组对比则未呈现显著性差异。进一步分析发现,在4个时间节点上,学习者平均无法认读率呈逐步上升趋势(见图2),其中1A-2A及2A-3A这两组数据对比呈现显著性差异。此结果与前者一致。 (责任编辑:admin) |