3 类型学相关性的考察结果 我们在WALS Online数据库中关联Maddieson(2013)和Dryer(2013a,b)的数据,考察声调系统类型和是非疑问句表达类型交互作用的结果,最终得到表2,共计260种语言,具体语言样本见文末附表。 表2中并非标准的抽样调查数据,既没有排除谱系、地理等干扰因素,也没有进行多次抽样,因此我们并不能简单地利用卡方检验(Chi-Square Test)或费舍尔精确检验(Fisher Exact Test)来考察相关性。类型学数据一般都无法满足这些检验的基本要求,即样本之间应当相互独立。(详见Dryer 1989,2003的讨论) 我们期待用类型学数据反映语言系统内部不同结构特征之间的关联,因此应当(尽量)避免语言样本在谱系和地理方面的偏差。WALS Online数据库的创建目的之一正是为了满足考察类型学相关性的需要(详见Haspelmath et al.2005序言)。对于样本的谱系归属,我们以WALS Online数据库中标注的“语族(genus)”为准,不同语族之间分离的时间(据推测)不超过3500年或4000年,这一谱系分类考虑到语言样本在时间深度方面的跨语言可比性。对于样本的地理归属,我们以WALS Online数据库中标注的“宏观区域(macroarea)”为准,将全球分为六个相对独立的区域:非洲、澳洲、欧亚大陆、北美洲、南美洲、巴布亚—南岛区域。附表中详细标注了260种语言样本的谱系、地理归属。 至于类型学相关性的检验方法,根据Dryer(1992,2003,2009)的论述,分别统计六个宏观区域内特定的语族样本数目后,如果范畴交互的结果在六个独立区域有一致表现,那么可以认为两个变量之间存在统计上显著的类型学相关性。其原理好比掷硬币,每一个独立区域内范畴交互的结果代表一次掷硬币结果,如果两个变量无关则六次掷硬币结果完全相同的概率很小。下面根据我们的考察结果,对声调、语调、语气词两两之间的类型学相关性分别进行讨论。 (责任编辑:admin) |