语言文学网-学术论文、书评、读后感、读书笔记、读书名言、读书文摘!

语文网-语言文学网-读书-中国古典文学、文学评论、书评、读后感、世界名著、读书笔记、名言、文摘-新都网

系统中的对立———谈现代语言学的理论基础(13)

http://www.newdu.com 2017-11-16 《当代修辞学》2015年第 陈平 参加讨论

    如何确定词语与其他某个成分是否构成搭配?如何决定词语之间搭配性的强弱?我们只能根据“系统中的对立”来回答这些问题。首先,我们确定系统的范围,可以是包含各种文本的综合语料库,也可以根据时间、地域、体裁、作者、内容等等划出有关文本的特定范围;呈对立的成分,一是词语 a 和词语 x 从单纯概率分布来看应该在一定间距内共同出现的次数,二是它们在文本中实际共现的次数。为了举例说明,我利用英国 Lancaster 大学的汉语语料库(Lancaster Corpus of Mandarin Chinese),研究“吃”和“粥”这两个词与其他词语的搭配关系。该语料库目前开放给公众使用的部分共有100万字,由500篇文本组成,每篇文本约2000字。“吃”在这100万字的语料库中一共出现了478次,“粥”出现了18次,我将共现间距定在前三个字或后三个字,结果请看下面的表格: 
    
    先看表中给出的词频,“吃”在100万字中一共出现了478次,“饭”出现了100次;接着是预期搭配频次,指的是如果单纯根据概率,“饭”在“吃”前三个字和后三个字间距内出现的预期次数应该是0.286,一次都不到;再接着给出的是实际出现次数,高达45次,LL 是390.42,说明预期出现次数和实际出现次数的差异绝对不是偶然现象,这组数据就是“吃”和“饭”构成搭配的坚实证据。正是文本中预期同现频次与实际同现频次的对立,决定了两个词语是否构成搭配,决定了它们搭配性的强弱。同理,“亏”在100万字的语料库中一共出现了20次,根据概率分布,“亏”在“吃”的前三个和后三个字以内出现的次数应该是0.057次,0.1次都不到,但实际上出现了10次,LL为89.47,可见“吃”和“亏”也是搭配性很强的组合。其他三个与“吃“实际搭配次数最多的词分别是“粥”、“面条”和“药”。  (责任编辑:admin)
织梦二维码生成器
顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
栏目列表
评论
批评
访谈
名家与书
读书指南
文艺
文坛轶事
文化万象
学术理论