语言文学网-学术论文、书评、读后感、读书笔记、读书名言、读书文摘!

语文网-语言文学网-读书-中国古典文学、文学评论、书评、读后感、世界名著、读书笔记、名言、文摘-新都网

系统中的对立———谈现代语言学的理论基础(14)

http://www.newdu.com 2018-01-20 《当代修辞学》2015年第 陈平 参加讨论

    根据该语料库的检查结果,与“粥”搭配性最强的有两个词,一是“吃”,二是“喝”,“吃粥”的搭配性反倒强过“喝粥”,这个结果同我的预想不一样。我的语感是北方人,尤其是北京人一般都说“喝粥”。我判断这个现象至少可能由两个因素造成,一是“喝粥”是个比较口语化的词语,该语料库所收文本以书面语语体为主,口语化程度不高;二是许多文本的作者为南方人。这再次提醒我们,分析系统中的对立成分时,该系统的范围和性质对于分析结果会有很大的影响。 
    搭配问题很值得我们深入研究,它有很高的实际应用价值,也有很重要的理论价值。先说实际运用价值,搭配在外语教学和计算机自然语言处理领域里占据十分重要的地位。我们读学生写的外语作文,一般只要五分钟,便能看出他们语言水平的高低。一般不是看语法,现在有语法检查程序(grammar checker)能自动改正语法错误,主要看词语搭配,一般情况下,没有十年二十年的功夫,很难达到接近本族人语感的那个水平。研究搭配问题,应该会大大有助于我们的语言教学。 
    IBM公司八十年代投入大量资金,研究包括机器翻译在内的计算机自然语言处理。研究人员当时主要分两大类,一是语言学家,二是计算机技术专家。语言学家一般走的是自五十年代开始的老路,根据语法/语义/词汇的有关规则,将文本分解成词、短语、句子等语言单位进行加工处理。计算机技术专家大都熟悉数据库技术和统计学工具,对语言学家的语法规则不感兴趣,惯用方法往往是利用统计学工具分析海量的双语数据库,以词语搭配和对应频率等统计数据为基础进行语言处理。语言学家所用方法进展缓慢,而随着计算机储存和处理能力的突飞猛进,基于大数据统计方法的语言处理系统效率越来越高,现在成了该领域里的主流,而基于传统语言规则的处理方法则被许多人摈弃。九十年代IBM负责机器翻译的Frederick Jelinek据说说过一句后来广为流传的话:“我每解雇一位语言学家,我的系统表现都会有所改善。”  (责任编辑:admin)
织梦二维码生成器
顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
栏目列表
评论
批评
访谈
名家与书
读书指南
文艺
文坛轶事
文化万象
学术理论