语言文学网-学术论文、书评、读后感、读书笔记、读书名言、读书文摘!

语文网-语言文学网-读书-中国古典文学、文学评论、书评、读后感、世界名著、读书笔记、名言、文摘-新都网

在博客上研究词汇问题(12)

http://www.newdu.com 2018-01-20 冯志伟文化博客-新浪博客 冯志伟 参加讨论

    如果使用一个以上的特征,那么,线性模型的能力就会真正强大起来,这种使用多个特征的线性回归叫做多元线性回归(multiple linear regression)。 
    房屋的最终价格大概还依赖于很多其他的因素,例如,当前的房屋抵押率、市场上未售房屋的数量,等等。可以把这些因素作为变量来进行编码,每一个因素的重要程度就是这些变量的权重,如下面的方程所示: 
    价格 = w0 + w1*形容词数量 + w2*抵押率 + w3*未售房屋数量 
    在自然语言处理中,常常把像“形容词的数量”或“抵押率”这样的用于预测的因素叫做特征(feature)。用这些特征的矢量来表示每一个观察(每一套待售的房屋)。 
    由此可见,词汇不仅在语言中具有举足轻重的作用,词汇还是社会生活的一面镜子,具有非常丰富的社会内容,我们可以从词汇中发现并挖掘出很多知识来,从而从词汇来观察社会。 
    参考莱维特(Levitt)和杜布尼(Dubner)在《魔鬼经济学》中的这段有趣的叙述,我在2011年5月16日的博客中写了博文《从用词中挖掘知识》(http://blog.sina.com.cn/s/blog_72d083c70100qwdq.html)[5],在这篇博文中,我强调说明:“词汇中包含着非常丰富的内容,从中我们可以发现挖掘出很多知识来。在自然语言处理中,我们千万不可忽视词汇的研究。”  


    网友们热烈评论我的博文,他们说,没有想到广告中的用词竟然会影响到房地产销售的结果,语言的词汇是多么的重要啊!  
    在网友们的评论和鼓励下,我对于词汇研究的兴趣更加高涨了,为了在理论上加深我对于词汇重要性的认识,我又进一步从众多的文献中考察了前辈语言学家对于词汇研究重要性的论述。  (责任编辑:admin)
织梦二维码生成器
顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
栏目列表
评论
批评
访谈
名家与书
读书指南
文艺
文坛轶事
文化万象
学术理论