语言文学网-学术论文、书评、读后感、读书笔记、读书名言、读书文摘!

语文网-语言文学网-读书-中国古典文学、文学评论、书评、读后感、世界名著、读书笔记、名言、文摘-新都网

第四范式:语言研究的新理念(7)

http://www.newdu.com 2017-11-16 《英语研究——文字与文 徐盛桓 参加讨论

    第三,从关注精确的认识转变为注意概貌型的发展趋势。大数据的规模大、内容杂乱,使得不易一下子进入精密、细致、确切处理的程序;作为思维发展的主流模式可以是首先把握数据主体所显现出来的倾向性的发展方向,这一发展方向可为下一步更深入、更精密的研究打下基础,所以作为对大数据的考察,需要从追求精确的认识转变为认识其概貌型的发展趋势。但是,在某些具体的研究中,只是注意研究对象的概貌型发展趋势不是研究的最后目标,进一步的目标应是追求有确定意义的知识。意大利信息哲学家Luciano Floridi说:“大数据的真正功能不在其大,而在于如何能够为从一定量的数据中挖掘出具有规律性的小规模的数据做出贡献。”(Floridi,2012:436)要能这样做,还有一些事情要做,其中最关键的是进行数据挖掘(data mining)工作。数据挖掘就像深入矿坑采矿那样,它不是无中生有的魔术,也不是点石成金的炼金术。若没有足够丰富完整的数据,是很难期待挖掘出什么有意义的信息的。因此,数据大是前提,在此前提下进行数据挖掘的工作以期“从一定量的数据中挖掘出具有规律性的小规模的数据”,是大数据时代研究工作的一种重要形式,就是通过数据挖掘,使有关的数据更能提供精确的认识。但是,这两种认识并不对立、矛盾,通常只是认识的深度、广度不一样,而且很多时候并没有明确的区分。
    研究对象所积聚的大数据集合,是对这研究对象从生成、积累到发展壮大的历时过程的表征与映射。它作为以数据形式出现的科学研究对象,既是以数据表征的真实世界的表象,又是以数据为基底的知识发现的媒介;换句话说,它一身二任:既是世界样貌意义上的表象,又是知识表征意义上的表象,我们的研究就是要通过这媒介进入到作为研究对象的真实世界,研究方法最基本的特征就是“让数据说话”,从数据丛林里找背后的规律。大数据知识发现路线图就是:对象—数据—知识。
    大数据蕴含一个知识发现的特征:“可寻获度”(findability)(Morville,2005:28),研究就是从大数据寻获所蕴含的关联性规律的信号。利用大数据的“可寻获度”进行大数据的语言研究,“寻获”一要依靠技术、二要有认真的研究态度。建立大数据的语言材料语料库和“e-研究”所需的语言研究信息的数据库,和使用这些语料库数据库,都要有一定的技术。这是语言研究工作者学习后可以掌握的,在大数据时代这是语言研究工作者的工具,值得花时间去掌握,但这些技术的学习不是本文要讨论的。本文要强调的是认真的研究态度。海量的数据要求研究者要有很强的问题意识。“让数据说话”是需要引导的,引导它往所研究的问题上说,按照所研究的问题去挖掘、寻获的。这就要求研究者有最大限度地利用可能的资源的能力。事实上,电子检索永远无法代替阅读,而问题意识永远是研究的第一思索点。电子数据库会使学术研究提升到一个新的层次,但很多复杂的数据处理问题仍然需要动用学者所有的学术积累来完成。构建知识地图最重要的途径还是语言以及其它相关知识的功底。在大数据时代,在第四范式的推动下,语言学研究不仅取决于研究者使用数据库的水平和熟练程度,更重要的是要有成熟的研究理念和认真的求索精神。
    该文章系2016年5月14日河南信阳召开的第七庙全国语言教育研讨会上主旨发言。
    原文参考文献:
    [1]Floridi,L.Big Data and Their Epistemological Challenge[J].Philosophy and Technology,2012(25):435-437.
    [2]Hey,T.Jim Grey on eScience:A Transformed Scientific Method[G]//Tony Hey,Stewart Tansle & Kristin Toll(eds.).The Fourth Paradigm:Data-Intensive Scientific Discovery Washington /Redmond:Microsoft Research,2009.
    [3]Mayer-,V.& K.Cukier,Big Data:A Revolution That Transforms How We Work,Live,and Think[M].London:John Murray Publishers,2012.
    [4]Morville,P.Ambient Findability[M].CA:Sebastopol,O'Reilly Media,Inc.,2005.
    [5]段伟文.大数据知识发现的本体论追问[J].哲学研究,2015(11):114-119.
    [6]库萨的尼古拉.论有学问的无知[M].尹大贻,朱新民,译.北京:商务印书馆,1997.
    [7]孙闰松,等.AlphaGo并非革命性突破但展示了人工智能通用性[J/OL].[2016-04-06].http://qh.1732.com/Article/qihun/news/news/201604/13877.htm.

(责任编辑:admin)
织梦二维码生成器
顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
栏目列表
评论
批评
访谈
名家与书
读书指南
文艺
文坛轶事
文化万象
学术理论