论文作者简介: 姜永常,知识经济与服务创新研究所所长,副研究员,E-mail: 101357@hrbcu.edu.cn; 金岩,馆员。 基金项目: 本文系国家社会科学基金项目“知识构建范式演进及其服务创新研究”( 项目编号: 12BTQ044) 研究成果之一。 本文的核心观点是,知识构建(knowledge architecture,以下简称KA)中全信息的获取和利用能够保障KA能力的生成与生长,全信息获取的方法首先要以人机协同作为指导思想,其次要基于自然语言进行KA的全信息提取和深度理解,构建KA的全信息知识库,从而进一步构建CI-WEB,提高KA用户的知行能力。 文章结构如下:1、引言;2、全信息在知识构建能力形成中的作用;3、知识构建中全信息获取的方法论;4、知识构建中基于自然语言理解的全信息获取;5、知识构建中基于自然语言理解的全信息利用;6、结语。 全信息与KA之间有何关系?二者之间是如何相互作用的?文章认为KA用户的知行能力的形成过程中包含了隐性智能生成的主观世界和显性智能生成的客观世界,这两个世界相互联系,共同作用,支持了全信息的获取和利用。反过来,全信息的获取与利用能够保障KA能力的生成与生长。 全信息对KA能力的生成的作用主要体现在,首先,用户在全信息获取利用的基础上生成隐性智能,其具体过程主要是用户形成每个要解决问题的具体目标后,把获得的信息转化为自己求解问题的基础意识能力、情感能力、理智能力、隐性智能策略和行为等智能。其次,在这些隐性智能支持的前提下,用户有意识地从KA系统中获得主观知识,并且结合客观知识,以目标为导向形成解决问题的显性策略。 全信息获取不仅能够促进KA能力的生成,还能够促进KA能力的生长。这主要表现在,用户在获取知识过程中主观世界和客观世界之间不断相互作用,从而显性智能和隐性智能形成和谐发展。而用户不断地根据新的问题反复地进行“意识-情感-理智”和“信息-知识-智能”的转换,在这一过程中,用户的显性智能和隐性智能就得到了循环生长。 文章接着论述了在KA中全信息获取的方法论,文章认为人机在全信息获取中各有所长,因而人机协同的全信息获取方式应该成为最佳的指导思想。在这一思想指导下,Web2.0可以使人成为KA的适应性主体,而不仅仅只是知识的受体,从而实现人机知行交互。 在此思想的指导下,文章指出,KA中的全信息获取应该以自然语言理解为基础,这是因为自然语言是人们进行全信息获取的主要媒介。人主机辅的综合集成的方法,可以在人机协同的基础上,对规则方法和统计方法取长补短地进行利用,从而使计算机完成自然语言的表层处理和常规分析,使人完成对自然语言的深层分析,提高KA系统获取全信息的效率和质量。 文章接下来以语句为例来分析KA全信息提取的过程,这一过程具体表现为,通过对自然语言分析和语句的结构、逻辑和价值分析,实现提取自然语言的语法、语义和语用信息。另外,文章以“梨”信息的提取为例,说明了全信息词典是如何获取自然语言的语法、语义和语用信息的。 构建全信息词典固然为机器理解自然语言奠定了基础,然而全信息知识库更是KA的现实需求。KA全信息知识库的构建分宏观和微观两种方式,宏观上可以根据规则方法形成知识单元的信息谱,而微观上则是在信息谱的基础上运用统计方法分析和提取信息谱的语法、语义和语用信息,从而判断出每个主题下的相应的知识单元的全信息,并且和整体文本进行有机关联,最后将所有信息进行储存。 在Web2.0、人机交互和全信息知识库的支持下,KA可以理解一定的自然语言序列,并且能够和用户进行交互,在此基础上,构建CI-Web就可以完成“人主机辅”的知识处理;CI-Web更能够解决领域广度和理解质量不可兼得的矛盾,使KA用户在群体交互与协作中进行全信息交流和利用。KA的CI-Web建构的过程需要经历个体CI-Web 构建、主题 CI-Web 构建、学科CI-Web构建到科学CI-Web构建的过程。 那么,CI-Web具体如何构建?文章认为,首先其内部结构基础应是同类型词语在自然语言的信息表达中的不同分工和彼此配合,以及这种配合形成的逻辑结构框架。以此为基础在具体实施上应该通过物联网将机器人、多传感器以及其他操作功能纳入KA系统之中,并且在Internet中配置传感器和语法、词类识别的控制模块,在语言关联结构构建CI-Web基础上,完成从CI语法关联层、CI语义关联层、CI语用关联层到CI-Web呈现层的整个过程。 (本文刊于《图书情报工作2015年3月第6期》) (中国社会科学网 张卓晶) (责任编辑:admin) |