语言文学网-学术论文、书评、读后感、读书笔记、读书名言、读书文摘!

语文网-语言文学网-读书-中国古典文学、文学评论、书评、读后感、世界名著、读书笔记、名言、文摘-新都网

当前位置: 首页 > 学术理论 > 书目文献 >

目录学的传统与继承——基于网络信息技术的认识

http://www.newdu.com 2017-10-30 中国文学网 陈文莉 参加讨论

    一 引言
    传统目录学和网络信息技术的关系是近年来学术界比较关注的热门话题,参与讨论的既有图书情报领域的业务人员,也有IT技术方面的行家里手。由于存在专业上的隔阂,在取得丰硕的研究成果的同时,也出现了一些似是而非的模糊认识。
    《搜索引擎:网络大百科的总目录》对目录学、网络信息资源有比较全面的认识,并对搜索引擎和目录的高度相关性给予了深入揭示。
    “目录学是研究目录工作形成和发展的一般规律即研究书目情报运动规律的科学。目录学的研究对象是文献目录工作,其目的是寻求以书目索引等作为连接日益增长的文献系统与用户系统之间桥梁的理论基础和技术手段,不断扩展和改进文献系统与用户系统之间联系的途径与方法,使任何文献能为任何需要者获得。”[1]
    “网络的发展,使得文献信息和其他形式的信息资源都呈现几何级数的增长。网络信息的范围、容量、类型都与传统的文献信息资源大不相同。目录学要继续在信息资源的组织和管理中有效地发挥作用,必然要适应这一变化。这对目录学提出了新的挑战和更高的要求。”[2]
    “对无序化的网络信息资源进行整理和揭示已经成为中国目录学研究的新任务。当代目录学研究的重点已由原来的书本式目录逐渐转移到网络信息目录工作及检索工具上来,也就是说,诸如数字化的数据库、控制网络信息的目录工具网络目录,以及相关的搜索引擎等先进事物,应当从现在起成为当代目录学研究的重要内容。”[3]
    搜索引擎与目录具有高度的相关性。目录的出现缘于与日俱增的图书数量,搜索引擎的出现缘于海量的信息。如果说目录是泛舟书海的向导、科学研究的指南,那么搜索引擎就是查询信息的门径、网上冲浪的导游,两者都是用户通向目的地的导航,都是开启智慧之门的金钥匙。如果没有目录与搜索引擎,读书治学则无从下手,丰富的信息也会沦为一片可怕的汪洋。[1]
    有学者将网络搜索引擎定义为“网络大百科的总目录”,但认为,搜索引擎作为网络信息总目录发挥重大作用的同时,也还存在着一些问题:首先,缺乏对经典网络资源与泛网络资源的区分;其次,搜索引擎没有可供浏览的系统层次结构,且其竞价排名机制导致了种种隐患。
    笔者认为,上述认识是模糊的,其中不仅有对于情报信息领域的“目录”概念的误解,而且也缺乏对体现网络信息技术的搜索引擎的完整理解。为了更好地认识这个问题,下面将首先对网络搜索引擎给予基本的介绍,并在此基础之上,我们探讨网络搜索引擎与目录学的关系。
    2什么是网络搜索引擎
    2.1网络搜索引擎的工作原理
    简单地说,网络搜索引擎是指自动从英特网搜集信息,经过整序以后提供给用户进行查询的系统。搜索引擎的工作原理大致可以分为:
    (1)搜集信息。搜索引擎的信息搜集基本都是自动的。搜索引擎利用称为网络蜘蛛(spider)的自动搜索机器人程序来连接每一个网页上的超链接。
    (2)整理信息。搜索引擎整理信息的过程称为“建立索引”。搜索引擎不仅要保存搜集起来的信息,还要将它们按照一定的规则进行编排。
    (3)接受查询。用户向搜索引擎发出查询请求,搜索引擎接受查询并向用户返回资料。搜索引擎每时每刻都要接到来自大量用户的几乎是同时发出的查询请求,它会按照每一个用户的要求遍历自己的索引,在极短的时间内找到用户需要的资料,并返回给用户。目前,搜索引擎主要是以网页链接的形式提供返回,通过这些链接,用户便能够到达含有自己所需资料的网页。
    2.2搜索引擎的工作方式
    搜索引擎其实也是一个网站,只不过该网站专门为用户提供信息“检索”服务。它使用特有的程序把因特网上的所有信息归类,帮助用户在浩如烟海的信息中搜寻所需要的信息。搜索引擎按其工作方式可分为两类:
    (1)分类目录型的检索。把因特网中的资源收集起来,按资源的不同类型而分成不同的目录,再一层层地进行学科分类,建立搜索引擎目录(Directory),即搜索引擎的人工分类目录。人们要找自己想要的信息,可按分类一层层进入,就能找到自己想要的信息。
    (2)基于关键词的检索。这种方式用户可以用逻辑组合方式输入各种关键词(Keyword),搜索引擎计算机根据这些关键词寻找用户所需资源的地址,然后根据一定的规则反馈给用户包含此关键字词信息的所有网址和指向这些网址的链接。
    目前,对于中文网站来说,最重要的分类目录有以下几个:开放式目录ODP,Yahoo!,门户搜索引擎目录搜狐、网易、新浪等。由于采用人工干预的方式,尽管具有专业、精确、系统等优点,但其非客观、有限性也是明显的。DMOZ开放式分类目录甚至被认为可能成为搜索引擎优化的障碍。从专业的角度看,分类目录型的检索与网络搜索引擎有巨大区别,并不能算是网络搜索引擎。
    我们通常所熟知并使用的,以baidu、google为代表的网络搜索引擎,显然属于上述第二类,是本文探讨的真正对象。
    2.3搜索引擎的信息排序原理
    将网络搜索引擎定义为“网络大百科的总目录”并指责其存在“缺乏对经典网络资源与泛网络资源的区分”等问题是没有道理的,这需要我们理解它的搜索方式和排序原理。
    简单地说,搜索引擎排序是一种计算机技术,最基本的原理是“链接分析”。如全球排名第一的网络搜索引擎google使用的排序技术PageRank(网页级别),其原理类似于科技论文中的引用机制:谁的论文被引用次数多,谁就是权威。诚然,这会对搜索结果的“公正性”有一定程度的影响,但是,如果不理解搜索引擎信息排序中最根本的理论基础,类似指责至少是偏颇的。
    3搜索引擎与传统目录学概念的对应
    3.1索引、目录与搜索引擎
    索引旧称“索隐”“通检”“备检”或“引得”,是一种记录和指引文献事项或单元知识,并按一定系统组织起来的检索工具。
    索引一般以文献内部的知识单元或单篇文献为著录基本单位,揭示单篇文献的基本特征、文献中的事物名称和重要信息,特点是“深入”和“便捷”,即对文献内容的揭示程度较书目深,提供的检索途径多,检索快捷方便。全文索引是索引中一种比较重要的形式,又称“引得”。
    目录是一批相关文献的著录,是按照一定的次序编排组织而成的一种揭示和报导文献信息的工具。目录的特点在于整体上是经过科学的编排和组织,使一批相关文献有序化,为读者提供有关文献信息的二次文献。
    通俗地说,索引指向的是一个点或者可能没有必然内在联系的点阵,索引基本上不存在对关键词(检索点)、文献中的事物名称或重要信息的学科判断,目录则指向一个面或者内在特征相互关联的面的集合。
    而网络搜索引擎,它分析关键词所在网页的重要地位的高低,以检索点为立足点,提供关键词所在的网页及其链接,基本上不承担分析关键词学科属性的责任,其搜索结果排序不具备与检索点学科属性相关的科学意义。因此,网络搜索引擎与传统“索引”类似,而与传统“目录”相去甚远,是一种基于关键词检索的“引得”。
    3.2传统的继承和现代的延续
    了解了网络搜索引擎的工作原理、方式、信息排序原理之后,我们就能够很容易地对它有一个科学而规范的认识。
    没有必要因为新型的技术形式和表现手段而去改变传统概念的核心内涵,更不需要创造新的概念名词。我们需要注意的是,在传统纸质文献中,目录、索引的名称运用有时显得混乱,很多目录型的文献被称之为索引,而有的索引又被冠以目录的名称,但是这些都不应该成为我们混淆科学概念的理由。
    传统的认知在新技术条件下并没有过时,相反,当我们用看似老套的传统知识去审视新鲜事物时,看到的正是其本质,这正是我们认识、理解、发展新的理论、技术、实践的根本所在。
    如上所述,网络搜索引擎不是“百科全书总目录”,将它视作“网络信息的总目录”是一种误解,以此提出的关于网络搜索引擎存在的所谓“问题”属于无的放矢。
    网络搜索引擎还在不断地发展之中,对于网格技术、智能检索、个性检索技术的应用都已经开始了深入的研究。智能检索能利用分词词典、同义词典、同音词典改善检索效果,进一步还可在知识层面或者说概念层面上进行辅助查询,通过主题词典、上下位词典、相关同级词典检索处理形成一个知识体系或概念网络,给予用户智能知识提示,最终帮助用户获得最佳的检索效果。个性化趋势是搜索引擎未来发展的重要特征和必然趋势之一,比如通过搜索引擎的社区化产品(即对注册用户提供服务)的方式来组织个人信息,然后在搜索引擎基础信息库的检索中引入个人因素进行分析,获得针对个人需求的不同的搜索结果。
    这些发展都使网络搜索引擎在科学意义上与传统图书情报学、文献目录学更具有关联性。也许随着网络搜索引擎的进步,它能够真正承担起虚拟世界中“总目录”的责任,让我们在网络信息的海洋中畅游时,如同在大型图书馆中一样得心应手,甚至更加自如。
    [参考文献]
    [1]孟玉静.搜索引擎:网络大百科的总目录[J].今传媒,2008(2):61-62.
    [2]邓蓉.目录学在网络信息资源管理中的应用[J].山东图书馆季刊,2006(1):104-106.
    [3]王锦贵.论章学诚的目录学知识创新[J].大学图书馆学报,2003(4):71-75.
    [作者简介]陈文莉,女,武汉图书馆副研究馆员。武汉图书馆,武汉,430015
    原载:《图书馆理论与实践》2009(4) (责任编辑:admin)
织梦二维码生成器
顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
栏目列表
评论
批评
访谈
名家与书
读书指南
文艺
文坛轶事
文化万象
学术理论