语言文学网-学术论文、书评、读后感、读书笔记、读书名言、读书文摘!

语文网-语言文学网-读书-中国古典文学、文学评论、书评、读后感、世界名著、读书笔记、名言、文摘-新都网

当前位置: 首页 > 学术理论 > 书目文献 >

浅谈古籍书目数据库建设的若干问题

http://www.newdu.com 2017-10-30 中国文学网 刘刚 参加讨论

    我国的历史久远,文化漫长,现存的古籍文献大约在10万种左右。面对这浩如烟海的文献,如何充分利用使其为今天的社会服务,一直是困扰人们的事情。随着科技的发展,自动化技术与通讯手段被引进了图书馆中,为图书馆工作开辟了新天地。在图书馆广泛开始对平装图书进行书目数据加工并取得相当成果的时候,对古籍的书目数据加工也提到了日程。但是如何制作古籍书目数据是个值得很好研究的问题,只有从古籍本身的特点出发,借鉴平装图书书目数据建设的经验、教训以及海外对古籍书目数据制作的情况,才能使我们的古籍书目数据建设少走或不走弯路,达到事半功倍的效果。
    建设古籍书目数据库涉及的主要问题有:古籍及古籍书目数据库的地位,古籍的分类与主题标引,以及数据格式、著录标准和数据所用汉字等问题。
    古籍及古籍书目数据库的地位
    古籍,即为中国古代书籍的简称,一般下限在1911年。但从图书馆工作的实际情况看,1911年以后影印、排印出版的古籍也都划入古籍的范畴。因此,从时间上严格划分是困难的。以1911年为下限,也只能说大致符合图书内容及形式的实际情况。
    现在传世的古籍可大体分成两部分,一部分是1911年以前以刻本、写本等形式流传至今的和1911年以后重印、排印的以线装形式出版的;另一部分是1911年以后重印、排印的以平精装形式出版的。前者数量多,后者数量相对小一些。从图书馆的实际工作看,对上述两种形式的古籍采取了不同的管理方法。后者以平精装形式出版,称为影印古籍或平装古籍,同现在的平精装图书一同编目、典藏、流通;前者以线装形式为主,被称为线装古籍或线装书,在图书馆中单独编目、典藏,一般按特藏处理。本文所要讨论的就是线装古籍书目数据库的有关问题。
    根据上面对古籍概念的理解,在建设古籍书目数据库时,首先就要解决它的地位问题,即古籍书目数据库与其他载体或装帧形式的文献书目数据库之间的关系。只有把关系理清楚,才能在此基础上解决其他问题。
    从书目数据库整体建设以及从读者学术研究出发所进行的检索方面来看,古籍书目数据库应该纳入统一综合书目数据库之中。所谓统一综合书目数据库是由各文种、各文献类型、各文献载体和装帧形式的书目数据按照统一的MARC格式所组成。各文种包括中、日、西、俄、法、德、阿拉伯文等;各文献类型包括专著、连续出版物、视听资料等;各种文献载体和装帧形式包含平精装书、线装书、缩微胶卷、视听资料等。古籍书目数据库之所以要纳入其中,这是因为:
    1.图书发展连续性的需要。图书作为记载、传播人类文明历史的工具,在长期历史发展中,它的载体形式发生了巨大的变化。从古老的金石、甲骨到竹简、帛书,从手工抄写、刻版印制,到现代大规模的机器印刷,乃至缩微胶卷、光盘存储的出现等,反映了人类科技水平和手段的不断进步。与此同时,图书的装帧形式也随之而改变,由简策、卷轴、经折装等,到包背装、线装、平精装。
    在图书的载体和装帧形式发生变化时,图书的内容却如实地记载了人类社会的发展和进步,使得后人可以通过它来了解历史。因此,它具有的连续性是人们今天乃至今后在研究古人的成果、站在前人的基础上不断进步所不可缺少的。古籍作为书籍发展史上的一个阶段,是记载整个人类文明的重要组成部分,它与现代的平精装图书有着千丝万缕、密不可分的联系。读者在研究、整理古籍时,一方面要阅览古籍本身,另一方面还要查阅有关它的所有信息,包括现存于世的其他版本、后人对其研究、评价等信息。所以,从图书的内容所具有的连续性看,古籍书目数据应包容在统一综合书目数据库之中。
    2.保持统一综合书目数据库的完整。书目数据是反映书籍基本情况的记录,如果按照载体或装帧形式分别建库,使各个书目数据库分而治之,那就达不到我们预期的要求和愿望。
    作为统一综合书目数据库的组成部分,北京图书馆编制的《国家书目·新书数据库》从1988年开始进行,1990年开始向社会发行数据软盘,至今已经积累数据约26万条,并将继续增长下去。目前,由北京图书馆等四家图书馆联合编制的《国家书目·回溯数据库》也已经开始制作。它将收录1949—1987年国家正式出版的图书,与《国家书目·新书数据库》相衔接,两者合并后将构成1949年以后至今的《国家书目数据库》。在上述两个书目数据库的编制中,以平精装形式出版的影印古籍将全部收录在内。据国家古籍整理规划小组办公室编辑的《古籍整理图书目录:1949—1991》统计,在此期间全国共出版古籍约6581种,其中有少数是线装形式出版的,绝大多数是以平精装形式出版的。进入80年代中期以后,古籍整理出现了高潮,从1985—1991年,平均每年出版都在450种以上,其数量是可很观的。而且今后随着工作的进展,还会有更多的诸如《续修四库全书》等成果问世。
    由此可见,如果将线装古籍与平精装古籍分而治之,割裂开来,就会从整体上破坏书目数据库的完整性。
    3.检索的需要。在统一综合书目数据库中,读者通过某个途径,经过一次检索就能够得到所要的相关资料,如果分别建库,即便是格式统一,分类、主题一致,也要至少进行两次以上的检索方可得到有关信息,而且所得到的检索内容也是割裂的。这就失去了自动化提供的一次检索所带来的优越性。
    古籍的分类
    所谓分类就是根据图书所反映的学科内容,按照科学的分类体系,将其划分到相应的类目之下。我国的图书分类从西汉末年的《七略》到清代的四部分类,走过了漫长的道路。清末以来,随着西学的渐入,社会与科技的发展,使原有的分类方法已不适合图书的需要,因此陆续编制了一批新型的分类法。特别是《人大法》、《科图法》、《中图法》等的编制与使用,使图书分类进入了一个新的历史发展时期。
    但是,由于古籍本身所具有的特殊性,在古籍分类上没能统一。有人做过调查,在17个图书馆中,对线装古籍的分类,使用《中图法》的2个,《人大法》的2个,《科图法》的1个,《东北法》的1个,《中国古籍善本书目》分类法的3个,王云五《中外图书统一分类法》的1个,刘国钧《中国图书分类法》的3个,皮高品《中国十进分类法》的2个,北京图书馆编《中文普通线装书分类表》的1个,《四库全书总目》分类法的2个。总计10种不同的分类法。
    在北京图书馆,对古籍的分类则使用了不少于4种的分类法。在线装书中,善本书使用《四部法》,除善本以外的线装书,则使用了《中文普通线装书分类表》,即15大类分类法;在平精装书中,1974年以前使用刘国钧先生的《中国图书分类法》,1975年以后至今,使用《中图法》。
    古籍分类如此混乱和复杂,给古籍编目和利用带来诸多不便。
    那么,古籍分类究竟采用何种分类法为好呢,在70年代末80年代初编制《中国古籍善本书目》时,引发了一场全国性的大讨论,归纳起来为两点,一种意见主张采用《中图法》,另一种意见主张采用《四部法》。
    主张采用《中图法》的意见是:①《中图法》是一部全新的综合性大型图书分类法,它较为充分地体现了现代科学分类思想,体系完备,编制技术先进,为《四部法》所无法比拟;②《中图法》的编制充分考虑到了古今图书的统一分类问题,设置了能够容纳古籍各类图书的类目,适用于古籍分类;③《四部法》很难适应现代读者按学科体系检索古籍的习惯和要求,不便使用;④古籍分类是对古籍群体的排列组合,完全应该按照现代人的需要,抛弃老方法,采用现代科学分类法;⑤现实生活中《四部法》仍大量使用,是历史的惯性在起作用,并不代表古籍分类应走的方向。
    主张使用《四部法》的则认为:①古籍与《四部法》都是中国封建时代的产物,古籍无论在形式上还是在内容上,都有其特殊性,应予以特殊对待。《四部法》集中中国古代各分类法之大成,使传统的四部分类法更加完善,分类体系更加成熟,用《四部法》类分古籍是比较时宜的;②目前全国许多大图书馆的古籍分类仍使用《四部法》,《中国丛书综录》和《中国古籍善本书目》的分类法与《四部法》一脉相承,都足以说明古籍应走的道路;③用《中图法》类分古籍,打破了古籍固有的学术源流体系,无法看出儒家思想在中国古籍中的地位和影响,不利于读者准确理解和认识古籍;④《中图法》本身还不成熟,有许多不合理之处,尚在不断修改之中,不宜用来类分古籍;⑤使用古籍的读者一般对《四部法》都比较熟悉,不存在使用不便的问题。
    两方面的意见最终也未能得到统一。究其原因,归根到底是由这两种分类体系的根本不同造成的。《中图法》是以现代科学分类思想为指导,以现代科学体系为基础而编制的;而《四部法》是从封建社会独尊儒术的思想体系出发,反映了封建社会的学术思想体系。两者是无法兼容的。
    那么在建设古籍书目数据库中究竟使用哪种分类法,根据目前的需要和可能,不妨在制作古籍书目数据时,同时使用这两种分类方法。这是因为:
    1.建设统一综合书目数据库的需要。古籍书目数据是统一综合书目数据库的重要组成部分,在其他载体或装帧形式的文献书目数据使用《中图法》的情况下,如果古籍不使用,就会在分类检索时造成缺陷。如前面所谈到的《国家书目数据》里面包含了大量的古籍,如果在统一综合书目数据库中,平精装古籍使用《中图法》,而线装古籍不用,就会造成人为的割裂状态,即便在一个书目数据库中,由于采用了不同的分类法,也会使得读者在分类检索时,无法一次得到所需的全部信息。
    2.使用两种分类法可以满足不同方面、不同层次的需求。《四部法》作为反映中国封建社会几千年历史文化的分类方法,体现了中国古代学术的发展情况,在学术研究方面可以达到“辨章学术,考镜源流”的目的。一般历史研究者和古籍整理者都熟悉《四部法》,是他们研究中国古代学术发展史和古籍发展的重要手段;而《中图法》是以现代人的观点来研究、类分文献的方法,它打破了《四部法》传统的分类要求。比如,它将《四部法》中经部的内容,按照现代科学的标准,散分到哲学、历史、语言文字等门类,完全打乱了原有的学术体系,不便于研究中国古代学术发展和古籍发展者的需要。但是,《中图法》适应了现代科学的发展,适应了现代人的思维方式,适合当代广大读者的一般需求,可以使一般读者或对《四部法》不熟悉的读者通过它来检索到所需的书目数据信息。
    另外,由于我国历史久远,历史文化的继承性也很强,有些体裁的著作方式现在及今后还要继续使用下去。比如地方志,从宋代成熟到明清的鼎盛,历朝历代都将其作为大事来进行。现存于世的清代以前编纂的地方志大约有6700余种,自1911年到1949年,又有大约1600余种。进入20世纪80年代以来,全国出现了盛世修志的高潮,到本世纪末,将有近6000余部的地方志问世。如果将1911年以后特别是80年代以来编纂的地方志纳入到《四部法》中显然是不妥的。只有用《中图法》来类分古今所有的地方志才符合历史发展的需求;
    3.使用两种分类法在技术上是可行的。在书目数据的制作上,只需在相应的字段标注相应的分类号即可。如北京图书馆目前发行的书目数据,为了便于有的图书馆使用,就在相应的字段同时使用了《中图法》和《科图法》两种分类法。
    使用两种分类法的问题是,从事编目的人员必需熟悉这两种分类方法,以便做到分类的准确、恰当。
    古籍的主题标引
    主题标引就是通过对文献内容的分析,把文献所论述的对象(或事物)概括出来,再使用规范化的词汇——主题词,将其按照一定的规则加以组织,使之成为检索语言的过程。
    主题标引的历史虽然不长,但其发展是很快的。在我国图书情报界的应用也随着计算机的普及而普及。在古籍书目数据库的建设中,主题标引是必不可少的。这是因为:
    1.主题检索是读者利用书目数据库不可缺少的手段。在利用书目数据库的过程中,一般的读者除了利用书名、著者进行检索外,主题检索是不可缺少的。这是由于主题检索的优越性决定的。由于主题检索能将一个研究对象(事物)集中在一起,所使用的主题词直观性好、专指性强,在检索时人们可以根据自己所需的要求,选择相应的主题词从不同途径进行检索,直至达到自己满意的程度。
    比如检索研究孔子的书目信息,在主题检索的状态下输入“孔丘”,在不加限制的情况下,就会得到有关研究孔子所有信息,如研究他的生平事迹、思想评论、哲学思想、评传、家谱、年谱以及研究他在管理学、家庭教育等不同性质的书目信息;又如,要想了解一部古籍的有关研究和应用情况,除了通过书名来检索外,还可通过主题来检索,例如《孙子兵法》,通过主题词——孙子兵法”进行检索后,就可得到有关它的注释、研究、译文以及它在企业管理、商业经营、市场竞争、资本市场等方面应用的书目信息等等。显然,这要比分类检索更具有优势,因为如果从分类的角度来检索,就必须从上述各个门类入手进行检索。
    如果想缩小检索范围,可以通过不同主题词的组合来实现。比如,要获得有关孔子生平事迹的研究情况,只需在“孔丘”的后面加上相应的主题词,“孔丘”——“生平事迹”,那么所得到仅仅就是有关研究孔子生平事迹的书目信息。
    所以说,主题检索是读者利用书目数据库不可缺少的手段。
    2.主题标引已经在平精装古籍的书目数据加工中得到应用,并取得一定的经验。实践证明,主题标引适合于古籍的书目数据加工与使用。
    3.统一综合书目数据库建设的需要。如果在统一综合书目数据库中虽然有古籍书目数据,但是在检索途径上缺少这个环节,那么在检索时就达不到理想的要求,人为地割裂了书目信息的来源。
    古特书目数据的格式、著录标准以及汉字问题
    古籍书目数据既然要纳入统一综合书目数据库之中,那么,在机读格式(MARC)上就要使用CNMARC格式,以便同其一致。MARC始于美国国会图书馆,他们于1965年开始研究,1968年正式投入使用。随后,世界各国相继研制适合本国情况的MARC。1977年国际图联(IFLA)公布了UNIMARC格式,该格式作为一种国际通用格式,要求各国按该格式编制MARC,供本国使用,而后将这种MARC转换成UNIMARC,进而实现国际机读目录数据的共享。北京图书馆1986年提出了CNMARC的讨论稿,经过近十年的使用,现在已成为全国大多数图书馆所认同的标准,并即将成为我国图书馆的行业标准。几个向社会发行MARC数据的图书馆均采用了这个格式。该格式主要依据UNIMARC,适用于专著、连续出版物、视听、乐谱、测绘资料等。古籍作为专著的一种形式,应该、也可以纳入其中。
    在古籍书目数据的著录标准上,1978年国家标准局颁发的GB3792.7《古籍著录规则》,应该是古籍书目数据的著录准则。它参考了《国际标准书目著录(古书)》〔ISBD(A)〕,结合我国古籍特点及著录传统而制订。1994年修订后的标准,基本与MARC格式相衔接,体现了用现代科技手段与方法来加工传统文献的要求。
    格式与著录标准的统一,是建设统一综合书目数据库的要求,也是达到书目数据资源共享的关键。
    作为古籍整理和客观反映古籍情况的需要,在书目数据的制作上应该使用繁体字。现有GB2312中的6763个汉字是不够的。15010646字符集的出现为我们提供了更好的基础,该字符集收录中日韩三国的汉字20902个。这使得古籍书目数据的制作更为符合古籍的实际情况。从而可以使读者通过查阅终端屏幕所显示的书目数据信息,更加真实地了解该书的基本情况,帮助其判断取舍。
    由于古籍所特有的一些情况,所以在制作古籍书目数据时,应该谨慎、稳妥地进行。在具体制作时,可考虑先由个别图书馆在小范围内,对于所采取的方法、步骤、标准等问题进行必要的试验与探讨,取得经验后再逐步推广,以最终形成一套符合古籍实际情况的古籍书目数据制作标准。在此基础上,制作完成中国古籍书目数据库,并将其纳入统一综合书目数据库之中,为广大读者所利用。
    参考文献:
    1.北大、武大图书馆学系编.图书馆古籍编目.中华书局,1985,3
    2.侯汉青,马张华.主题法导论.北京大学出版社,1991,9
    3.刘湘生.主题法的理论与标引.书目文献出版社,1985,11
    4.李致忠.谈建立中国古籍书目数据库.北京图书馆馆刊,1992,l
    5.姚伯岳.试论中国古籍分类的历史走向.图书馆理论与实践,1993,4
    6.卫建平.从17个图书馆看古籍分类的现状.晋图学刊,1986,4
    (刘刚   北京图书馆自动化发展部副主任)
    原载:《北京图书馆馆刊》1996年第l期 (责任编辑:admin)
织梦二维码生成器
顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
栏目列表
评论
批评
访谈
名家与书
读书指南
文艺
文坛轶事
文化万象
学术理论