古籍,书目数据库,机读目录格式 我国历史悠久,流传下来的古籍卷帙浩繁。这些古籍是中华民族宝贵的文化遗产,在整 个图书馆藏书体系中是不可缺少的组成部分。如何运用现代化手段对这些人类文化的遗产进行深入地开发和利用,实现资源共享,是当前图书情报界面临的一个重大课题。目前全国已有许多图书馆开展了馆藏古籍的回溯建库工作。由于古籍本身的特点,古籍回溯书目数据库的建设存在着一些问题需要进一步研究解决。 l存在的问题 1.1机读目录格式不统一 运用计算机技术对古籍进行编目整理,在国内尚在起步阶段。到目前为止,全国尚无一部标准化的古籍机读目录格式,而已建成古籍书目数据库的各馆所使用的机读目录格式,基本上是在CNMARC的基础上,适当修改和扩充的结果。但是,CNMARC处理的对象原本是现代文献,对于在文字形态、编排体例、载体形态、装帧形式等方面与现代文献不尽相同的古籍,其字段和子字段尚不能完全加以揭示,而各馆所收藏的古籍又不尽相同,自行设计的古籍机读目录格式就不可能统一,这必然导致书目数据对于文献特征的揭示出现一些差别,影响馆际交流和资源共享。 1.2采用的分类法五花八门 由于古籍的特殊性,古籍分类在我国一直没能统一。有人对17个图书馆做过调查(调查结果见下表),结果表明对线装古籍的分类,各馆采用的分类法很不一致。 表1 17个图书馆古籍采用的分类法一览表
|
分类法
| 数量(个)
|
《中图法》
| 2
|
《人大法》
| 2
|
《科图法》
| l
|
《东北法》
| l
|
《中国古籍善本书目》分类法
| 3
|
王云五《中外图书统一分类法》
| l
|
刘国钧《中国图书分类法》
| 3
|
皮高品《中国十进分类法》
| 2
|
北京图书馆《中文普通线装书分类表》
| l
|
《四库本书总》
| 2 |
古籍分类比较复杂,至今没有一部专门适合古籍分类的分类法。很多图书馆仍沿用传统的四部分类法。一些藏书较丰富的图书馆,考虑到古籍目录形成于各个时期,一馆之内也采用了多种分类法。近年来,高校合并而造成一个馆的古籍存在多种分类法的情况也很普遍。适用分类法不统一,无疑给古籍书目数据库的建设带来诸多困难。
1.3著录用字问题
根据国家标准《古籍著录规则》和古籍的特殊性,以及真实反映原书的原则,建立古籍机读目录必须使用原书字体。而古代文献年代久远,其著作用字不仅是繁体字,还有大量的异体字、生僻字、避讳字,目前还没有一个包括所有这些汉字的超大字库供计算机调用。由于长期不断的变化,古籍中的繁体字、简体字、异体字、新字型、旧字型等十分复杂,计算机不能进行统一处理。许多馆在处理一些疑难字符时只能采取替代办法,这势必破坏真实反映原书的原则。目前我们所接触到的大字库编辑软件一是方正,一是Wind98支持下的word,但这两种编辑软件的字库仍不能满足古籍书目数据库的需要。因为对古籍而言,它们的字库仍嫌太小,而且不能兼容、不能互通。此外,现有繁简字转化系统是一对一的关系,无法解决繁简字的一对多、多对一的对应关系,在将简化字输入的编目数据转化成繁体字输出时容易出现错误。
1.4工作人员知识结构问题
建设古籍书目数据库要求工作人员既具有一定的目录学、版本学、文献学、古汉语知识,又有一定的计算机知识与操作技能、CNMARC知识。图书馆界从事古籍整理的人员本来就少,而且他们多半仅具备上述一方面或某几方面的知识,根本无法对古籍进行深层次的研究和用计算机编目。古籍整理人员知识结构的不合理,在很大程度上制约着古籍书目数据库的建设。
2应对措施
我国古籍书目数据库建设虽然起步较晚,又存在着上述四方面的客观问题,但我们可以借鉴国内外的经验教训,采取有效措施,不走或少走弯路。
2.1确立建库观念与方针,建立权威性协调机构
古籍书目数据库的建设是为了更好地整理、保护、开发利用古籍资源,弘扬民族文化,让世界充分了解中国。图书馆界必须就建库的观念和方针策略达成共识,团结一心、互相配合,建立权威的协调机构,有组织、有计划、有步骤地建库。比如,国家古籍整理出版规划小组就是这个项目理想的领导机构。
2.2尽快出台标准化的古籍机读目录格式
设计古籍机读目录格式和建立古籍书目数据库是个系统工程。笔者认为,可以国家古籍整理出版规划小组为龙头,联合全国大中型图书馆和有关部门共同商榷,吸取已建成古籍文献数据库各馆的宝贵经验,以CNMARC为蓝本,结合《古籍著录规则》,研究出一种标准的古籍机读目录格式,以实现古籍书目数据的标准化和资源共享。据悉,国家图书馆古籍部即将出版一部“古籍机读目录格式”,将作为古籍计算机编目的统一标准。它以计算机可读形式供各种机构进行古籍书目信息的交换,规定古籍机读形式书目记录的字段标识符、指示符和子字段代码,以及记载在磁带、软盘等载体上的书目记录及其内容标识符逻辑的和物理的格式。
2.3同时采用《中图法》和“四部法”作为编目依据
四部分类法是我国古代图书分类方法,在学术研究方面具有“辨章学术”、“考镜源流”的功能,但缺乏科学的分类理论指导,类目少、分类粗、类目词界限不清。只有历史研究者和古籍整理者比较熟悉,而与当代多数读者的检索习惯不同。《中图法》是中国图书分类的国家标准,打破了“四部法”传统的分类要求,适合广大读者的需求。但《中图法》对历史书籍和古籍所设置的类目不太适合古籍的特点,这是《中图法》用于古籍分类的最大弱点。对于古籍分类而言,《中图法》和“四部法”各有优点,故在古籍书目数据库建设中,以同时采用两种分类法为好。对一部古籍,既著录《中图法》分类号,也著录在“四部法”中的类目,两法的分类结果相互校正,使书目数据质量更高;同时形成了两个完整的分类检索体系,可满足多方面、不同层次的读者需求。
2.4研发适用于古籍著录的应用软件
鉴于目前国内古籍回溯建库的现状,可以根据古籍的特点、数据内容等编制适用于古籍著录的应用软件。设计程序时,特别要选择适用的字库。该字库应尽可能包括全部的繁、简汉字以及生僻字、罕用字、避讳字,并且造字功能要强,以满足繁体汉字输出、异体字转化等需要。在新的大字符集未建成以前,我们可以利用现有的国际标准化汉字字符集。1996年3月14日,ISO10646大字符集正式颁布。此国际标准化汉字字符集中收入了中、日、韩三国的汉字20902个,其中包括6763个GB2321-80中的汉字,也有简化字的繁体形,可以较方便地进行简繁字形的相互转换。因此,可以ISO10646大字符集为基础,建成包含2-3万个古籍常用字的基本字库,同时建成异体字、生僻字、避讳字等专用字库。
2.5大力做好人员培训
要建设高质量的古籍书目数据库,就必须培养造就一支新型的古籍工作队伍。选择馆内有古籍知识或计算机知识或CNMARC知识的人员组成古籍建库小组,通过岗位培训、专题讲座、参观学习等多种方式,系统地学习《古籍著录规则》、CNMARC格式、计算机基础知识、目录学、版本学等内容,还要强化输入方法与操作技巧的培训。
参考文献:
[l] 杨晏平.建立图书馆古籍文献数据库当议.中国图书馆学报,1996(l)
[2] 王运堂,李勇慧.关于善本古籍书目数据库建设的问题与思考.中国图书馆学报,1999(2)
[3] 秦淑贞.论古籍书目数据库规范化.中国图书馆学报,1997(l)
[4] 李荣慧.古籍书目数据库建设面临的问题及对策.图书与情报,2000(l)
[5] 郑贵宁.书目数据库建设的古籍分类问题.图书馆理论与实践,2000(5)
[姚秀敏:河北师范大学西区图书馆。]
原载:《江西图书馆学刊》2002年第4期 (责任编辑:admin)