语言文学网-学术论文、书评、读后感、读书笔记、读书名言、读书文摘!

语文网-语言文学网-读书-中国古典文学、文学评论、书评、读后感、世界名著、读书笔记、名言、文摘-新都网

当前位置: 首页 > 学术理论 > 书目文献 >

影印《四库全书》系列书目数据库的规范控制

http://www.newdu.com 2017-10-30 中国文学网 王阁 参加讨论

    古籍文献是中华民族宝贵的文化遗产,四库全书是中国乃至世界历史上规模最大的一套图书集成,编纂于清乾隆三十七年(1772年)至乾隆四十七年(1782年)。全套书分经、史、子、集4部。荟萃了清乾隆中期以前的历代主要典籍,涵盖了古代中国几乎所有的学术领域。近二十年来开始的古籍影印工作,是近世古籍传播的重要方式之一,数以万计的中国古代典籍因“化身千百”而获保存并流通,且以著名的文渊阁《四库全书》影印为发端至“四库系列丛书”的相继问世形成高潮。自20世纪80年代台湾(1986)及大陆(1989)出版影印本以来,已为国内数百家图书馆所收藏。
    在20世纪90年代,天津图书馆致力于购藏影印文渊阁《四库全书》及与之相关的各类文献,包括:《四库全书》1501册、《文渊阁四库全书补遗》15册、《四库全书存目丛书》1198册、《四库全书存目丛书补遗》100册、《续修四库全书》1800册、《四库禁毁书丛刊》311册、《四库未收书辑刊》301册、《四库全书荟要》100册、嵘四库家藏》151册、《续修四库全书总目提要(稿本)》 38册等等。这之中补充了当时被四库馆臣摈弃之书,并续修收录了乾隆以后至清末具有学术性、史料性和各门类代表著作,共收藏原版古籍影印声14500余种。
    为了充分开发利用影印“《四库全书》系列”文献资源,为“四库学”及传统文化研究服务,建立标准化、规范化的书目数据库提上了议事日程,从2005年初开始,历经两年的时间,天津图书馆对以上馆藏的“四库系列”运用CNMARC格式,完成了影印古籍“《四库全书》系列”书目数据库的建设。
    编制特点
    (1)依据《中国文献编目规则》、《新版中国机读目录格式使用手册》、《四部分类法》、《中国分类主题词表》等进行标准化、规范化著录。
    (2)考虑在编文献为“影印古籍”的特点。不适用于古籍文献著录在“1912年以前我国书写或印刷的汉语文书籍”(《中国文献编目规则》第二版,古籍著录部分)之规定,不启用193, 194字段。
    (3)为充分揭示影印古籍“《四库全书》系列丛书”之内涵,采取逐种逐册分别著录各丛书子目的方式,以“嵌入字段技术”与连接单元挂接,最大程度地为用户提供多途径检索服务。
    如:2001#@a寻古齋诗集@9xun gu zhai shi ji @ e二卷
    @f(清)李繼聖撰
    463 # 1 @ 12001 # @ a四库禁燬書叢刊@i集部@h
     第一六八册@vp.191-328
    (4)提供《四库全书》系列原文献收藏单位的附注说明。
    如:2001#@a集唐人句@9ji tang ren ju @ e一卷@f(清)殿首昇撰
    300##@a中國社會科學院圖書館藏。
    (5)古籍文献在内容结构及外在形式上有许多特殊之处,所以其著录较一般图书复杂而深入,如一本书的题名,在书名页、卷端、逐页等地方各不相同,著录中就应启用相应的各自字段,如514卷端题名、515逐页题名等字段。在对内容结构的标引上,除了运用《中图法》第四版和《中国分类主题词表》外,针对《四库全书》的特点,启用696字段标引《四部分类法》。
    (6)按照“客观著录的原则”,并保持和在编文献实体一致,使用Unicode 2.0版BIG5大字库,对题名与责任说明项、版本项、出版发行项和丛编项一般按在编文献本身的文字照录,并用规范的繁体汉字解决古籍文献中出现的稀见字、异体字。数据中100字段“字符集”置“50",举例说明如下:
    HEA##@ 01199nam0 2200277  45  00
    001##512006012711
    010 # # @ a7-200-03470-3@b精装@dCNY180000.00
    (全311册)
    100##@ a20030922e2000
    1010#@achi
    102##@ aCN @ b110000
    105##@aab  z  000yy
    106##@ar
    emky0chiy50  ea
    2001#@a四库禁燬書叢刊@9si ku jin hui shu cong kan@i子部、@h第三三册@f四库禁燬书丛刊编纂委员会编@g王钟翰主编
    205## @a影印本
    210 # # @ a北京@c北京出版社@d2000
    215 # # @ a714页@c图,地图@d27cm
    312## @a版权页题:四库禁燬書叢刊。
    327.1 # @ a金湯借箸十二籌/(明)李盤等撰@a兵镜/(明)吴惟顺,(明)吴鸣球撰@a新鐫批选皇明百将传合法兵戎事类/(明)赵光裕撰
    5171 #@a四库禁燬書叢刊9si ku jin hui shu cong kan
    6060 # @ a丛书@Y中国@z现代
    690##@aZ 121.7 @ v4
    696##@a子部@2skf
    701#0@a王钟翰@ 9wang zhong han@f (1913.8-)@4主编
    801 # 0 @ can @ b天津图书馆@c20060912
    905##@ aTT @ sT55118
    规范控制
    规范控制(Authority Control),是为确保标目在检索款目及书目系统的唯一性和稳定性,而建立、维护、使用规范款目和规范文档的工作过程。在影印古籍“四库系列”书目数据库的建设中,本着编目工作的重点应放在实现书目的汇集、区分和引导的功能,即能够为查询者提供数据库中同一著者的各种文献、同一学科主题的各种文献、相同题名的各种不同版本的文献,以及同书异名文献的名称规范等等,这些就是编目工作中的主题分类标引和名称规范工作,亦即检索控制问题。
    2.1  责任者名称规范
    《中国文献编目规则(第二版)》规定,古代人物名称标目的主要成分包括“本名、字、号或惯用称谓”,附加成分首选是“生卒年信息”,其它依次为“朝代、国别”、“民族、性别……”等等。依据这一规定,对个人名称标目应为如下形式:
    701#0@c(清)@ a曹雪芹@f(1715或1724-1763或1764) @ 4撰
    701#0@c(明)@a罗贯中@f(1330?-1400?) @ 4著
    701#0@c(汉)@a刘歆@f(前53-23) @4著
    根据界内有关专家对国家图书馆名称规范库中“中国古代个人名称标目附加成分”的分析研究,认为以“生卒年信息”作为附加成分首选“相比较而言,可靠性较差”,比较理想的形式应该是:“(朝代)个人名称”。对此,笔者是有同感的。
    在影印古籍“四库系列”的建库中,笔者发现国家图书馆责任者名称规范库有如下的问题:
    (1)近1/4的责任者没有规范数据。
    (2)现有的规范数据的作者字、号、笔名等不完全。如(唐)杜甫,规范数据中,只做附注字段“诗人。字子美……”,实际上,杜甫还有其他诸如“杜工部”等名,规范数据中并没有收进去,而且也没有做检索点。
    (3)编目规则规定,个人名称标目进行附加是为了修饰和区分标目主要成分。古代人物在名称规范库中重名重姓的概率非常小,有些作者的笔名或字号相同,但是他们的规范名是不同的。如笔者在检索明代文学家陈子龙时发现,规范数据中同时检出了宋代陈文龙,经查他的初名是陈子龙,度宗咸淳四年(1268)中进士后,皇上赐今名,二者应该有所区别。
    (4)古人的生卒年信息一般都是根据相关史料考证、推断出来的,由于此引证的史料不同,往往会得出不同的结论。如上例中的“曹雪芹”和“罗贯中”。在名称规范库中,(清)曹雪芹和(明)罗贯中检索结果只有各一个,由此是否可以推断,与其用这些“不确切、未知、推断或根据”的生卒年,不如只选择“朝代”更简明准确一些。
    (5)《中国文献编目规则(第二版)》中对“中国古代人物所属朝代的确定,一般以卒年为准,若不适当或卒年无法确定,可选择生平主要活动所在的朝代”。在具体操作中,对这个“不适当”怎样理解?例如,在对徐铉、徐锴两兄弟的检索中,我馆数据库的“客观著录”显示为:
    2001#@ a稽神録@9ji shen lu@e六卷@f(宋)徐铉撰
    2001 # @ a说文解字篆韵谱@ 9shuo wen jie zi zhuan yun pu@e五卷@f(南唐)徐锴撰
    国家图书馆名称规范库中数据为:
    200#0@c(宋)@a徐铉@f (916-991)
    3000 #@a五代宋初文学家。字鼎臣。……
    200#0@c(五代)@a徐锴@ f (920-974)
    3000 # @ a五代时期文字训诂学家。字楚金。……与其兄铉齐名,时号“二徐”……。
    这里对“朝代”的选取严格按照“卒年”,但是却忽略了重要的自然客观因素。笔者意见是否对徐铉按“生平主要活动所在朝代”选取,改为(五代)。
    基于上述对中国古代人物名称标目的分析,天津图书馆在“影印古籍‘四库系列’”数据库的个人责任者名称规范中,使用的是“(朝代)个人名称”,而不是“个人名称(卒年)”。
    2.2  题名规范
    古籍文献因版本的变迁造成书的内容不尽如原著;也有同是一书,因刻本不同,而改题书名者,比比皆是;卷数有分有合,多寡悬殊。总之相当复杂。对题名标目的规范化处理有一定的难度,加之国家馆名称规范库古籍文献的统一题名又比较少,因此数据库没有启用500统一题名字段,只是对正题名的“前置词”和交替题名进行规范。
    2.2.1  正题名“前置词”的规范
    古籍正题名常常出现一些冠于题名前的各种字样的词(这里特指是冠于“题名前”的词,题名之中间或是题名之后不在论述范围之内)。如皇朝、御纂、绣像批点、新刊、钦定、笺注、补注、集注、增广、重刊、出像等等,五花八门,有的表示本朝代或前一朝代,有的标识作者或校刻者,有的说明著作内容的撰写、加工方式或刊正情况,有的表现著作内容体系新旧或详简程度,有的反映著作刊刻或版藏情况,有的体现著作的图像特征或出版装帧形式。诸如此类的“前置词”,大致上可分为两大类,一类是说明著作内容特征的,应作为标目的组成部分不能删掉。另一类是反映著作形式特征的,不能作为标目的组成部分参加排检。在具体的编目实践中,情况往往比较复杂,对它们如何正确地区分、处理,仍然存在着困扰。但是,在计算机编目中,一次输入,多次输出,一条记录,多种款目,“前置词”的处理问题便迎刃而解了。正题名里无论是含有说明著作内容特征的,还是含有反映著作形式特征的,或者同时含有这两类并且交织排列,都可以统一处理,即在200字段的$a子字段,客观如实依据原文献著录,再将去掉“前置词”之后的正题名记入540(编目员补充的附加题名)字段,生成附加题名检索点。例如:
    2001 # @ a重刊五色潮泉插科增入诗祠北曲勾欗荔镜记@9chong kan wu se chao quan cha ke zeng ru shi ci bei qu gou lan 1i jing ji@e不分卷
    5401#@a荔镜记@91i jing ji
    2001 # @ a御纂醫宗金鑒9yu zuan yi zong jin jian@e九○卷@h二@f(清)吴谦 ,(清)劉鐸挥等纂
    5401 # @ a醫宗金鑒@9yi zong jin jian
    2.2.2  交替题名的规范
    交替题名在古籍题名著录中比较复杂,属于同书多名的范畴。通常是为了集中多个不同题名或不同版本的同一著作,它包括两大类:
    一类为文献载体上客观存在的交替题名,常有:又名、一名、原名、亦名、或、别名、异名等字样标识。这种情况下可将信息源中出现的题名和交替题名连同连接词著录在200 @ a子字段,并在517字段生成附加题名检索点。例如:
    2000 # @ a庄子,又名,道德经
    5171 # @ a庄子
    5171#@a逆德经
    另一类为文献载体上未标识出的交替题名,由于朝代的变迁,版本的演变而形成的古籍文献的不同题名情况是比较复杂的,如《梦溪笔谈》又称《元刊梦溪笔谈》;《儿女英雄传》又称《金玉缘》、《日下新书》等等,笔者以为这一类应当由“统一题名”来规范,现在国家图书馆正在进行古籍文献的题名规范工作,相信不久我们编目员就会逐步享受到这个成果,使我们的书目数据库建设更加标准化、规范化。
    影印古籍“《四库全书》系列”书目数据库,总体按照普通图书著录规则执行,又兼顾古籍文献本身的特征、特点著录一些细节。因此,在完成的26000多条的数据中,提供的分析著录占75%以上,能够极大地满足“四库学”研究专家及学者的要求,为他们提供多途径检索服务。
    [参考文献]
    [1]国家图书馆《中国文献编目规则》修订组.中国文献编目规则[M].第二版.北京:北京图书馆出版社,2005.
    [2]施廷镛.古籍珍稀版本知见录[M].李雄飞,校订.北京:北京图书馆出版社,2005.
    [3]曹宁,仲岩.试论中文个人名称标目附加成分的选择[C].第一届全国文献编目工作研讨会会议手册,2006.
    [4]陈素清.古籍正题名的CNMARC格式著录[J].图书馆工作与研究, 2002,(1).
    [5]谢琴芳.汉语文古籍文献书目数据库建设管见[J].大学图书馆学报, 2003,(6).
    [6]吴格.“影印本古籍”目录索引的编制——以四库系列丛书综合索引为例[C].南京 第4次中文文献资源共建共享合作会议,2004.
    [作者简介] 王阁(1954),女副研究馆员,天津图书馆采编部主任,发表论文7篇,天津300191
    原载:《图书馆论坛》2007年8月第27卷第4期 (责任编辑:admin)
织梦二维码生成器
顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
栏目列表
评论
批评
访谈
名家与书
读书指南
文艺
文坛轶事
文化万象
学术理论