语言文学网-学术论文、书评、读后感、读书笔记、读书名言、读书文摘!

语文网-语言文学网-读书-中国古典文学、文学评论、书评、读后感、世界名著、读书笔记、名言、文摘-新都网

当前位置: 首页 > 学术理论 > 书目文献 >

古籍书目数据库中繁简字的使用

http://www.newdu.com 2017-10-30 中国文学网 阎瑞君陈军 参加讨论

    中国古籍文献主要是用古老的汉字记录下来的,利用计算机技术整理古籍,建立古籍书目数据库,使其作为一种网上资源,达到合理开发利用、资源共享、弘扬中华民族传统文化的目的。就必然涉及到古籍记录中繁简字的使用问题。
    一、繁体字和简化字
    繁体字,辞海解释为:“简化字的对称,原来笔画较多、汉字简化后已有简化字代替的字”,也就是古籍中所使用的汉字。所谓古籍,一般是指1911年及其以前在中国书写或者印刷的汉语文书籍,以及1912年及其以后在中国或国外产生的用繁体字及中国古典装订形式(线装、经折装、蝴蝶装等)的汉语文书籍。中国的古籍文献由于年代久远,除了装订形式与现代文献完全不同之外,用繁体字记录也是一个区别于现代文献的显著特点。同时,汉字在悠远的年代中也在不断演变,其字形出现了纷繁复杂的情况。有时同一个字会有两种以上的字形,例如“窗”字有五个异体字都表示窗户的意思;而同一个字形有可能代表不同的字,例如简化字“后”对应繁体的“后”、“後”;“徵”有两种含义,一种字义是征召(zheng),一种字义是音乐(zhi),含义不同,读音也不一样。而且古籍在流传过程中,历经辗转抄录或反复翻印,产生了不少字形上的分歧,如印刷体和手写体、避讳字和原字、错别字等,这些情况都使得日常习惯于浏览简化字的读者群,产生了较大的阅读障碍。
    简化字是指新中国成立后,1956年1月以来分期颁布施行的《简化字总表》所规范使用的减少了笔画的汉字。新中国成立后,为了统一和规范汉字,减少汉字笔画,在大陆地区推广使用简化字,但港台地区和其它国家的华语地区仍旧使用繁体字。由于繁简字形的差异,使得大陆读者与其他华语地区的读者在文字沟通上产生了不少困难。利用计算机整理古籍如若单独使用某一种字体,必然会导致文献交流上的障碍。因此,整理古籍、建设古籍书目数据库就必然涉及到汉字字形的处理问题,若从便于现代读者检索、普及利用的角度出发,古籍书目数据库应该使用简化字;另一方面,古籍文献是中华文化中的瑰宝,若从保存古籍原貌、有利于资源共享的角度出发,古籍书目数据库应该使用繁体字,那么到底使用哪一种字体比较好呢?虽然目前图书馆界尚无定论,但笔者认为宜采取二者兼顾的方法,也就是采用简化字著录并在记录的主要款目中加上繁体字著录。
    二、古籍书目数据库应加入繁体字著录
    书目记录规范化、标准化是实现文献资源共享的前提。1987年1月国家颁布了《GB3792.7-87古籍著录规则》,使古籍编目从著录项目的设置、排列顺序和著录用标识符号三个方面直接与《国际标准书目著录》(ISBD)原则接轨,为中国古籍进入中外文献书目信息交流体系创造了条件,1995年12月出版的《中国机读目录格式手册》和1996年2月中华人民共和国文化部发布的行业标准《WH/T0503中国机读目录格式》,则进一步推进了我国书目数据库的规范和统一,预示着文献信息网络时代的到来。从1996年开始,一些图书馆开始着手建立自己的古籍书目数据库,如山东省图书馆、清华大学图书馆、南京图书馆、国家图书馆等。2001年10月,国家图书馆在实践的基础上编制了《汉语文古籍机读目录使用手册》,作为各图书馆建立古籍书目数据库的参考标准。
    在机读目录中著录古籍应该使用哪一种字体呢?1992年7月新闻出版署和国家语言文字工作委员会发布的《出版物汉字使用管理规定》中指出:“整理、出版古代典籍”可以使用繁体字;《中国文献编目规则》明确指出:“著录汉字古籍应使用规范的繁体汉字”;《汉语文古籍机读目录格式使用手册》没有明确提出在编制机读目录时字体的使用问题,但是其所举例子全部使用简化字。利用简化字建设古籍书目数据库有很多好处:①编目人员不必过多考虑字体,不用担心字库中找不到要用的字。②对于那些阅读繁体字有困难的读者来说,识别容易,检索容易,便于普及利用。③著录时简单快捷,不必去字库中翻找繁体字,节省不少时间。但是利用简化字著录也存在着许多明显的缺点:①古籍具有双重价值,包括文物价值和文献价值,一切文物均为不可再生的珍贵资源,著录时应客观著录,尽可能保存原貌,以保证资料的科学价值。古籍反映的毕竟是古代汉语,一些涉及传统语言学、版本、目录、校雠等方面的学术性古籍,如果采用简化字有可能会掩盖其历史的本来面目,因为有些字不能简化,或简化后就体现不出原来的含意。如“徵”字简化为“征”,但是在表示古代五音之一时就不能简化,读音也不相同(读音为zhi)。②著录时使用简化字,与港台、海外相应的文献数据库冲突,不利于古籍的中外交流,也不利于资源共享。③古籍的全文数据库如“中华古籍”、“中央研究院汉籍电子文献(旧称瀚典)”,其内容全部用繁体字输入,与书目数据库的简化字录入相矛盾。所以,笔者认为古籍书目数据库即使采用简化字著录,也需要在重要款目中加上繁体字著录。
    三、古籍书目数据库中繁体字字段的设置
    至于古籍书目数据库中哪些字段应该加上繁体字著录,各馆可根据自己的实际情况来确定。笔者认为建立古籍书目数据库在使用简化字著录的同时,一些重要款目如书名、著者、出版发行等项宜加上繁体字著录,方有助于反映出古籍的全貌。具体方法为:
    1书名的著录
    书名是认识一部书的起点,读者总是首先根据书名来查阅古籍,所以揭示古籍的第一步当然是正确记录书名,而繁简字使用的不同会给读者带来第一视觉上的差异。因此书目数据库中记录若使用简化字,就需要把相应的繁体字著录到字段中。依据《汉语文古籍机读目录格式使用手册》中517字段说明“古籍中题名原为繁体字、异体字,在200字段使用简化字、规范字著录时,应在517字段记录其繁体字、异体字形式”。我们考虑把所有繁体字书名著录在517字段并生成检索点,读者不仅可以看到繁体字的书名,还可以用繁体字检索到书名。
    例一、芝园秘录初刻/(明)茅瑞征辑
    著录为
    2001#$a芝园秘录初刻$f(明)茅瑞征辑
    5171#$a芝园秘录初刻
    例二、疆村丛书:一百七十四种/朱祖谋辑
    著录为
    2001#$a强村丛书$e一百七十四种$f朱祖谋辑
    5171#$a疆
    例三、励耘书屋丛刻
    著录为
    2001#$a励耘书屋丛刻$e八种五十二卷$f陈垣撰
    5171#$a励耘书屋丛刻
    2著者的著录
    同书名著录一样,古籍中著者项的著录也是古籍编目的重要内容之一。古籍中著者项情况较为复杂,不仅需要姓氏学的知识,还需要一些古代地理、职官等方面的知识,才能正确著录著者项,从而有助于帮助读者了解古籍文献的内容。我们把著者的繁体字放置在304字段题名与责任说明附注中,如果需要使繁体字的作者具有检索意义,可以重复使用701字段。
    例一、群书治要:五十卷/(唐)魏徵[等]辑
    著录为
    2001#$a群书治要$e五十卷$f(唐)魏征辑
    304$##$a本书著者繁体字为魏徵
    5171#$a  治要
    701#0$a魏征$f唐$4辑
    701#0$a魏徵$f唐$4辑
    例二、中西纪事:二十四卷/(清)江上蹇叟撰
    著录为
    2001#$a中西纪事$e二十四卷$f(清)江上蹇叟撰
    304##$a本书著者繁体字为江上蹇叟
    5171#$a中西纪事
    701#0$a江上蹇叟$f清$4撰
    70l#O$a江上蹇叟$f清$4撰
    3出版发行者的著录
    出版发行项(者、地)是关于一部古籍在刻印方面相应事项的记录,它包括出版发行时间、出版发行人和出版发行地点。古籍主要由私人出版,凡是私人出版者应以书上所提的个人姓名、斋堂、室名为出版人。出版发行项是判别古籍优劣的一个重要方面,宜加上繁体字著录字段。306字段是出版发行附注字段,可以把出版发行有关情况的繁体字著录在这个字段中,与210字段相对应。
    例一、墨子闲诂:十五卷附录一卷后语二卷/(清)孙诒让辑
    著录为
    2001#$a墨子间诂$e十五卷$e附录一卷$e后语二卷$f(清)孙诒让辑
    210##$a上海$c扫叶山房$d清光绪21年(1895)
    304##$a本书著者繁体字为孙诒让
    306##$a扫叶山房石印
    5171#$a墨子
    例二、隶辨:八卷/(清)顾蔼吉撰
    2001#$a隶辨# e八卷$f(清)顾蔼吉撰
    210##$a聚贤斋$d清同治12年(1873)
    306##$a聚贤斋藏版
    5171#$a隶辨
    四、建设古籍书目数据库的要求
    如果古籍书目数据库中各个记录在简化字的基础上再加上繁体字的著录,那么就可以兼顾到各个层次的读者,但是相应地对于软件、硬件以及编目人员就提出了更高的要求。
    1字库
    由于中国文化源远流长,古今字体发生了很大变化,同时古籍中还存在着大量的异体字、罕用字。现在国内常用的国标代码(GB)仅有6700余字,处理现代文献尚可,古籍编目使用则较为欠缺。古籍编目涉及大量的繁体字、异体字等,所以必须在计算机上挂上一个字体容量大的大字库,但一个字库不可能解决所有问题,使用起来也不方便。有的专家建议按不同层次设置三个字库,分别为基础字库、通用字库、全汉字字库,以解决字库使用时字体不够用的麻烦。基础字库主要收录简化字,适用初学者的需要,达到普及古籍的目的。通用字库以繁体字为主,适应古籍建库的需要。全汉字字库字量最大,专供研究者使用,字体可以随时添加。
    2繁简字转换系统
    如果能像汉字与汉语拼音对应转换那样,使用一个简繁字自动转换软件,建立古籍数据库就方便容易得多了。但由于古籍中繁简字不是一一对应,对应关系非常复杂。例如简化字“后”对应“后”和“後”,“后”的原始意义,指皇帝或君王的正妻;而“後”字义与“前”相反,如午後、後来、後代等,两个字意义不相同,如果只是简单地利用软件自动转换,有可能发生一些字义上的混淆,产生阅读障碍。
    3编目人员的素质
    古籍编目人员除了掌握编目知识,熟练使用计算机外,还需要一定的古汉语知识。古籍编目主要是对古籍进行著录、鉴定版本、分类等,这些工作质量的好坏往往与能否正确理解古籍的内容密切相关。因为古籍文献与普通图书不同,古籍一般没有断句,且用文言文、繁体字写成。要想正确理解古籍内容,就要求编目人员做到:①区分书名的不同情况。古籍中有的书名前冠有说明性文字,书根、卷端、封面等各处的书名不尽相同,有的还用不同的书法题写书名。编目人员需要仔细分析书名,正确著录,才能出色地完成古籍的编目工作,例如一部古籍书名为《壶山四六》,四六是一种文体,若把它当作卷数来著录,就会贻笑大方。②分清著者的名。古人既有“名”,又有“字”、“号”,有的还有别号。古籍标识著者时有的只有字或号,有的在姓名前连带有籍贯、官职、爵号等,情况各不相同,应分清哪部分是名,哪部分是字或号,还要多了解一些这方面的知识,尽量规范著录。如《陶元亮诗集》的作者,书上标识为陶元亮撰,陶元亮就是陶渊明,元亮是他的字。⑧看懂古籍序跋、牌记等的内容。因为古籍都是繁体字,所以就要求编目人员不仅要认识繁体字,还要了解繁简字的对应,尤其不是一一对应的那些繁体字、简化字,根据实际语境的不同,判断出应该使用哪一个字。这些无不要求编目人员具备深厚的古汉语修养,故此编目人员应在日常工作中加强古汉语知识的学习,不断提高古汉语修养,才能胜任图书馆的古籍编目工作。
    参考文献:
    [1] 辞海编辑委员会编.辞海[M].上海:上海辞书出版社,1989:3110
    [2] 《中国文献编目规则》编撰小组编.中国文献编目规则[M].广州:广东人民出版社.1996:68
    [3] 中国国家图书馆编.汉语文古籍机读目录格式使用手册[M].北京:北京图书馆出版社,2001.
    [4] 肖碧云.浅谈图书资料人员的古汉语修养[J].安徽农业技术师范学院学报,1996,10(3):101-106
    [5] 林亦等.论古籍整理用计算机字库中的字形处理[J].广西大学学报(哲社版),1996,65(2):49-54
    [6] 彭江岸.论古籍的数字化[J].河南图书馆学刊,2002(2):63-65
    [7] 桂罗敏.网络阅读古籍的几个问题与建议[J].现代图书情报技术,2001,84(1):86-87
     
    [阎瑞君、陈军:河北师范大学东区图书馆。]
    原载:《图书与情报》2003年第3期 (责任编辑:admin)
织梦二维码生成器
顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
栏目列表
评论
批评
访谈
名家与书
读书指南
文艺
文坛轶事
文化万象
学术理论