三方合力推进古籍数字化 古籍数字化目前主要有三种方式,一是原样数字化,即按照古籍的原貌原样扫描或影印、最大限度地保存古籍历史信息;二是文本式数字化,即将古籍全文录入整理成可检索的数据库;三是知识型数字化,即按照知识管理的模式对古籍数据库进行标引等深度加工。 “对公共图书馆而言,所做的工作主要是第一种。有一些企业在做第二种数字化。”张志清介绍说,目前国家图书馆等公共图书馆和高校图书馆普遍利用馆藏资源进行数字化开发,如国家图书馆开发的数字古籍善本、碑帖精华、甲骨世界、西夏碎金、年画撷英等提供了馆藏古籍、碑拓、甲骨等文献的影像,读者不必到馆即可在网上浏览。 一些高校科研单位也在从事古籍数字化工作。北京大学图书馆建设有“秘籍琳琅——北京大学数字图书馆古文献资源库”,是完整展示北京大学图书馆藏古籍的网络平台,读者可以在其上检索北大图书馆藏全部各种类型古文献元数据,查看和浏览古籍书影、电子图书,以及拓片、舆图图像。北大馆牵头建设的“学苑汲古——高校古文献资源库”,更是汇集了包括北大图书馆在内的国内24所高校图书馆藏古籍元数据60余万条、书影20余万幅,电子图书8.35万册,是目前世界上规模最大的古籍书目数据库之一。 商业公司开发的古籍数据库是古籍数字化的重要组成部分。以北京爱如生技术公司为代表的企业开发的大型古籍数据库如“文渊阁四库全书”“中国基本古籍库”“中国方志库”“中国历代石刻史料汇编”“四部备要”“古今图书集成”等,规模庞大,检索方便,很受图书馆和读者的青睐。据统计,截至2012年,我国公藏机构已经拥有超过20亿字的数字化文本格式的古籍。可以说,目前常见古籍基本上都能在互联网上找到数字化格式。 但正如一些学者所指出的,全文化的古籍数据库虽然方便检索,但准确性不够,在论文、著作中征引文献时,仍要使用公认的权威版本的纸书。北京大学中文系教授、全国高校古籍整理研究工作委员会办公室主任卢伟说,在最近几年的硕士博士生论文答辩中,经常出现征引文献出错,一问都是使用古籍数据库造成的。 “当前商业性的古籍数据库存在贪大、求全的倾向,虽然检索方便,但准确性不足是其硬伤,今后应该重视数字善本的建设,要让读者拿来就能用,敢于征引。”中华书局总编辑顾青说。 今年“4·23”世界读书日期间,中华书局推出了“中华经典古籍库”微信版。这个包含896部古籍、5亿字的古籍库就规模而言不算大,但就其准确性而言,则是其他商业性古籍数据库难以比肩的。顾青说,“我们的古籍库是基于几代学者整理点校的版本,体现了新中国古籍整理的最高水平,可以成为读者信赖和依据的本子,这一点是我们的优势。” 据顾青介绍,新中国成立以来整理出版的古籍近3万种,其中古籍整理类约1万种,古籍影印类约4000种,古籍普及类约1.5万种。另外,民国时期整理的古籍还有1万多种。但这些点校本的版权分散在全国几十家古籍出版社和社科出版社,“我们也希望能把他们出版的较好的古籍点校本纳入中华经典古籍库,但不少地方出版社想自己搞数字化,不太愿意把版权拿出来。”顾青认为,如果各出版社单打独斗,就会出现数十个小型古籍数据库,难以形成规模优势。 (责任编辑:admin) |