语言文学网-学术论文、书评、读后感、读书笔记、读书名言、读书文摘!

语文网-语言文学网-读书-中国古典文学、文学评论、书评、读后感、世界名著、读书笔记、名言、文摘-新都网

当前位置: 首页 > 学术理论 > 古籍整理 >

古籍数字化的使命与应用

http://www.newdu.com 2017-10-30 中国文学网 尹小林 参加讨论
一、古籍数字化的使命
     1.古籍数字化是延续民族文化的重要手段。中华五千年优秀文化遗留下来卷帙浩繁的古籍文献资料,虽然历代都曾做了很多抢救整理工作,但经过主观人为的编纂删修,以及因承载介质或时代、自然等因素造成的减损、流失,许多古籍消失了,而且无法再生。封藏于高阁之中的古籍文献资料在呼唤人们重新发现和认识它们的价值。古籍数字化,是当代技术的进步为古籍整理工作提供的一个新途径,通过复制转存,可以相对真实、永久地保存古籍原貌,其内容理论上可以无限期保存。我们可以利用现代技术手段,对古籍进行整理和挖掘,发现其中对现代社会的发展有益的部分,为世界人民的和谐共生服务。
     2.古籍数字化为传统文化走向现代化提供了必要条件。随着互联网技术的发展,网络传播不受时空限制、信息量大、传播速度快的特点,使数字信息成为最重要的文化资源。互联网上的数字图书馆,将使人类的精神文化宝库跨越时空,实现全人类资源共享。在现代社会,技术的难关已经不再是困扰人们的主要问题,如何在传播民族文化的同时,保存民族文化的独立品格,维护世界文化多元性的存在,是问题的关键所在。作为东方文化重要组成部分,中华文化在这一方面,也应该有自己响亮的声音。将汗牛充栋的中华文化典籍数字化,搬上互联网,让古老的中国文化借助现代信息技术再现辉煌,让全世界人们感受到东方文化恒久弥新的魅力,也可以使全球范围的炎黄子孙能够方便、快捷地学习了解本民族的文化。文化的传承与保护只有与技术的进步保持同步,才能世代相传。时至今日,华丽的缣帛、朴拙的青铜器都已经成了历史的遗物,一代有一代之学术,也有一代的文化载体。数字化时代要求传统文化也应该进入数字化的行列。当今社会,数字化产品可以迅速、准确地进行传递和交流,使传统文化在信息传播的深度、广度、速度上有一个质的飞跃。
     3.古籍数字化为学术研究开辟了一条新途径。自19世纪末20世纪初以来,中国传统学术在西方学术冲击下,发生了巨大转折。目前,言学者必论西方,学术话语与研究理路很多都来自西学界。一味的排外是愚昧,一味的尊崇他人也是愚昧。在西方文化大量渗透的形势下,什么才是我们的中流砥柱?决不是来自西方的学术。我们在学习西方的同时,不能以变成西方为目标,而应该以发展自己的传统文化为主旨。通过数字化工程,为全球华人,为学术界提供良工利器,提供更贴近现代学术的典籍资源,与学术界互动,推进传统文化的现代化进程。通过对传统文化的深入了解与接触,能够增强我们的民族自尊心和对本族文化的自信心,取其精华弃其糟粕,弥合文化的断层,增强民族凝聚力,使中国传统文化获得健康的发展,推进社会的稳定和谐进步。
     二、古籍数字化应用举隅
     学术信息的检索实现是古籍电子化过程中最重要的一个环节,涉及到古籍分类、校勘、字形、计算机字库、关键词索引、检索程序(计算语言、程序算法)、人机界面等诸多问题。实现检索之后,进一步运用到学术研究中去,则有很多技巧,这里举例来说明。
     例1:“有无”“先后”“多少”三大主题。运用基本检索功能从事学术信息的挖掘,可以总结出“有无”“先后”“多少”三大主题。
     (1)孰有孰无。王力先生多次引用赵元任“言有易,言无难”的话来说明学术研究中对文献进行“涸泽而渔”式的分析的困难。但有了计算机检索技术,这些就不成为问题。
     (2)孰先孰后。1997年,我第一次去汤一介先生家,乐黛云给我讲了一个故事:若干年前,她在国外开一个学术会议,会上有外国学者提出“忧郁”一词在“十三经”“二十四史”中都没有,可能最早出现于日本,当时在场的许多中国学者竟无法回答。会后,她利用燕京大学的诸子引得,查出早在春秋战国时期中国就有“忧郁”一词(见《管子》),肯定是此词的源头了。现在这类问题已经不存在了。
     (3)孰多孰少。社科院黄正建研究员在《唐代“士大夫”的特色及其变化》一文中,就使用了“士大夫”“士君子”在两《唐书》和《宋史》中出现次数来说明其观点。这些材料则是利用文献检索得来的。
     例2:古书用字分析。清朱彝尊《经义考》卷二百八十九详细记录了石刻各经字数。用《国学宝典》软件的统计功能,仅需数秒钟,即可完成各经字数统计。可以发现,《尚书》《孝经》自宋以来,在一千多年的流传中内容几乎没有变化;清代所用《孝经》则少了105字(可能是故意被删掉);现存《周易》《毛诗》字数较宋代有所减少,可能是个别篇章或段落有所流失,《论语》《孟子》《尚书》字数有所增加,是否为清代加入,或新发现逸文尚待研究。
     例3:字频与用字量统计。经统计,《红楼梦》全书总字数729636个(不含标点),用字4426个,使用频率最高的10个字顺序是:了、不、一、来、人、道、我、是、说、他。如果将全书分为三部分进行统计,其结果是:前40回,总字数为228915字,用字量3661个;中40回,总字数为266572字,用字量3655个;后40回,总字数为234149字,用字量3139个。前40回和中间40回,用字量相差甚小,差率约为1.6‰,后40回与前40回相比,差率约为166‰,差率达100多倍。
     例4:特殊查找和检索技巧。如查找中国四大民间故事“孟姜女的传说”,若将关键词定为“孟姜女”,则最早只能查到宋元以后的文献,大量重要的前期资料被遗漏。此故事原型是:杞梁之妻寻夫,夫死,向城恸哭,城为之倾。如果将检索条件定为“杞”“妻”“哭”三个关键字,则可找出大量相关材料。
    原载:《中国社会科学院院报》2007年9月18日 (责任编辑:admin)
织梦二维码生成器
顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
栏目列表
评论
批评
访谈
名家与书
读书指南
文艺
文坛轶事
文化万象
学术理论