近年来,大量尘封已久的清史资料得以整理,并成为推动清史研究发展的动力之一。然而,这些史料的获取、梳理和分析也成为摆在研究者面前的一个难题。随着数字技术的进步,各类数据库的建设为解决这一问题提供了可能,但数据库的建设规划等问题也随之而来。 5月28—29日,由中国人民大学清史研究所主办的“数字人文与清史研究”工作坊召开,多学科学者围绕相关问题进行了研讨,数据库建设的标准和核心理论成为学者关注的焦点。 避免数据重复收录 据不完全统计,目前,国家社科基金就各类数据库建设立项项目达127项。2010年以来,仅与中国历史相关数据库建设的国家社科基金重大项目就有7项。各类数据库的建设为学术研究提供了丰富的基础数据,面对各式各类的数据库,学者们考虑的早已不是“能不能用”,而是“如何建设”、“如何使用”的问题。 拥抱大数据对历史学研究者而言,不仅仅是将各类数据库作为检索资料的平台,更是顺应时代发展,将传统的资料整理通过建设数据库加以延续的重要方式。中国人民大学清史研究所教授夏明方有着丰富的文献整理经验,目前他正承担着国家社科基金重大项目“清代灾荒纪年暨信息集成数据库建设”。从纸本文献的整理到与时俱进建设数据库,他坦言,现在到了一个新的时代,需要建设一个更便捷的平台。 建设数据库不只是将文献资料电子化再加以汇集那么简单。在数据库建立之前,详尽的设计和规划非常必要。例如,从事历史地理学研究,地理学和历史学的学科思路存在较大差别,这些差别使学者对于数据库的需求也有所区别。陕西师范大学西北历史环境与社会经济发展研究院教授张萍承担的国家社科基金重大项目“丝绸之路历史地理信息系统建设”正在紧锣密鼓地进行,对着手建设数据库,她显得慎之又慎。张萍表示,做这个系统一定要有一个思想在里面,为什么要做这个系统?这个系统构思是什么样的?系统出来以后为哪些人服务,能够解决哪些问题?这些都是必须要考虑的问题。 目前国内数据库建设如火如荼,但在很多学者看来,要想做出高质量的数据集并不容易,尤其是得到学术界广泛引用,对相关学术领域有重大推进的数据集更难。中国人民大学清史研究所副教授胡恒表示,从宏观而言,部分数据库建设缺乏长远规划和协调。重复收录现象较为突出,而且缺乏数据整理的统一规范,如果不在数据库建设的开始阶段进行长远规划,最终可能导致的数据浪费将相当严重。 (责任编辑:admin) |