语言文学网-学术论文、书评、读后感、读书笔记、读书名言、读书文摘!

语文网-语言文学网-读书-中国古典文学、文学评论、书评、读后感、世界名著、读书笔记、名言、文摘-新都网

当前位置: 首页 > 学术理论 > 古代文学 >

大数据视阈中的文学地理学研究——以《入蜀记》《北行日录》等行录笔记为中心

http://www.newdu.com 2017-10-17 《文学评论》 刘京臣 参加讨论

    内容提要:大数据(Big Data)对传统研究产生了极大影响,也为文学地理学学科在更为深广的领域拓展,提供了技术支持。融文学、史学、地理学、地图学等诸要素于一身的行录笔记,是文学地理学学科中特征最明显、最易与信息技术相结合的一类。通过对行录笔记进行数据挖掘(Data mining),将道里遐迩、郡邑更革以及疆域、建置、名胜、古迹、山川、江河、时事等数字化,既能与其他文献互证,又能补文献之缺。与地理信息系统(Geographic Information System,即GIS)结合,在方志与其他相关文献建立起关联的基础上,不但可以增加地图的标注范围,依托虚拟现实(Virtual Reality,即VR),还可将城池区划、布局、建筑等立体呈现。
    关 键 词:文学地理学/行录笔记/数据挖掘/地理信息系统/虚拟现实/数字方志体系
    基金项目:本文为国家社科基金青年项目“宋代文学地图数字分析平台研究”(12CZW032)阶段成果。
    作者简介:刘京臣,中国社会科学院文学研究所。
     
    20世纪二三十年代,我国前辈学者提出了“文学地理学”这一概念。新时期以来,越来越多的学者将兴趣转向这一领域,虽然在文学地理学学科归属等问题上存在着一定分歧,但在理论体系、研究方法,特别是实证研究等领域,取得了一系列重要成果①。2011年“首届中国文学地理学暨宋代文学地理研讨会”的举办与“中国文学地理学会”的成立,标志着文学地理学这个新兴学科得到了学术界的正式认可。与此同时,王兆鹏、何勇强等学者试图以“中国文学数字地图平台”和运用GIS来推进相关研究②,这是非常值得肯定的。
    今天,已进入了以大数据、云计算为代表的新时代,虽然传统的研究方式仍在人文社科领域发挥着重要作用,但不应忽视新技术、新理念对传统研究可能带来的巨大改变。
    行录笔记是文学地理学学科中最具鲜明特征的一类,它集文学、史学、地理学、地图学、建筑学、气象学等诸多领域于一身,为从技术层面进行深入研究提供了宝贵素材。我们以《入蜀记》《北行日录》《揽辔录》《北辕录》《使金录》等五部行录类笔记为中心,来看数据挖掘、地理信息系统与虚拟现实是如何改变传统文献的研读、分析与呈现的。上述五部文献,先贤时彦多有研究③。本文所要进行的,是尝试用技术手段进行再次研究,以期为同类型的相关研究提供可以复制的范式。
    一 数据挖掘与文献关联
    一般而言,“数据挖掘面对的数据是海量的、杂乱的、无序的、非结构性的”④。本文所涉及的几种笔记,具有较为统一的结构,都有较为鲜明、统一的时间与地理标识,这有利于系统自动识别、提取特征。但与这五部笔记相参的其他文献,很多并不具有结构性特征,故而只有借助数据挖掘才有可能找出文献之间可能存在着的关联。
    本文中我们将《入蜀记》《北行日录》《揽辔录》《北辕录》《使金录》等五部笔记视为文献A(分别标示为A1—A5),除此之外已经数字化的、可以被系统自动识别的文献视为B(分别标示为B1—B∞)。数据挖掘,既要在AB之间进行,也要在文献A内部展开。会出现如下几种情况:
    一是AB之间找不到相同因素,是一种最为常见、也最为复杂的情况,因与本文关系不大,暂且不论。
    二是在给定范围、模式的情况下,AB之间有少量相同因素,例如都涉及了某人、某地,但不同文献有着各自不甚相同的表述,这些表述之间没有重合,这就为增补完善文献提供了可能性。
    通过数据挖掘,我们会发现经行中所接洽之官员,有的在史书中有传,可以笔记与史书相参相证。例如《北行日录》《揽辔录》皆曾言及敬嗣晖:
    (乾道五年十二月)二十九日庚戌……入见如仪,受衣带而退,就馆赐茶酒,左宣徽使敬嗣晖押伴。⑤
    敬嗣晖,易州人。石琚榜下及第。亮时为宣徽使,寻除参知政事。亮死,贬为庶人。次年,复官,召为宣徽使。⑥
    据《金史》《金史详校》,敬嗣晖生平大抵如下:
    敬嗣晖字唐臣,易州人。登天眷二年(1139)进士第……海陵王立……历谏议大夫、吏部侍郎、左宣徽使。正隆元年(1156)三月庚申,以左宣徽使敬嗣晖、大理卿萧中立为贺宋生日使⑦。五月己未,敬嗣晖等贺天申节⑧。三年(1158)正月,宋贺正使孙道夫陛辞,海陵使左宣徽使敬嗣晖谕之⑨。正月丙寅,夏奏告使还,命左宣徽使敬嗣晖谕之⑩。七月甲申,左宣徽使敬嗣晖、吏部尚书李通为参知政事(11)。十一月癸未,诏左丞相张浩、参知政事敬嗣晖建置南京官室(12)。
    世宗即位,恶嗣晖巧佞。大定二年(1162)二月癸丑,诏降萧玉、敬嗣晖、许霖等官,放归田里(13)。嗣晖练习朝仪,进止应对闲雅,由是起为丹州刺史。未几,丁母忧,起复为左宣徽使。大定七年(1167)十二月戊戌,世宗顾谓左宣徽使敬嗣辉日:“如卿不可谓无才,所欠者纯实耳。”(14)八年(1168)二月甲午朔,制子为改嫁母服丧三年(15)……九年(1169)正月辛酉,上与宣徽使敬嗣晖、秘书监移刺子敬论古今事(16)。十年(1170)正月壬子朔,宋遣试吏部尚书汪大猷、宁国军承宣使曾觌贺正旦,楼钥以书状官从行,左宣徽敬嗣晖押伴(17)。十一年(1171)十月壬寅朔,以左宣徽使敬嗣晖为参知政事(18),十二月丙辰,参知政事敬嗣晖薨(19)。
    《北行日录》《揽辔录》所记敬嗣晖事迹虽然简略,但其籍贯、及第时间、任职、贬谪与起复等与《金史》《金史详校》相证,全然无误。唯有押伴时间,据楼钥所载,当为乾道五年十二月二十九日庚戌(1170年1月17日),《金史详校》记在大定十年正月壬子(1170年1月19日),中间仅差一天。大抵楼钥所记,为宋使臣初见押伴使之时间,施国祁所称则为宋使臣与押伴使一同觐见金主之时间,二者并无原则性差异。不同的文献记载了大抵相仿之事,这些记载或繁或简,或详或略,但其基本史事不误,这是文献间互证之例。
    还有一种情况,是文献记载颇有差异,可补文献之缺失。例如经行中所接触之官员,大多数在史书中无传,将其爬梳出来,在宋金两国的职官表中给予一个合适的坐标,对于了解两国官吏之任职、补充相关方志等不无裨益。楼钥所记的押伴使唐括安德,为唐括安礼之弟,正史无传,据《北行日录》可补其生平事迹:
    (乾道五年十一月)二十八日庚辰。晴。掌仪引接等渡淮传衔,少顷同北引接礼信司高琚等传到接伴使副名衔:正使昭武大将军、行尚书吏部郎中、上轻车都尉、彭城郡开国伯、食邑七百户唐括安德。(20)
    (乾道五年十二月)二十一日壬寅。晴。赐宴东馆……安德为开州刺史,以治行闻,道中颇读《庄子》,故临事间有可观。然贪沓狠愎,不知何以有政声。益知北方守令难得循良者。(21)
    (乾道六年正月)六日丁巳。晴……仍差安德、德裕送伴,尽借回程私觌,泛送从之。车马欲行,安德方呼其家人以细车般所得还家,如木绵之类,复载至汴京,滞留至晚方行。(22)
    这三条记载言简意赅地刻画出一位金朝官吏的形象:喜读《庄子》,颇有令名,临事间有可观,另一面却是“贪沓狠愎”,借公干之便转运货物。
    第一种情况是互证,第二种情况是补缺,第三种情况则较为复杂一些:选择不同的文献,进行不同的对比,会有不同的结论。《北行日录》记载:
    (乾道五年十二月十八日)是日闻接伴使之兄左丞安礼,罢为沧州刺史。初安礼娶金主之妹。妹死,欲妻以女,辞以不当复娶妻侄,强之,不可,金主怒以抗敕坐之。(23)
    既然提到唐括安礼,系统便首先会与《金史》匹配。《金史》数次提及唐括安礼之处皆未言及此事,故而我们可以据《北行日录》以补《金史》唐括安礼事迹。但是若将《北行日录》与《金史详校》匹配,则会发现施国祁已经发现《金史·唐括安礼传》未言及此事。这是一个非常典型的例子。就文献生成时间看,《北行日录》最早、《金史》次之、《金史详校》最晚。就文献内容看,《北行日录》与《金史》之间有关联,但没有重合,故而可补《金史》之缺,使之更为完善。《北行日录》与《金史详校》之间有重合,重合的原因在于《金史详校》所用的材料直接源自《北行日录》,这两种文献之间的重合是因同源而产生。简单地讲,我们利用数据挖掘,目的之一就是能在没有《金史详校》之类文献的情况下实现系统自动增补文献。增补文献的途径无非就是两种:一是人工爬梳,一是数据挖掘。考虑到文献的浩瀚,后者更为便捷,也代表了未来的发展方向。
    三是文献之间存在部分重合。有如下几种可能:
    第一,同一作者在某一时期内创作了不同体裁的作品,因所处的环境、所面对的对象相同,故而虽体裁不同,但作品中所言及之人、事、物或有重合。如陆游《入蜀记》与其人蜀诗歌、范成大《揽辔录》与其使金诗等都有很多相似的描写。
    谈到另外的可能性之前,我们先对下段《入蜀记》进行数据挖掘:
    二十八日……过狮子矶……至马当……二十九日,阻风马当港中……饭已,登南岸,望马当庙……八月一日……过澎浪矶、小孤山,二山东西相望……又有别祠在澎浪矶,属江州彭泽县,三面临江,倒影水中,亦占一山之胜。舟过矶,虽无风,亦浪涌,盖以此得名也。昔人诗有“舟中估客莫漫狂,小姑前年嫁彭郎”之句,传者因谓小孤庙有彭郎像,澎浪庙有小姑像,实不然也。(24)
    这段文字涉及狮子矶、马当山、澎浪矶、小孤山等江行诸险,以及小姑、彭郎等传说中的神仙。系统会切分文本,提取地名、人名、诗句等关键词,然后与其他文献进行匹配,如以下便是被提取出来与上引文本相关的五例(25):
    1.山苍苍,水茫茫,大孤小孤江中央。……舟中贾客莫漫狂,小姑前年嫁彭郎。(苏轼《李思训画<长江绝岛图>》)(26)
    2.浮苍宛宛两眉长,泻碧汪汪一鉴光。山海相逢非浪语,小孤明日嫁彭郎。(孙觌《何嘉会以侍儿归彭生小诗戏之》)(27)
    3.此中道路多险恶,正在马当小孤之两间。(孔平仲《马当夹阻风》)(28)
    4.千秋马当庙,千寻狮子矶。(张栻《过马当山》)(29)
    5.山小孤,矶彭郎,中纳百谷吞三江。江流澎湃不可当,势比折木倾银潢。渴龙一支走马当,宛然天骥初腾骧,回缰矗立江中央。(岳珂《发排湾过小孤彭郎祠下遂宿马当》)(30)
    这五例可以分为两类:1、2两例,单纯从关键词看与《入蜀记》有重合处,但明显一为题画之诗、一为戏赠之作。陆游在经行小孤山时径用苏轼诗,那么能否说孙觌诗亦从苏轼诗歌而来,还是苏、孙二诗仍然另有渊源?这就涉及“影响-接受”层面的问题了。欧阳修《归田录》云:
    世俗传讹,惟祠庙之名为甚……江南有大、小孤山,在江水中嶷然独立,而世俗转孤为姑,江侧有一石矶,谓之澎浪矶,遂转为彭郎矶,云彭郎者,小姑婿也。余尝过小孤山,庙像乃一妇人,而敕额为圣母庙,岂止俚俗之谬哉。(31)
    据此可知苏、孙二诗“嫁彭郎”之语,或自欧公而来,化以谐语入诗。
    由此见出文献之间存在部分重合的第二种可能,那就是不同的作者虽无相似经历,或因踵武前人而使作品出现重合现象(如陆游《入蜀记》之于苏轼《李思训画<长江绝岛图>》诗),或因有相同的文献渊源而产生重合(如苏轼《李思训画<长江绝岛图>》、孙觌《何嘉会以侍儿归彭生小诗戏之》之于欧阳修《归田录》)。换言之,这其中都存在着或隐或显的“影响-接受”关系。
    3、4、5例为诗人经行马当山所做,无论是从题目还是从内容来看,都与陆游《入蜀记》的描写有相关之处,故而这两种文献之间有一定的重合:它们都有共同的书写对象,且都是作者亲身经历,行之于笔墨,有重合亦在情理之中。因此,文献之间存在部分重合的第三种可能便是不同的作者有相似的经历,故而作品中的部分内容可能趋同。这一类型,在行录类笔记中是最为常见的。本例中,我们利用数据挖掘寻找与陆游有过相似江行经历并且创作过涉及狮子矶、马当山、澎浪矶、小孤山等江行诸险作品的诗人及诗作,不意却有了两种结果,这也正说明了数据挖掘的可靠性与复杂性。
    数据挖掘与传统研究没有本质区别,其要义都在于找到文献之间可能存在的关联,从而建构起更为完善、全面的文献网络体系。不同之处仅在于前者是利用了现代技术手段,对海量数据进行穷尽式的挖掘,而后者则需研究者自行爬梳资料,有时甚至兀兀穷年才能解决某一问题。
    

(责任编辑:admin)
织梦二维码生成器
顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
栏目列表
评论
批评
访谈
名家与书
读书指南
文艺
文坛轶事
文化万象
学术理论