历史网-历史之家、历史上的今天!

历史网-中国历史之家、历史上的今天、历史朝代顺序表、历史人物故事、看历史、新都网、历史春秋网

“大数据时代史学研究的理论与方法”笔谈——数字人文及其对历史学的新挑战(2)

http://www.newdu.com 2019-06-21 《史学月刊》2018年第9期 包伟民 参加讨论

    二 提出议题
    当然,正如不少论者所指出的,全文检索远未发挥出计算机数据库的所有功能,其所强调较多的,还有提出议题与统计分析两个方面。
    议题是史学研究的起点。人们观察历史,不免站在当今的立场上来提出议题,以求了解过去。但如何提出有意义、得以真正展开讨论的议题,还有赖于我们对历史社会的认识,去发现那些有意义的历史现象。正是在这一意义上,历史资料数据库的发展,给我们展示了新的可能,也带来了新的困惑。
    由于数据库能够帮助研究者比以前更加方便地搜集资料,并据以展开分析讨论,因此有论者特别强调“量化研究的一个重要优势是,能够发现靠传统文献阅读无法发现的隐藏在历史资料堆中的史实”(梁晨、董浩、李中清:《量化数据库与历史研究》,《历史研究》2015年第2期,第121页),甚至更进一步,可以经过“同时比对上千条数据,辨识其中模式”(徐力恒、陈静:《我们为什么需要数字人文》,《社会科学报》,2017年8月24日,第5版),也就是认为利用数据库的分析,可以在复杂的历史现象中发现传统研究方法难以觉察到的问题。这样的推论,在逻辑上自然顺理成章。不过,更为周全的观察还提醒着我们,这一推论的适应面存在着明显的局限性。除非我们能够满足它所有必要的前提条件,否则推论的结果难以达到。那就是:第一,相关研究领域保存有丰富的档案文献,可以构建起信息量足够的数据库;第二,利用计算机来阅读历史资料,如前文所论,至少在目前,还停留在词义直接对应的水平,这就要求历史文本的字面含义与它所可能蕴含的历史信息完全对应,否则机器阅读就无能为力。但是这在中国古代史研究领域,条件似乎尚欠充分。
    人类历史内容极其广泛,不同领域存世的历史资料差别明显。不少学者在讨论中经常举为论据的“大数据”,大多需要以丰富的存世档案文献为基础,在中国古代历史领域,却基本不存在这样的条件。在印刷术未能普及应用之前的那些历史阶段,更是如此。所以信息技术在中国古代史研究领域的应用,可能与近现代史领域有一些不同,不应忽视。
    因此,在意见的另一方面,常被论者提及的则是王国维的“读书得间”之论:“宜由细心苦读以发现问题,不宜悬问题以觅材料。”(转引自陈爽:《回归传统:浅谈数字化时代的史料处理与运用》,《史学月刊》2015年第1期,第15页)强调从细心阅读历史文献之中来发现问题。
    所谓经过大数据分析比较来发现问题,不可能将史学分析完全交给计算机自发地操作,而必须由研究者设置一定的前提条件。也就是说,其实是由研究者事先提出研究目的或者目的范围,也就是“悬问题以觅材料”。这些问题当然不可能凭空得来,必然有其依据。除了研究者对特定历史社会的认识之外,比较直接的应该就是现代社会科学一些范式的指引。这就难免会与作为研究对象的历史社会之间存在一定的隔阂。这样一来,岂非坐实了关于“实际情况则是研究者预先设定的思路往往成为搜寻和筛选数据的藩篱而不自知”的批评(胡优静:《历史学数字资源利用的误区及其应对》,《史学月刊》2017年第5期,第27页)?
    而所谓“读书得间”之论,“由细心苦读以发现问题”,强调的是要通过分析存世历史文本、在字里行间的细节中发现前人所忽略的问题。其与前者的差别,主要体现在立足点之不同,即立足于客体(历史社会),从深入观察之中来发现问题,还是立足于主体(研究者),根据今人的主观目标来设定问题。尽管这两者之间还存在着相当复杂的联系,但立场的区别是明显的。
    史学研究的目的是为了理解历史。所谓一代人有一代人的历史,指的是每一代人都会对历史有与前人不同的理解。因此在史学研究中,主体与客体常常相互影响。相对而言,强调主体,在于其研究目的,即从今人理解历史、使之服务于当今的目的出发来提出问题;立足于客体,则是强调从研究对象本身的实际情况出发,来发现问题、提出问题。也就是所谓的要“贴近史实”。笔者的理解,这里可以包含两层意思:一是要在总体上把握研究对象的全貌,二是要充分发掘历史的细节。
    具体到笔者相对熟悉的宋代史研究领域而言,其中相较于其他历史时期一些突显的现象,是任何观察者都不能忽视的,一直为人们所重视。如多民族政权并存、赵宋政权文官制度的发达与武功之不振、经济与技术的突破性发展、思想文化领域新气象的形成、南方地区的开发以及随之带来的地域格局的变化、城市新面貌的形成等等,是任何观察者都不能忽视的。论题虽旧,其命弥新。只有在基本把握了全貌的前提下,再将各方面的历史现象联系起来观察,以研究者独到与深邃的眼光,才有可能从历史文本的字里行间发现隐藏于其中的一些重要历史现象,找出可以深入讨论的问题。也就是从中去寻找某一历史现象可能蕴含的意义,来解答它的“为什么”,即所谓“得间”。更为重要的是,也才有可能使得对问题的讨论契合于历史发展的大趋势,将局部与总体有机地结合起来。
    正是在这一意义上,目前学界多所批评的所谓“检索体”类文章,即主要依靠数据库检索来完成资料搜寻工作,或者依靠机器阅读来确立讨论议题的,可能正在于它们既不能把握住特定历史社会的基本脉络,对于引为论据的历史文本又常常割裂其与上下文之间的有机联系,更割裂了其与历史大背景之间的联系,在典型地“寻章摘句”之余,更以今人之心揣古人之腹,可以说在其所提出的议题与其对议题的论证两方面都脱离了历史实际。
    也正因此,能否通过大数据分析来发现史事中的问题,其前提仍在于研究者对于历史社会基本脉络及其细节的掌握是否充分。“读书得间”,尤其在史学训练的初级阶段,不可跨越。
     (责任编辑:admin)
织梦二维码生成器
顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
栏目列表
历史人物
历史故事
中国古代史
中国近代史
神话故事
中国现代史
世界历史
军史
佛教故事
文史百科
野史秘闻
历史解密
学术理论
历史名人
老照片
历史学
中国史
世界史
考古学
学科简史