量化历史是什么? 量化历史是一系列利用数据分析的方法来研究历史的技艺的总称。有时候,经济史学家也把量化历史称作cliometrics。二十世纪五十年代到六十年代,研究社会史、政治史和经济史的学者呼唤“社科历史学”的新发展,这个名称也得到了广泛的关注。所谓“社科历史学”,即是在研究历史问题时使用社会科学中使用的方法。这些学者同时呼唤社会科学的研究者们谨慎地处理关于当下的问题,注意这些问题的历史背景和源起。无论是对于历史的还是当下的问题,这些学者的共识是,有必要使用新的方法和资料来进行研究。量化历史的研究在他们的努力下取得很多进步。 经典的史学研究依赖于对于文本资料、档案的研究,把历史用叙事的方法加以呈现。历史学家关心特定的现象或是事件,这些可能是王朝、帝国的兴衰,也可能是个人生活的点滴。量化历史研究的目的和经典史学十分相似,但是会把许多事件和现象提炼而来的历史的模型(pattern)作为研究对象。这样一个出发点使得研究分析中所处理的问题大大不同。举例来说,经典的历史分析会把一次总统选举当成是一次事件,但是量化历史学家却把每一次总统选举都看成是所有总统选举所组成的数据集合中的一个元素,他们的研究兴趣在于找出一些规律来总结这个集合,或者是这个集合中的某个元素。一个家庭的生活史可以被看作是一个国家、一个地区、一个社会阶层,或是一个民族的生活史的一个元素。在过去那些被记录下来的文档里,每一个个案都是微不足道的,但是把个案整合、组织起来放入一个电子化的数据库中时,研究者就可以加以分析,得出数据上显著的结果。因此,人口统计、投票信息、关键档案(例如出生、死亡、婚姻)、或是商业契约、货物运输档案、奴隶贸易的卷宗,甚至是犯罪记录,这些都有助于历史学家找寻过去的社会、政治和经济活动的规律,找出历史的深层结构。 对于历史学家而言,量化历史研究需要一系列新的技艺。其中最重要的莫过于在他们的研究中整合入数据的集合或是矩阵。Floud把一个数据集定义为“历史学家所能掌握的全部史料数据中,与研究问题相关性最强的一个数据集合”。一种现象的无数个实例——比如说,所有的美国总统选举——组成了数据集的案例。围绕这些案例收集的信息碎片——比如候选人选票竞选、选举年份、投票总数——就成为该数据集的变量,亦即是其中任何一个具体案例的变量。历史学家将数据置于表格中,排布在行与列的矩阵里,行通常代表案例,列通常代表变量。因此,创建一个量化数据集要求历史学家谨慎地编码,将待考察对象的信息收集整理,把数据呈现在表格形式中。史学家们应当准备好把统计分析技术应用在数据集上,以解决研究中遇到的问题。 简言之,要有效利用量化材料和统计学技术来做史学分析,学者们需要综合掌握快速发展的社会科学技巧,包括样本的选择、统计数据分析、从数据到其背后史料的深入挖掘。由这项工作产生了史学界量化方法的新型训练,学术期刊和教科书的全新创作,以及支撑此类研究的数据库的诞生。 早期的努力 早在二十世纪五十年代,史学家们就已经开始使用量化材料,特别是在经济史和社会史领域。法国的年鉴学派在二战前期就已为我们指明了道路。美国的快速增长及扩张也促使美国的历史学者们使用量化材料来进行美国经济、人口和大众民主的研究。比如,Frederick Jackson Turner于1893年发表的经典论文《边疆在美国历史上的意义》(The Significance of the Frontier in American History)就很大程度上依赖于1890年人口普查数据和对它的解读。 但我们现在所说的“数据分析”的真正实现,还需要经历二十世纪上半叶社会科学和统计科学的长足发展、五十年代计算机器和数值记录在大学中的流行、六十年代计算机雏形的出现。一个典型的例子是五十年代末六十年代初开展的一项研究,这项研究被后来者当作榜样和经典。1959年,Merle Curti及其同事在威斯康星大学出版了《美国社会的塑造:基于一个边疆小镇的人口调查》(The Making of an American Community: A Case Study of Democracy in a Frontier County),深入十九世纪中期威斯康星州Trempeleau县的历史,重新审视了Turner的论文。他们查阅了当时的报纸、日记、私人信件和县志,同时,他们从1850年至1880年间的联邦人口调查记录中推导出的雇佣模式,并用它来分析手头的史料。 与此类似,二十世纪五十年代的新兴经济史学家们也在一些经济史的核心问题上对传统范式提出了挑战。其中一个争论的焦点是美国内战是否“有必要”。当时有一批史学家认为鉴于奴隶制利润率很低,它自身是会逐渐瓦解的,因此内战就显得“没有必要”。然而,经济史学家们运用经济理论和数据分析了美国南方的农业产量,认为如果一直使用奴隶,南方农业到二十世纪就会扭亏为盈。传统观点认为铁路系统在美国工业发展中占据中心地位,Fogel采用经济学理论和反事实推论法,通过严谨的数据分析论证到运河也可以作为成功的交通系统来支撑十九世纪美国的工业发展。 “新政治史家”诸如Lee Benson、Allan Bogue、Richard P. McCormick以及其他对历史感兴趣的政治学家诸如Warren Miller和Walter Dean Burnham将政治学家分析现行选举结果和选民调查的新兴技术用于历史问题,为美国政治史研究引入了全新的视角。他们设定党派制度的变量参数,发展关键选举理论,提出选举政治的潜在结构可以借由分析投票率和选举结果的历史数据得到预测。在1964年的英格兰,一批人口统计学家和历史学者建立了剑桥人口与社会结构研究小组(the Cambridge Group for the History of Population and Social Structure),开始了一项长达四十年的回溯性研究计划,收集并整理不列颠400年的家族史。 量化历史开启的全新可能性适应了历史学自身学科建设中的其他趋势,尤其是社会史的增长和Jesse Lemisch所说的“自下而上的历史革命”——亦即是说,关注普通人平凡生活的历史研究,用以管窥当时一般生活的面貌,补充那些对于重要人物和事件的叙述。出于对研究技术发展的关注,美国历史学会(the American Historical Association)在二十世纪六十年代中期意识到了“历史中的量化”会促使新型分析技术和新型研究机构的诞生,于是为此专门设立了“定量资料协会”(Quantitative Data Committee)。在1965年的密歇根大学、1967年的康纳尔大学、1973年的哈佛大学先后开设暑期讲习班,为历史学者们讲解量化方法。1968年起,密歇根大学的国际政治科学研究联盟开始在其“定量方法培训班”中提供一门量化历史分析课程,为期四周。这门课程每年夏天都有,一直持续到现在。从1971年到1982年,Richard Jensen在芝加哥的纽伯瑞图书馆(the Newberry Library in Chicago)牵头为历史学者们提供了定量方法的夏季培训计划。到了八十年代早期,全美40%的历史系在研究生培养计划中加入量化历史的相关训练。 量化历史在体系上的基础建设也可以追溯到二十世纪六十年代。新的期刊、教科书、编纂文集也为量化历史的成长提供过助力。《Historical Methods Newsletter》于1967年开始发行,并于1978年更名为《Historical Methods》;《Journal of Interdisciplinary History》首刊于1970年。美国社会科学史学会(The Social Science History Association)成立于1974年,第一本会刊《Social Science History》出版于1976年。这个学会后来成为一片园地,在这里聚集了大量的主动借鉴社会学科理论及研究方法的历史学者,和许多从事史料工作的社会科学家。跨学科的交锋持续不断,滋养了身受社会科学训练的研究者,来自经济学、人口学、社会学、人类学、地理学、政治科学等领域的学者们陆续在量化历史领域中发表出许多有创见的作品。 有关量化历史的教科书出现在七十年代早期,其中许多佳作一直再版到如今。无数人编辑书卷,向专家和学生们介绍这一新领域、新方法。后来有了研究者们创建的数据库。在美国,政治学家们最初于1962年创建了校际政治研究联盟(the Interuniversity Consortium for Political Research),1975年更名为校际社会科学研究联盟(the Inter-university Consortium for Political and Social Research),该联盟是制作和保存历史数据辑录方面的开拓者。七十年代初,美国国家档案和记录管理局针对联邦政府手中初始状态即为电子数据的部分发起了一个电子记录保存计划。英国数据档案中心在1967年也在英国发起了类似的项目。 如此到了八十年代,史学家们将量化历史与更宏观的历史研究相融合的制度性、结构性努力已经基本完成。这一基础性建设催生了后续的研究作品,也遭到这些作品的挑战。在很多方面,量化历史都是一项仍在进行中的工程。尽管如此,我们可以定位出量化历史研究已经和将要面临的问题:已经挖掘出的数据集有哪些主要类型、数据集的主要特征是什么、该领域内最常用的研究方法又是哪些。 创建历史数据集中的问题和困难 量化历史在处理宏大问题、长时段变化规律等方面有独到之处。研究者们收集大量数据和可量化的资料,将它们编入图表矩阵用以进行数据分析。第一代研究者关注家族和社会结构、经济增长和变化趋势、选举中的行为和选民参与、代际间社会流动和生活水平变化的历史。晚近一些的研究有了明显的扩散:犯罪史学家们检索法庭与报纸记录,以此得出过去时代犯罪与暴力的长期发展模式;家族史的研究者观察继承与代际财富迁移的规律。新兴的“人体测量史”(‘anthropometric’ history)打开的局面更为广阔——用过去人的身高、体重、身材和疾病来研究人们的生活与福利水平,尝试去估量和比较许多个世纪乃至千年的生活水平。 这些研究得以可能,取决于量化历史的数据集在不断增长。同其他社会科学类似,量化历史研究需要“可以机械增加的”(也就是大家所谓的“电子的”)数据用于分析。虽然也有个别例子是组织人工来完成大规模的数据分析,比如十九世纪的人口动态登记即人口普查,但现代意义上的社会科学数据需要的是机械制表装置、记数分类器等其他机械计算器。第一个代表就是Herman Hollerith发明的打孔制表机,帮助美国完成了1890年的人口普查,社会科学和统计科学亦从中受益。到了四十年代,社会科学家们已经为服务于机器制表和分析的数据收集工作制定出标准化流程。约定俗成的惯例包括固定格式的数据矩阵、按照名称、顺序、区间、比率来分类的变量、经过设计的问卷、适于打孔计数分析的调查表、像Likert scale一样的编码系统等等。量化历史学家承袭了这些技巧,将流程引入历史研究领域。他们旋即发现,要充分挖掘量化历史的潜力,首先需要克服一些方法上和操作上的困难。 他们遇到的第一个问题是, (责任编辑:admin) |