完成了对历史资料的分类整理,计量史学家就进入了对数据的分析阶段,通常人们根据所使用统计技术的难易程度又将分析阶段分为两个方面——描述性统计和分析性统计。 由于描述性统计不需要高深的统计数学方面的知识,便于掌握,而且应用这类方法所得出的结论易于理解,因而为大多数计量史学家所采用。常见的描述性统计有以下几种方式:(1)次数分布法(The Frequency Distribution),实际上就是对变量矩阵的再处理。根据研究的目的,选择不同的标识将所研究的现象进行分组、排序。列出各组的总体单位数的称为次数分配,其中按数量标识编制的次数分配又称为变量数列,往往以表格的形式显示出来。(2)图表法(Charts),计量史学家依据对其数据资料的分类,一般都要制成相应的图表。将数字转换成图表,不仅可使人们直观地了解这些数字所内含的实际意义,还可以帮助研究人员表达其研究成果。在激发研究者的想象力方面,这些图表常常会起到意想不到的效果。常见的图表有条形图(Bar Chart)、直方图(Histograph)、曲线图(Line Graph)、离散性图(Scatter Diagraph)、比率图(Rate Scale Graph)等。(3)概括方法,计量史学研究所侧重的是那些反映历史过程的大量社会现象。研究中难免涉及大量同质的数据,它不要求,事实上也不可能对构成总体的每个单位有详尽的了解,某些在数量上反映总体的基本特征和规律性的指标对历史分析来说完全够用了,概括方法正是利用统计学来求出这类指标。如算术平均数(Arithmetic Mean)、几何平均数(Geometric Mean)、中位数(Median)、众数(Mode)等等。这样求出的平均指标肯定会使总体各单位之间量的差异抽象化,为弥补这一缺陷,一般还要计算能够反映这些差异的变异指标,如全距(Range)、平均绝对差(Mean Absolute Deviation)、方差(Variance)、标准差(Standard Deviation)、离散系数(Coefficient of Variation)等。(4)时间数列分析,又称动态数列, 是将反映某一历史现象的统计指标按时间的先后顺序排列起来形成的数列,又可分为绝对动态数列、相对动态数列、平均数动态数列,按照指标性质的不同,又分为时期动态数列和时点动态数列。动态分析法从数量方面研究历史现象发展变化的趋势和速度,揭示历史现象各个发展阶段的特点和规律,因而在计量史学研究中处于重要地位。 描述性统计与分析性统计之间并无严格的划分,在很多方面都相互重叠,事实上,这种划分本身意义并不大。分析性统计的实质在于利用较为复杂的数理统计方法从一些相关的数据中推断历史现象的变化情况。 历史学家经常探讨某种历史现象与另一种历史现象是否有关系,其关联的程度如何,以什么形式出现等问题。计量史学家在研究这类问题时使用相关分析法。相关分析法的主要步骤是:首先根据各种知识和逻辑推断对现象之间是否存在相关关系,存在何种相关关系作出初步的定性判断和分析;其次绘制相关图表并计算相关系数(Correlation Coefficient)以确定相关的程度, 进而计算变量间一般关系的数学表达式,即回归方程,通过回归方程,便可由一种现象的变化值估算另一现象相对应的值;最后对用回归方程估算出来的因变量的理论值和实际观察值之间的差异进行测定,以评价估算值的代表性。总的说来,历史现象之间绝大部分属于相关关系,而不是函数关系,所以历史现象之间的相关关系多种多样。按因素的多寡可分为单相关和复相关,按其表现形态有直线相关——其中又分正相关及负相关;曲线相关——抛物线相关、指数曲线相关、双曲线相关,按相关程度又分为零相关、低度相关、显著相关、高度相关、完全相关。从目前计量史学研究的情况看,线性相关(Linear Correlation)及线性回归(Linear Regression)方法占相当大比重。 在分析性统计的名目下还有许多具体的研究方法,如X[2]分布(Chi-Square)、路径分析(Path Analysis)、因素分析(Factor Analysis)、对数曲线(Log-Linear)及对数百分比(Log-Percent)等等不一而足。 系统论方法应用于计量史学研究已屡见不鲜。近年来,模拟模型(Simulation model)理论又风行一时,最初始于经济史研究,近来扩展到政治史和社会史领域。模拟模型从最一般的意义上说就是理论的公式化形式,用来描述和预测多重现象之间的复杂关系,包含大量的变量数据和各种复杂的等式,在动态分析中不失为一种有力的工具。 分析性统计和上述种种计量方法要求较深的数理统计方面的理论及技巧,这一点大大限制了它们在历史研究中的推广使用。尽管如此,它们在计量史学中所占的比重仍呈上升的趋势。 近20年来,计量史学还发展了一种文献分析法。这种研究方法有两项内容:(1)内容分析(Content Analysis),在选定的特定时间和地区内,统计某类文献中某些单词,词组或符号(Symbols)出现的频次,以此来揭示人们的思想动态。内容分析基于这样的假设:若某种符号在一定时期内反复出现的话,它一定是人们内心深处感情的象征。在说明人们的态度及感情的变化方面,内容分析法比一般的印象分析法能提供更令人信服的证据。美国历史学家R.L.梅里特借用内容分析法对1735年—1775年英属北美殖民地的报刊进行考查,研究北美殖民地人民民族意识的产生与发展的总趋势,取得了显著成绩。(2)对各种历史文献的由来及作者的分析。用苏联研究中世纪文献专家利卡切夫的话来说:“通过统计单词,计算某类专门用语使用的系数,我们将来有可能用数学方法确定某些著作的作者”。(12)当然,这种研究的目的决不仅仅是证实历史文献的作者,而是通过这方面的研究加深对历史文献的了解。这种研究方法通常用于对中世纪以前的佚名历史文献的考证。苏联学者在这方面做了大量卓有成效的工作。 50年代以后计量史学的迅速发展很大程度归功于电子计算机的普及应用,70年代中叶个人用微电脑的问世更为计量史学家增添了强有力的工具。历史学家大致从三个方面利用电子计算机:文字处理——文稿的撰写、修改、编辑;资料处理——储存、分类整理文献资料和数据资料;计算——进行统计和数学运算。比较而言,计量史学家更注重后两种功能。 分类整理大量数据资料是计量史学家的基本工作之一,过去往往耗费研究者大量的时间和精力;而现在只要有一台电脑和相应的软件,就可以从这项繁重的技术性工作中解脱出来,从而有更多的时间从事思考。这方面常用的软件有DataStar、SuperSort、Superfile、InfoStar等。这类软件有很强的数据处理能力,通过键盘把原始数据输入电脑后,电脑就会按照研究者意图对资料进行各种形式的分类、整理、排序及组合,并且随时都可以对这些数据进行检查、修改和验证,研究者还可以根据自己的需要编制资料索引。这样就形成了一个完整而便捷的资料库(Database)。近年来,一些计量史学家呼吁建立某种历史资料数据库的标准,以解决目前存在的按不同需要建立起来的各种数据库之间的比较和衔接问题。 统计运算是计量史学方法中的一个重要环节。与手工操作和计算器相比,电脑显示出巨大的优越性,不仅快速而且准确。目前在国外社会科学计量研究中应用最广泛的软件为“社会科学统计软件包”(Statistical Package for Social Science),简称SPSS。SPSS几乎包括计量史学研究所需的所有统计计算方法,从简单的计算平均数,到复杂的因素分析、多元回归分析、复相关分析等等。输入数据后马上就可得到计算结果,若与数据库联系起来使用就更显便利。研究者在很短的时间里便可以对一组数据进行多种形式的统计计算分析。
(责任编辑:admin) |