量化数据库与历史研究(6)
历史学家对当时社会、人文环境的认识比较全面和深入,在对各种历史文本信息的解读和对分析结果诠释方面,往往也拥有比较优势。随着数据挖掘和信息处理技术的发展,尤其是文本挖掘(Text Mining)技术的进步,使得分析人物传记、文学手稿等结构较为复杂的文本材料成为可能。例如哈佛大学学者让-贝普提斯特·米歇尔(Jean-Baptiste Michel)和耶瑞兹·列博曼·艾登(Erez Lieberman Aiden)领导的研究组于2011年在美国《科学》(Science)杂志上发表《基于百万电子化图书对文化的定量分析》(Quantitative Analysis of Culture Using Millions of Digitized Books),通过“谷歌图书计划”(Google Books Project)得以构建涵盖人类印刷出版物4%的电子文字数据库,并量化分析1800-2000年间英文语言应用所反映的文化趋势。通过词典编纂、语法进化、集体记忆、技术传播、名誉获得、文字审查、历史传染病学等方面的分析实例,他们很好地展示了如何通过构建大规模量化数据和应用简单统计方法(仅仅是对特定词语的出现频次统计)认识历史和发现新知。(49) 历史学家对具体史实的细致把握,往往能够弥补大规模定量分析注重整体推论但部分忽视或无法理解具体演变过程和机制的弊端。量化历史数据库的应用并非鼓励纯粹定量分析,而是需要传统史学方法与定量方法的互补。在量化数据库的分析过程中,社会科学化的定量分析优势在于对多变量相对作用的分析,以及对整体统计或因果关系的概括,然而对具体作用机制和社会、经济、制度环境的认识往往较为表面。而传统研究擅长结合丰富的相关史料,深入理解一些典型个案,这无疑对研究设计和具体分析助益良多。 更为重要的是,研究者需要有对特定历史背景的准确把握,才能选择合适的定量分析方法并正确解读分析结果。进行以量化数据库为基础的研究分析,研究者需要思考的首要问题是选取构建数据库的史料是否存在选择性偏误,即这些材料能够在多大程度上反映当时的社会现实,能够反映哪些特定人群、特定条件下的具体情况?只有对数据来源的选择性有充分认识,才可能避免错误解释分析结果或过分夸大结论的代表性。而这些必要的历史背景往往是通过传统文本分析获得的。因此,史学研究方法一方面可以深化对定量分析结果的理解和解释,另一方面也可以对定量分析结果和定性研究结果进行经验比较,通过多种研究方法的结合减少主观性风险的影响,提高对研究对象全面、深入的整体认识。“数量分析本身不是目的,只是认识的手段”,(50)这些定性分析,对于以复杂的人类行为为研究主题的社会科学必不可少。对新一代历史学者来说,要将科学方法融入到传统研究中去,既不能因循守旧,也不可以盲目推崇新方法完全替代旧方法。 五、无限可能:量化数据库与“求是型学术”在中国 对史学研究来说,构建量化数据库是兼及史料整理和问题研究的重要工具,代表历史学未来发展的一个新方向。其尊重材料、注重探求事实本源的方法导向,与历史学的学术传统契合。然而,中国历史学者的研究和教学在此方面仍停滞不前。一方面,大量掌握在历史学者手中的重要人类经验数据资料可能难以被利用,历史学的学科功用受到限制;另一方面,历史专业的学生对新研究方法缺乏足够了解和学习,在数字时代的竞争力自然受到影响。如何缩小差距、转变思路,在发挥自身优势的同时实施教育改革,仍是历史学科建设亟须思考和解决的问题。 目前,历史学者从事量化数据库构建和研究的门槛已大大降低。近年来,一些暑期集训课程在推动中国量化历史分析教育方面取得很多进展,丰富的社会科学定量方法暑期培训项目为学生和教师短期内提升分析方法的修养提供可能。许多大学经管专业开设的发展经济学和经济史课程,也大量涉及量化历史研究的各种经典实例,为历史专业学生和学者深入学习相关理论与分析应用提供可能。而且,Excel等大众化数据管理软件的普及与发展,对于数据库构建、数据管理和基本分析提供便利。SPSS、SAS、STATA、R等专业统计软件在操作指令和交互界面方面也日趋人性化。 同时,社会科学的发展,为史学家和社会科学家的交流合作提供可能。(51)跨学科合作交流或团队的建立,可以帮助历史学家突破技术壁垒。历史学家自身不可比拟的比较优势,更能够帮助他们有效融入新的研究潮流中,对正确构建和分析历史量化数据库意义重大。(52)中国史学界长期积累和正在进行的许多文献收集和整理项目,都具有构建大规模量化数据库的先天优势,预示着未来短期内大规模历史量化数据库及相关研究在中国蓬勃发展的广阔前景。 国内很多学术单位和图书档案管理单位都已经开始重视大规模、系统化历史材料的收集与整理,建立了一些文献保存或文献索引型数据库。如国家与地方档案馆的文献材料数码化工程和国家清史工程对清代文献的收集和整理;中国社会科学院近代史研究所对所藏约19万件珍贵档案的整理和电子扫描。各地高校历史研究机构则致力于大规模收集地方社会历史材料,部分也已进行电子化处理。如山西大学中国社会史研究中心收集、整理逾千万卷山西地方社会历史档案;中山大学历史人类学研究中心收集以闽粤为中心的地方家族谱和民间契约文书等;上海交通大学历史系开展以上海郊区、苏南、浙北地区为中心兼及中西部地区的“县级档案与契约文书的收集、整理与研究项目”,已汇集8省50县约600万页档案和30多万件民间契约;浙江大学地方文书与编纂中心则与浙江龙泉市档案馆合作,将该馆所藏晚清至民国时期总计17333卷宗,88万余页的地方司法档案进行整理、电子化并出版。这些大规模史料收集与文献数据库的构建对材料的永久保存意义重大,大量分散在各地、各机构的重要史料得到了整合,一些数据库还支持检索功能。
(责任编辑:admin) |
织梦二维码生成器
------分隔线----------------------------