历史网-中国历史之家、历史上的今天、历史朝代顺序表、历史人物故事、看历史、新都网、历史春秋网移动版

首页 > 世界史 > 史学理论与史学史 >

数字化革命与美国口述史学(3)


    二、数字化管理
    美国口述史学界习惯于用管理(curation)这个术语来指代所收集的口述历史资料的后续处理、维护与保管工作。在南希·麦凯(Nancy MacKay)看来,管理是指历史记录的长期维护与管理,目的是为确保它们在当前和未来的最大程度的访问。(29)而在数字化时代,信息管理者的任务与职责会变得更加复杂和多元。简言之,所谓数字化管理(digital curation)就是指数字资产的选择、保存、维护、收集与保管。(30)而英国数字化管理中心(Digital Curation Centre)进一步阐释这个概念,将其定义为“为了当前和未来的使用而对可信的数字化研究资料库(a trusted body of digital research data)进行维护和增值;它包含在整个研究生命周期期间对资料的积极管理”(31)。上述概念对于理解数字化时代的口述历史管理具有重要的借鉴意义,至少强调了管理在口述历史整个环节当中的重要性,尤其对于充分发挥口述历史资料的未来应用价值更是如此。
    综观美国口述史学的发展历程,可以发现一个非常明显的特征就是美国口述历史工作者对口述历史记录的兴趣与热情远远超过口述历史资料管理工作。究其原因,一个很重要的因素就是传统的以人工处理为主的口述历史管理模式给大部分人力、物力与财力不足的口述历史计划带来诸多困难,而且无法满足不同使用者对以多元形态存在的口述历史资源的充分利用与开发。以口述历史转录为例,它是一项需要专业技巧、人力、物力与财力投入的复杂工作。事实上,即使对于一些大型口述历史机构来说,高昂的费用支出也让它们无法转录所有的口述历史访谈资料。以肯塔基大学图书馆路易·纳恩口述历史中心(Louie B.Nunn Center for Oral History)为例,据该中心主任道格拉斯·博伊德坦言,即使能够获得适当经费资助,也永远不可能转录所有的口述历史访谈资料。据他估计,该中心还有数以千计的访谈资料尚未转录,如果要对它们进行转录和整理则至少需要数百万美元,而这种可能性是非常小的。(32)而且,转录尽管被认为是口述历史实践的一个不可缺少的组成部分,但其局限与弊端也日益显现。正如一些学者所指出的,口述历史转录会造成许多内在意义的扁平化,尤其是散失了口述历史自身所具有的口述性与视觉性特征。迈克尔·弗里斯科(Michael Frisch)指出:“口述历史令人费解的秘密是没有人花费很多时间倾听或观看记录和收集的访谈记录……每个人都承认口述历史的核心的音频与视频维度并没有得到充分利用。一个更为浅显的道理是,在话语之外还存在意义世界,在任何真正意义上,没有人可以假设抄本相对于声音本身来说是一种对于访谈的更好再现。意义是依赖于背景和环境、姿态、语调、身体语言、停顿、表演技巧与运动的,并且需要通过它们表现出来。如果我们被局限于文本和转录的某种程度中,我们将永远找不到诸如此类的瞬间和意义,我们也将更少有机会研究、反思、学习和分享它们。”(33)
    同口述历史转录一样,传统的编目(cataloging)与索引(indexing)方法不仅主要依赖于人工操作(34),而且其实际效果也并不尽如人意。就编目而言,20世纪90年代末以前,美国大部分口述历史机构对口述历史资料的编目处理主要是基于口述历史收藏层次的信息描述,即使那些针对个别口述历史访谈层次的信息描述也过于简单,除了提供基本的受访者、访谈者、访谈时间、访谈时长、访谈地点、访谈主题、访谈设限条件以及保存与访问方式等简略信息之外,很难让使用者真正了解口述历史访谈中所包含的具体内容。而索引信息的制作主要是基于访谈中所涉及的重要人物、地点、机构、事件与主题等基本信息,且很大程度上依赖于口述历史抄本,也就是说很少对口述历史访谈的音视频记录进行有效的索引编制。(35)上述编目与索引方法的局限也直接影响了使用者对口述历史资料了解的深度与有效检索,进而直接影响了口述历史资源的使用价值。
    正因为如此,美国口述历史学界一直在寻找和探索改善口述历史管理水平和提高口述历史资料访问率和使用率的替代性选择。比如,在改善转录技术方面,除了利用转录器、文字处理机、电脑以及文字处理软件等辅助工具之外,美国口述历史工作者最为期待的选择是利用自动语音识别技术与转录软件来代替人工转录。不过,真正产生影响的则是以数字化馆藏(内容)管理系统(digital collection/content management system)、元数据(metadata)、数字化编目与索引以及数字化检索与保存为代表的数字化技术的开发与应用,它们在很大程度上改变了口述历史资料的转录、编目、索引、检索、访问与保存方式,进而最大限度地发挥其应用价值。需要强调的是,数字化时代的口述历史管理的主要对象是以数字化形态存在的口述历史文本、音频、视频、图像资料以及相关的元数据信息,其主要特征是能够依托数字化管理系统实现这些不同形态的口述历史资料的一体化编目、索引、检索与访问。
    目前最受关注的口述历史数字化管理系统是路易·纳恩口述历史中心于2008年开发的口述历史元数据同步系统(Oral History Metadata Synchronizer,简称“OHMS”),其目的是使口述历史的在线管理、访问、检索与利用变得更为有效、流畅和经济,并以此提升口述历史资料使用者的用户体验。作为一个以网络为基础的免费开源应用程序,该系统能够为用户提供字词检索功能(word-level search capability)和标有时间码(time code)的口述历史访谈抄本或索引,并且将文本检索词(textual search term)与在线口述历史访谈的音视频记录的相应时刻连接起来,即实现二者之间的同步功能。(36)
    正如该系统主要设计者道格拉斯·博伊德所指出的,尽管以数字化网络平台和电子数据库为代表的数字化技术已经改变了口述历史资源的管理、呈现与访问方式,但它们仍将对不同形态的口述历史资源(包括抄本、音频、视频、索引和元数据等)以独立的方式进行管理和呈现。通过这些网络平台或数据库,用户可以获得不同形态的口述历史资源,甚至能够实现文本检索。但是,这些不同形态的资源却很少被纳入一种能够促进访问与利用的整合系统当中。(37)2008年设计和开发的第一版口述历史元数据同步系统则相当有效地完成口述历史抄本的编码过程,并同时很好地实现口述历史抄本与音视频记录之间的同步检索功能。不过,该版本也存在两个非常明显的缺陷,博伊德将其归结为两点:(1)主要针对那些已经完成转录工作的口述历史访谈;(2)其范围只适用于肯塔基州数字图书馆(Kentucky Digital Library)的口述历史收藏。(38)基于上述缺陷,路易·纳恩口述历史中心于2011年对该系统进行进一步开发,新增索引模块并支持口述历史视频记录的处理功能。(39)新版索引功能的开发被认为是相当有效的,博伊德认为它很好地解决了口述历史转录工作所需的财力与人力负担。相比较而言,完成1个小时的口述历史访谈的转录工作可能需要6-8小时,而利用该系统进行索引编制则只需2-3个小时。而其成本也相应降低,以路易·纳恩口述历史中心为例,聘请研究生进行转录工作的费用是每小时180-200美元,而完成同时长访谈的索引编制的费用则低于30美元。(40)此外,该系统索引功能还有助于实现对于口述历史访谈内容信息的准确检索与深度挖掘。(41)索引编制可以通过对于不同字段的多元描述,呈现口述历史访谈所包含的丰富内容,这相对于逐字抄本来说具有更为明显的优势。特别是在检索过程中,以口述历史逐字稿抄本为基础的关键词检索是有局限性的,即用户检索时所用的关键词未必出现在抄本中,这样可能检索不到任何内容,而在索引编制时,用户会通过对于访谈内容主题的多元描述,尤其会用不同的关键词或美国国会图书馆标题表(Library of Congress Subject Headings)和其他叙词表(thesaurus)来描述同一个主题,这时所用检索关键词尽管并非受访者原词,也能保证检索到相关主题的内容。(42)正是如此,越来越多的美国口述历史工作者倡导将索引(以及交叉引用和标注)而不是转录作为创建口述历史资源描述性访问点(descriptive access points)的一种方式。(43)
    关于兼容问题的解决,则有赖于美国博物馆和图书馆服务研究院(Institute of Museum and Library Services)国家领袖基金(National Leadership Grant)的支持,该基金的主要目的是将口述历史元数据同步系统发展成为开源应用程序,使该系统能够作为一种插件与诸如Omeka、Drupal、WordPress和Kora等开源内容管理系统和CONTENDdm等大型商业内容管理系统实现兼容。作为整个计划的一部分,肯塔基大学图书馆和路易·纳恩口述历史中心将与那些利用不同内容管理系统的各种机构进行直接合作,其目的是能够测试口述历史元数据同步系统与其他系统之间的兼容性问题。(44)这些机构包括贝勒大学口述历史研究所(Baylor University Institute for Oral History)和密歇根州立大学数字人文与社会科学中心(Matrix,the Center for Digital Humanities and Social Sciences,Michigan State University)等等。当然,该系统也会与那些希望提升口述历史数字化管理水平与在线访问和传播率的小型机构乃至个别口述历史计划进行直接合作,而最终目标是能够满足用户的不同需求。正如博伊德指出:“口述历史元数据同步系统的任务已经从提高对于路易·纳恩口述历史中心口述历史馆藏的访问而转向支持其他大大小小的机构,为它们大批量地处理口述历史资源提供一个有效的、以用户为中心的发现平台,同时能保证较低成本。”(45)经过几年测试和完善,目前口述历史元数据同步系统已经成为众多其他口述历史机构管理和利用其馆藏的重要手段。
    同时,该系统的价值也不断得到各种保存机构管理者与口述历史工作者的高度认可,它不仅能够让各种各样的机构提升数字化口述历史馆藏的使用,并且能够为那些具有丰富经验或缺乏经验的研究者节省大量时间。(46)美国国会图书馆美国民俗生活中心(American Folklife Center)主任佩吉·巴尔杰(Peggy A.Bulger)给予高度评价:“在实现口述历史访谈的音视频记录与它们的抄本之间的同步方面,口述历史元数据同步系统是一项独创性的发明……在某种程度上,它保存了口述历史的完整性……在最近的时期内,在口述历史转录领域,我相信不会出现一个像口述历史元数据同步系统那么重要的发展。”(47)此外,美国口述历史协会执行主任克利福德·库恩(Clifford Kuhn)也高度赞扬该系统具有相当的开创性,真正将口述历史访谈当中丰富的字词内容呈现出来。(48)
    此外,目前美国口述历史学界较为常用的口述历史数字化管理系统还有兰德福斯联合有限责任公司(Randforce Associates LLC)、卡耐基梅隆大学(Carnegie Mellon University)和加拿大康考迪亚大学口述历史与数字故事中心(Concordia University Centre for Oral History and Digital Storytelling)分别开发的“Inter Clipper”、“Informedia”和“Stories Matter”三个系统。(49)
    需要指出的是,诸如口述历史元数据同步系统这样的数字化管理系统并不是一个数字化保存机构,因而仍然无法解决数字化时代口述历史资源的保存问题。自20世纪90年代末以来,网络服务器日益成为美国大部分口述历史保存机构的重要选择。而为解决网络服务器存储容易遭受病毒破坏等稳定性问题,近年来美国一些保存机构开始致力于发展数字化保存网络技术。其中最具代表性的是美国阿拉巴马州的奥本大学等6所大学和阿拉巴马州档案历史局(Alabama Department of Archives & History)于2006年共同参与开发的阿拉巴马州数字化保存网络(Alabama Digital Preservation Network),该项目同样获得美国博物馆和图书馆服务研究院国家领袖基金的资助。该网络以服务器为基础,并利用斯坦福大学一个团队开发的多备份资源保存(Lots of Copies Keeps Stuff Safe,简称“LOCKSS”)软件作为技术支撑,从而实现同一数字资源的多节点保存与互补。简单而言,上述每所大学的数字资源的副本都可以保存在另外5所大学;如果其中一个文件出现损坏情况,另外5个文件将会用一个新的副本来代替或更新它。(50)尽管这项网络技术并不是特定针对口述历史资料的数字化保存,可是其应用原理是完全相同的,尤其能够通过不同机构之间的合作伙伴关系来解决小型口述历史机构(因经费或人力所限)所面临的日益严重的超负荷保存问题。
    综上所述,以数字化馆藏(内容)管理系统、元数据、数字化编目与索引以及数字化检索与保存为代表的数字化技术的开发与应用不仅改变了口述历史资料的转录、编目、索引、检索、访问与保存方式;更为重要的是,通过数字化管理能够更大限度地开发与挖掘口述历史资源中所潜藏的多元的和深层次的历史与文化信息,而这也将为口述历史的数字化传播与应用提供内容来源与技术支持。 (责任编辑:admin)