一九九二年九月,我们一行九人,应台湾《联合报》文化基金会国学文献馆的邀请,赴台北参加“海峡两岸清史档案学术研讨会”。会后,应台北、台南、台中三个城市若干文化学术团体之邀,就清史研究与清代档案等相关问题,举行了各种不同形式的学术报告会或座谈会。出于个人兴趣,我利用这次机会,对台湾同行们在史学研究中如何运用电脑,作了初步考察。现将考察所得,加以整理,发表出来,供大陆史学界的朋友们参考。 首先应该感谢各接待单位的朋友们热情地介绍有关情况,引导参观机房设备,并赠送许多文字资料。在撰写此文时,我还参考并引用了台湾报刊上发表的有关论文。在此一并表示感谢。 (一) 电子计算机(Computer),又称电脑,诞生以来不过半个世纪。其发展之迅速,影响之巨大,使人惊叹不已。从航天技术到儿童游戏,几乎到处可以看到它的“神机妙算”。电子计算机的出现,是人类又一次工业革命。已有不少人在预言,人类历史上即将出现一个用计算机制造计算机的时代。现在,个人电脑正在许多发达国家和地区迅速普及。由于电脑具有广泛的适用性,各行各业争相使用电脑。史学家们也不甘袖手,掀起利用电脑研究历史的热潮。 个人电脑(personal computer)的英文缩写为PC,有的学者据其读音称之为“辟蹊”,以其在史学研究上有“独辟蹊径”之功能也。① 由于受史学专业特点的限制,专业性的软件开发不足,还不能充分发挥电脑优势。尤其是中文电脑软件开发不足,研究中国历史就多一层障碍。如果实行古籍全文输入,处理冷僻字是一大难题。国标字只有汉字6763字,显然不敷应用。台港地区电脑系统一般收汉字一万三千有余,仍不能满足需要。尽管有这许多障碍,但电脑在中国史的研究中初步显示出的强大活力,引起中国史学界瞩目,台湾同行们则先走了一步。据我的考察中获得的资料,作最保守的估计,至少有三分之二以上的史学工作者使用个人电脑。不过主要还是利用电脑从事写作和积累资料。 即使是仅仅用于写作,电脑仍有它的神奇功效。在写作过程中,可以迅速在任何位置加入或者删除任何数量的文字,可以把任何数量的文字迅速移置到指定的位置,可以迅速并多次复制任何数量的文字,可以绘制复杂的图表并随时随意修改,可以中西文混用,缺字或符号可以自造。使用电脑,就可以告别剪刀加浆糊的传统工作方式,免除长年累月弓腰爬格子之苦,而且比手写要快好几倍。 在屏幕上还可以开辟成两个或四个窗口,把两条三条或四条内容相同、记述有歧异的材料,调集在一起,比较优劣,校其正误,鉴别真伪。如果想在书後附录几个索引,使用电脑则可以避免大量繁琐枯燥的劳动。 在论著改定後,即可通过指令进行版面整理,然後打印。打印可以繁简体互换,横竖听便。可以根据需要调整字体大小、字距行距以及宋楷仿黑等不同字体。如果打算出版,可将软盘直接送出版社,激光照排。省去了手工排版、校对等大量劳力,可以缩短周期。当电脑普及到一定程度,如果进入联线作业,与国内外有关学术机关联线,在自己的办公室里就可以迅速掌握你所需要的有关资料。当然也可以把自己的研究成果,迅速传送给远方的朋友。 (二) 台湾史学界使用电脑,已不满足于写作上的便捷,而是雄心勃勃地建立大型资料库,把电脑用于史料搜寻、检索、摘录、撷取,或借助电脑研究简牍和甲骨文字等等方面。其中成效卓著的要算中研院的史语所和成功大学。1984年7月起, 中研院史语所与该院计算中心合作,开发了“二十五史全文资料库”,这是史语所“史籍自动化计划”的第一步,历时六年,于1990年6月完成。 此项资料是根据中华书局标点本全文输入,经过四次以上的校阅,如有所疑,经查对三种以上之主要版本(如百衲本、武英殿本、汲古阁本等),并参照中华书局点校本后,确定系点校本排印时未校出之错字或所据以排版之刻本之误字时,才作必要的改动,不过这些字的数量不多,而且每项改正,都在“资料库”中作校对说明。现二十五史资料库已对外开放,可供查询的字数,总计约有4000万字。②除二十五史外,史语所还将“诸子”十九种输入电脑。这十九种是:《抱朴子》、《庄子集释》、《法言义疏》、《东观汉记》、《墨子城守各篇简注》、《潜夫论笺》、《国语》、《庄子集解》、《庄子集解内篇补正》、《古本竹书纪年辑正》、《墨子间诂》、《列子集释》、《晏子春秋集释》、《管子轻重篇新诠》、《点校四书章句集注》、《新语校注》、《战国策》、《八家後汉书》、《老子校释》。这十九种史籍输入电脑并已经过四校,可供查询的字数约在600万字以上。《十三经注疏》(阮刻本)已经输入,目前正进行四校,可供查询的字数约1000万字。正在输入的有《通典》,约320万字,已输入75%。另有24种史籍,委托打字公司输入。其中主要有《文献通考》、《艺术类聚》、《太平经合校》、《齐民要术》、《山海经》、《水经注》、《唐会要》、《唐律疏议》、《唐令拾遗》、《太平御览》。这两批史籍计划在1992年底完成输入,字数约有2285万字。 在考古学中使用电脑,似乎是提倡较早而收效较小。在二十多年前便有“电脑考古学”和“施于考古学的电脑技术”等词语出现。孙宝钢先生早在1982年就发表了《电脑在考古研究的实际应用》一文,以期引起重视。但是至今只有一些大学与研究中心拥有考古资料库,地方性的考古资料库也还没有建立。孙宝钢先生说:“在过去,由于没有电脑,考古学家毕一生之力,也无法将较大遗址的资料完全整理出来。”“陶片排队是考古学家常用的图形,它用来显示一个探坑各层陶片的百分比。利用手、笔、方格纸与透明纸经过剪贴描画的过程,需要很大的耐性。有时时间与纸张耗费不少,却不见得有好图形。”他用实例向读者说明,使用电脑绘制陶片排队图形就非常方便。近几年,台湾的软件工程师设计了几套不同的中文系统,并利用dBaseⅢPlus与Lotus 123制出含有中文说明的表格与图形。他“很希望考古学家,尤其是年轻一辈的,去学习如何使用这些电脑软体。……身为资讯社会中的学者,电脑的使用是无法避免的。”③ 1990年初开始。历史语言研究所“汉简整理小组”以红外线监视器(CCD Infrared Camera)连接屏幕看汉简,原已褪色、变黑、模糊,许多过去用肉眼和放大镜看不见或看不清的字迹,都能清晰呈现。同年五月间,将红外线所见的清晰影像储存於电脑中。通过影像软件使其反白、放大、缩小、加强对比、计算面积,效果尚可。该组将已有的释文输入电脑,先後完成了《居延汉简·甲乙编》及《居延新简》二书的输入。④1992年5月, 简牍小组又购置了一套电脑影像强化及影像储存系统(INTEC Image Processor and Analysis System)。有了这套设备,就可以将在红外线下所得最佳字迹,经过强化处理,再储存在光盘(optical disc)中。至于完整的影像、释文兼备的电脑系统,他们正委托电脑公司设计软件,希望做到同时检索影像与释文资料。 利用电脑辅助甲骨文字研究,成功大学中文系和中研院史语所的部分学者,作出了富有成效的尝试。成功大学甲骨学研究室的负责人黄竞新教授,十年前在香港中文大学任教时,便设想利用电脑整理甲骨文资料,受当时电脑技术发展水平的限制,无法实施。但她对电脑在甲骨学研究方面的应用一直充满了信心。由于电脑影像处理及光碟储存技术的突飞猛进,使得电脑科技用于甲骨学研究已由梦想变成现实。她到台湾成功大学中文系后,获得校方大力支持,与该校资讯工程研究所的计算机专家合作,希望能借助现代电脑技术,将全世界所有的甲骨拓片搜集起来加以分类,剔出其中重复拓片,并将相关的论文、考释资料整理分类,作出索引,建立一套“世界甲骨集成图文资料管理系统”。甲骨拓片数量繁多,公私并藏,分散零乱,而且各书前后著录很多重复。目前成功大学搜集的甲骨拓片有十多万张,据估计其中约有三分之一为重片。他们的困难不在搜集世界藏片,而在剔除重复的拓片。要在十多万张拓片中找出哪些是重复的,确实是十分繁难的事。如以人力来做,不但要花费大量人力和时间,而且不能彻底。如果利用电脑进行重片的淘汰工作,就容易得多了。目前,输入输出及管理系统软件,已完成测试阶段,正逐步将图版及考释文字以扫描方式输入。基本资料则以文书处理方法键入,以便编列索引。 1992年4月18日, 成功大学的中国文学系所与资讯工程研究所联合举办“甲骨学与资讯科技学术研讨会”,提交会议的九篇论文中,有五篇是从不同角度探讨运用电脑研究甲骨学的。文章的作者部分是甲骨文专家,部分是计算机专家。这五篇论文是刘渊临的《电脑甲骨文字典的尝试编辑》、丁之侃的《视窗系统辅助〈甲骨集成〉编辑工作之可行性探讨》、陈秋媛的《多边体分解与甲骨文字辨认》、王骏发的《如何利用电脑影像处理技术整理甲骨拓片重片》、李强的《资料库在甲骨学研究上的运用》。会后编印了《甲骨学与资讯科技学术研讨会论文集》。 台湾《中华日报》于1992年4月19日在显著位置上, 配以图片详细报导了这次会议。大字通栏标题为《学术研究迈向高科技化》,副题是《利用电脑辅助甲骨文研究,学术界新点子》。《联合报》报导的标题是《甲骨文拓片全面入电脑》。《迪吉多资讯》报导的标题是《甲骨文与现代科技的整合》。可见新闻界对此的关注。 在目前的中文电脑软件中,还没有建立我国古老文字的字库,如甲骨文、金文等。要想借助电脑研究这些古代文字,首先必须完满解决甲骨文的输入问题,即造字和编码的问题。要造出全部的甲骨文字,并给每一个字一个适当的编码。要求易学易记,还要尽量避免重码。中研院史语所的刘渊临教授在这方面做了许多开创性的尝试。他用“矩阵字框”纵26点、宽25点的点字法制造甲骨文字,造出的字还不够美观,有待改进。编码方法经刘渊临教授多年研究,采用笔形码,即把甲骨文按其笔画形态分为十种:1垂、2横、3左撇、4点、5叉、6个形、7角、8八、9圆方、0右捺,每种笔画规定一个码。把甲骨文像九宫格似的分成九个部位,左右上下为序,视不同部位的不同笔画依次取码,只取五码。刘先生又与电脑专家合作,编辑了《电脑甲骨文字典(示范本)》。这项工作的目的,据刘渊临教授说:在于“测试利用电脑来研究几千年前的古文字是否可行,经过此次的试验,我认为是可行的。虽然在测试的过程中,有许多问题须要改进。但是能得到这样的结果,是令人满意的。以后将本此次测试的结果,努力以赴。利用电脑来研究甲骨文,或中国古代的文字,如金文、篆文……等,这一系列的研究,前途是非常光明的。”⑤利用电脑研究甲骨文,目前虽然还处在尝试阶段,但这是具有重大意义的开拓性工作。如能完满解决甲骨文图像输入和识别问题,则为利用电脑进行甲骨片的缀合,突破了一大难关。如能完满解决甲骨文字的输入输出问题,则为利用电脑破译未识的甲骨文字铺平了道路。到那时候,甲骨片的缀合和甲骨文学的考释,都借助电脑进行,甲骨学将大放异彩。当甲骨文发现一百周年的时候,这个希望想已成为现实。
(责任编辑:admin) |