历史网-历史之家、历史上的今天!

历史网-中国历史之家、历史上的今天、历史朝代顺序表、历史人物故事、看历史、新都网、历史春秋网

当前位置: 首页 > 历史学 > 国外史学 >

18世纪德语历史文献的数据挖掘:以主题模型为例(4)

http://www.newdu.com 2017-09-06 《学海》 王涛 参加讨论

    B.主题的演变趋势
    在进行主题模型分析之初,我们将644份文献按照年代排列,并且在MALLET的算法中,加入了保持排序的参数,从而让主题模型能够反映时间的变迁状态。这对于我们分析趋势演变十分有利。
    我们发现,大部分主题类型都保持着年度的稳定性,但有几点值得注意。首先,政治类题材由于时政性,它在增量上的节点,往往能够与重大历史事件的节点找到对应关系。对法国的实时关注最为明显。其次,情感类、历史类与宗教类在整个18世纪都是非常重要的主题类型,但历史类主题在1780年代后期有一个明显的增加趋势。最后,科学类主题似乎在世纪末才有增长过程,可能的解释在于,“德意志文献档案”所收录的科学类文章,以合集为主,往往都在18世纪的下半叶出版。
    
    图6 主题类型的纵向变化
    C.类型细分下的主题模型
    如前所述,“德语文献档案”的文献存在四种类型,如果我们对每个类型进行主题模型的分析,会有特别的发现吗?由于文献类型划分后文本容量减少,我们将主题数量设置为25个,构成主题的词群仍为20。一些隐匿的信息在导出的结果中确实被揭示出来。
    报纸的主题词再次印证了这种媒介的特殊性。在它的词群中,大量出现与时间相关的词汇,并有许多地名。包括伦敦(London),法国(Frankreich),斯德哥尔摩(Stockholm),君士坦丁堡(Constantinople)等。这些信息透露,《汉堡通讯》的时政意味浓厚,而且胸怀天下,没有把眼光局限在汉堡或者德意志一隅。
    参考书类的文献体现出来的主题也极具特色,有一些与生活相关的知识,涉及烹饪(主题3、21),园艺(主题12),狩猎(主题15),艺术(主题5、19),以及旅行(主题18),基督教也是一个重要内容(主题4、7、17)。参考书类型的文献本来就是实用常识的汇编,在德意志的语境中,类似现在的生活指南,这个背景跟18世纪兴起的“民众启蒙”(Volksaufklrung)紧密相关。尤其是“德语文献档案”收录了一些可以被标识为“家政文学”(Hausvterliteratur)的文献,(39)是民众启蒙的重要读物。民众启蒙被视为德意志启蒙的独特面,从主题模型挖掘出来的词群可以看到,这个运动很好地符合了它所追求的方向。
    在文学类文献中,毫无意外地,我们发现了大量与人、爱情、生活、美相关的词汇。最为突出的是,这个文献类型下出现了与死亡的主题(3、14、25),这在其他类型中并不存在,甚至Tod(死亡)这个词都没有出现在词群中。生存还是死亡,这是一个问题。莎士比亚让这个难题成为了文学创作的永恒主题,在18世纪德意志的文学作品中也不例外。当然,我们如果考察与Tod成对出现的词群,也能够将主题赋予基督教的含义。
    科技类文献汇集了人文与自然学科,主题模型的算法在某些主题上对它们进行了区分,例如主题11是纯粹的语言艺术类,主题24讲诉了政治问题,主题3是生物学内容,而主题23与医学相关。
    比较令人意外的是,在科技类文献中,基督教仍然具有存在感。这是由于我们将人文与自然科学文献混为一谈的结果吗?为此,我们将历史、神学、经济学、政治学等学科类型剔除,把纯理科的文献单列出来,再次进行了主题模型的分析。我们仍然得到了如下的词群:
    8.himmel leben welt liebe menschen geister mensch erde engel hoelle geist dinge guten wiasen gott kommt wort sehen glauben geistlichen
    (天堂 生活 俗世 爱 人类 修士 世界 天使 地狱 精神 善 智慧 上帝 等)
    显然,它仍然可以被归类于基督教主题。从文献来源上追溯,这个主题指向了斯威登堡(Emanuel Swedenborg)的选集。斯威登堡是瑞典科学家,主要从事自然科学与工程学研究。他在年轻时游学欧洲,还曾就教于牛顿,但中年以后突然开始对神秘主义发生兴趣,最终在神学方面取得极大成就,其代表作是关于来世、天堂以及地狱的研究。斯威登堡习惯用拉丁语写作,“德语文献档案”收录的是翻译成德语的选集,(40)由于斯威登堡的科学家身份,把他的选集纳入神学,或者自然科学分类,似乎都说得过去,当然这会影响主题模型的结果输出。当我们把斯威登堡的作品删除之后,像主题8那样明显具有宗教意味的主题确实消失了,但诸如上帝(Gott)、火(Feuer)等能让人联想到基督教的词汇仍然闪现。
    斯威登堡的跨界身份给我们的分析带来了一点麻烦,但这段小插曲却恰恰体现了18世纪的独特性。斯威登堡在1741年出现的精神危急虽然极具个人色彩,但严肃学者对宗教信仰的热衷在18世纪德意志并非个例。结合前面各种文献类型中都能够与宗教主题挂钩的事实,我们可以判断,所谓18世纪的理性时代,其实也是一个无法回避基督教的时代。一个可能的解释是,启蒙时代是多维度的存在,各种文体都在谈论基督教,恰好说明宗教问题的普遍性。批判启示与信仰,批评基督教的文献当然存在,但它们往往是遵循思维逻辑的讨论,而不是非理性的斥责;实际上,存在批判基督教言论的同时,也有大量教导人们如何做一名更合格基督徒的读物。(41)从这个意义上说,启蒙时代对基督教的态度要比我们的想象复杂得多。严格地讲,启蒙运动具备多重面相,宗教的启蒙也是时代主题之一,(42)这种概括应该会拓宽我们对18世纪的认知。
    通过对纯理科文献的分析,我们发现了一个有趣的内容。在主题10中,多次出现“日本”(Japan)这个关键词。这个主题的词群揭示了同政治和地理的相关性。通过查阅文献,我们找到对这个主题做出贡献的文档恰好是两部关于日本地理的科技作品。(43)换句话说,主题模型的算法精准地从近100份文献中找到了一个特别的内容,体现出这种分析工具的高效率与准确度。 (责任编辑:admin)
织梦二维码生成器
顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
栏目列表
历史人物
历史学
历史故事
中国史
中国古代史
世界史
中国近代史
考古学
中国现代史
神话故事
民族学
世界历史
军史
佛教故事
文史百科
野史秘闻
历史解密
民间说史
历史名人
老照片