历史网-中国历史之家、历史上的今天、历史朝代顺序表、历史人物故事、看历史、新都网、历史春秋网移动版

首页 > 民族学 > 语言文字 >

中国民族语言语法标注研究:新转向、新范式、新图景


    《中国民族语言语法标注文本丛书》作为国家社科基金重大招标项目“中国民族语言语法标注文本及软件平台”(10&ZD124)和中国社会科学院重大项目“中国民族语言语法标注文本丛书”(YZDA 2011-18)的阶段性成果,获得国家出版基金资助,由社会科学文献出版社正式出版。这套丛书首次采用国际上通行的隔行对照化的标注方法,严格选取符合语言学资源类型和基本规范的长篇语料,综合研制出一套适合中国民族语言语法标注的符号体系,旨在为语言类型学、历史语言学、区域语言学、接触语言学等资源依赖型学科提供真实的文本语料,也为自然语言处理提供必备的资源和工具。
    丛书主编为中国社会科学院民族学与人类学研究所江荻研究员。第一期共出版12本,包括《藏语拉萨话语法标注文本》(江荻)、《土家语语法标注文本》(徐世璇、周纯禄、鲁美艳)、《哈尼语语法标注文本》(白碧波、许鲜明、邵丹)、《义都语语法标注文本》(李大勤、郭晓、宗晓哲)、《白语语法标注文本》(王锋)、《藏语甘孜话语法标注文本》(燕海雄,江荻)、《嘉戎语卓克基话语法标注文本》(林幼菁)、《壮语语法标注文本》(蓝利国)、《纳木兹语语法标注文本》(尹蔚彬)、《水语语法标注文本》(韦学纯)、《维吾尔语语法标注文本》(王海波、阿力木江·托乎提)以及《达让语语法标注文本》(刘宾、孟佳仪、李大勤)等。
    新转向 
    改革开放以后,中国民族语言研究蓬勃发展,涌现出了不少描写语言学成果。以中国社会科学院民族学与人类学研究所为例,先后出版了《中国少数民族语言简志》(59种语言)、《藏缅语语音和词汇》、《中国新发现语言研究丛书》(40多卷)、《中国少数民族语言方言研究丛书》(17卷)以及《中国的语言》(129种语言)等系列研究丛书,编纂了《中国少数民族语言词典丛书》(20多卷)等系列词典,发布了《汉藏语同源词检索系统》、《东亚语言词汇语音数据检索系统》等大型数据检索系统。这些研究成果汇集了巨量的语音词汇数据资源,为民族语言的深入研究铺垫了基础。
    随着语言研究的不断深入,语言知识的不断积累,语言视野的不断扩大,新世纪的中国民族语言研究呼唤新的转向。以前的研究主要集中在语音和词汇方面,缺乏文本性质的资源,很少有长篇语料型的资源问世,特别是缺乏语法标注文本的熟语料资源。这是目前语言资源研究的重大空白点。这种现象阻碍了语言研究的深化,也阻碍了语言类型学、历史语言学、区域语言学、接触语言学等资源依赖型学科的发展。在这样的情况下,中国民族语言研究呼唤一种跨语言、跨方言的开放性语法标注文本研究,这不仅能解决真实文本语料匮乏的现状,而且能推进中国语言学在深度上的发展,在学术研究、教学应用以及保护非物质文化遗产等层面都具有重大的理论意义和现实意义。我们应该把握时机全面开展中国民族语言文本语料语法标注,抢救和保护这些珍贵的民族非物质文化遗产,深入开发这些重要的语言资源。
    新范式 
    语言研究需要新的发展,新的发展需要新的范式。典型的传统的描写语言学著作中的语法知识大多通过例句调查的方式获取的,这种获取知识的方式带有浓厚的翻译式色彩和诱导式谬误。长篇语料在研究成果中所占的比例不仅数量少,而且地位低,处于附属地位。新的语法标注文本恰恰以长篇语料为主,语言概况或语法导论为辅。语言知识来源于长篇语料,而不是例句抽查。这样的研制思路不仅弥补了大量的文本语料,而且开拓了语言研究的新方向。这与目前学界倡导的记录语言学不谋而合。这样的语料从本源上避免了主观性,甚至杜绝了母语人自身的内省式语法案例。从方法论上看,以真实文本为语料的研究很可能引起中国描写语言研究范式的变革。主要体现在:
    1、采用隔行对照化(Interlinearization)的标注方法。这种方法是目前世界各国学者研究少数族群语言的主流方法,通过隔行对照化形成一种所有语言学家或语言学专业研究生都能读得懂的文本。
    2、文本选材要符合语言学资源的基本规范,例如记述性、口传性、原生性、连续性等。
    3、文本来源用多方式取得,包括田野调查语料、口语性书面语料(民间故事、剧本、相声、小品、纪实等)。
    4、文本语料的类型是传统口传故事记录、民间文学作品,也可以有少量报刊语体文本和其他作品等,但是一般不包括韵文类的诗歌、民歌、唱本之类。
    5、研制了一套适合中国民族语言语法标注的符号体系。这套标注符号借鉴了国际规范,同时也补充了中国语言特定需要标注的语法现象符号。
    6、每部书稿都主要包括语法导论、标注文本以及对照词汇三个部分。语法导论所占的分量很小,主要包括音系、词汇和词法、句法要点。标注文本所占比例最大,除了句对齐直译,每篇文本之后附加全文翻译。最后的“对照词汇”是从文本中抽取出来的词汇。
    新图景 
    中国有56个民族,130多种语言。无论从共时还是历时的角度看,这些多样性的语言资源都是极为宝贵的人类知识财富。中国民族语言语法标注研究是一项长期的基础研究。这套丛书(第一期)仅仅出版了12种语言或方言,这只是一个开始,还有更多的语言资源需要深入挖掘。一幅新的语言研究图景即将渐次展开。
    本项研究的成果除了中国民族语言语法标注文本外,还包括中国民族语言语法信息电子词典和中国民族语言语法标注集。中国民族语言语法信息电子词典是语法标注研究的“副产品”,同时又是极其重要的语言财富。该电子词典一般采用双语对照或多语对照(部分语言可以添加传统文字),要求词典中包含民族语词条,每个词条用汉语(和/或英语)注释,注释词条将作为文本自动标注的对照词条。本项研究的语法标注软件平台能为词典与文本互动提供了交互功能,任何时候都可以从文本修改增删词典的词条,扩大词条规模。所有语言词典都要添加语法标记,语法标记需要事先植入词典,其中语法属性包括每个词的词类,所有可能的语法词(虚词)的语法标记,人称代词等封闭词类的标记等。中国民族语言语法标注集建立了三套完整的涵盖了整个语法系统(词法或形态、句法)的语法标注集。实际上,由于各语言语法类型差异较大,按照语法差异类别可以分为苗瑶侗台语、藏缅语以及阿尔泰语(北方)三种类型,分别建立适合各类语言的标注集。
    这套丛书是语言类型学、历史语言学、区域语言学、语言接触研究等资源依赖型学科不可或缺的语料基础和学术财富,是从事语言学、民族学、人类学、历史学和自然语言处理的学者必备的资源和工具,是一种全新的语法研究方式和出版形式,是一次学术深化研究和拓展学术研究方法的创新,是未来语言学研究方向的基础工程,代表了一种新型的研究范式。

(责任编辑:admin)