朱剑：学术评价的异化_历史网-中国历史之家、历史上的今天、历史朝代顺序表、历史人物故事、看历史、新都网、历史春秋网

    编者按：作者在文中探讨了“评价乱象”的源头，评价是如何变得如此强势的，以及强势的评价又是如何作用于学术研究的，学界为何没有能力制约不合理的评价反而被它牵着鼻子走等论题，并指出学术批评的式微和学术评价的异化是其中的重要原因。本文出自《科研体制与学术评价之关系——从“学术乱象”根源问题说起》，载《雾里看花：谁的期刊谁的评价》，限于篇幅，有删节。作者朱剑，《南京大学学报》编审。
    笔者也认为，不合理的评价体系的确存在，改革不合理的评价机制十分必要，但是，我们必须看到，改革不合理评价机制的呼声发出了已不下十年，重建学术评价机制的尝试十多年来也一直没有中断，但问题何以越来越严重？笔者以为，一些十分重要的问题被忽视了，那就是，“评价乱象”是如何形成的，或者说评价之乱的源头到底在哪里，评价是如何变得如此强势的，强势的评价又是如何作用于学术研究的，学界为何没有能力制约不合理的评价反而被它牵着鼻子走？不弄清这些问题，只是一味地试图通过改进评价方法来实现科学合理的评价，乃是治标而不治本的措施，是不可能正本清源，从根本上解决问题的。
    一 “评价乱象”是如何形成的？
    学术评价的历史可以追溯到学术研究的起源，有了学术研究就有了学术评价，只是在学术发展史上，当学术研究仅限于个人的兴趣或爱好时，对其评价主要体现在同行间的交流（赞扬、批评、引用等）之中，故表现为一种比较纯粹的学术活动。我们更多的是用“学术批评”来指称这样的学术评价。这样的学术评价即学术批评在学术发展中的作用是十分重要和不可或缺的，学术的每一个微小或重大的进步，都是在对前人或同时代人学术成果的继承、扬弃基础上的创新；继承和扬弃的过程，主要体现在学术批评，有了学术批评才有了学术创新。从这个意义上来说，没有学术批评也就不可能有学术进步，学术批评本身就是一种重要的学术研究。
    可见，在历史上，学术评价有着两个显著特点：其一是学术评价与学术研究是不可分割的，学术评价从来都不是外在于学术研究的。换言之，学术评价是学术研究的一个重要组成部分，缺失了学术评价的学术研究是不完整的。其二是学术评价和学术研究的主体是同一的而不是分裂的，学术研究的主体当然是学者，而学术评价的主体同样是学者，且多为同行学者，也就是我们今天常说的学术共同体成员。
    然而，如果学术评价与学术研究的主体发生分裂，学术评价的主体不再是学术共同体成员，且学术评价脱离了学术研究而相对独立地外在于学术研究时，会发生什么样的情况？显而易见的是，由于学术共同体这一评价主体的缺位，评价的可靠性就不可避免地会大打折扣。如果这样外在于学术研究的学术评价获得了凌驾于学术研究之上并可对其发号施令的权力，又会发生什么样的情况？答案只能是，只要是有组织的学术研究，就不得不听命于权力者所发之号所施之令。如果以上两种情况同时发生了，会是什么样的结果？恐怕就会出现我们不愿看到但却不得不面对的评价乱象了。
    我们也许很难为目前的评价乱象确定一个起点时间，因为这是一个渐变的过程，但有一点是明确的，那就是学术评价与学术研究的分离与学术资源发生变化是直接相关的。大致说来，哲学社会科学领域评价乱象的形成和蔓延与国家对社科研究投入的不断增加基本是同步的。国家的经济、社会、文化发展离不开学术研究的支撑，改革开放以来，随着中国综合国力的增强，国家对学术研究的投入也在逐年增加，特别是1990年代以来，国家对学术研究除了基础性的投入不断增加以外，对重大的或国家急需的科研任务以及与国家战略相关的科研建设的投入也在急剧增加，而在这方面的巨额投入更多的是以项目和工程的形式体现的。国家对学术研究定向定点的巨额投入导致了学术研究与国家战略从来没有像今天这样紧密地结合在一起。因此，对于学术资源（项目和工程）的分配和管理遂成为科研体制的中心。基础性投入是常态化、制度化的，与高校或科研院所的规模、建制等因素有关，故而是相对稳定和确定的资源；与基础性投入不同，项目和工程则是典型的排他性和竞争性资源，且数额巨大，比如著名的“211工程”、“985工程”、“2011计划”和国家自然科学基金、国家社会科学基金项目以及各部委、各省市的各种基金项目等。对于这些巨额投入的受方来说，这就是资源，就是机遇。因而，项目和工程遂成为必须争夺的最重要的学术资源和必须抓住的最重要的发展机遇。时至今日，一些重点高校和科研院所通过竞争所获得的来自国家财政的经费投入年均可以数十亿计，甚至远远超出了这些高校和科研院所得到的来自国家财政的基础性科研经费的投入。据《新京报》报道，“2013年，作为‘211’‘985’序列的清华大学科研总经费最多，为39.31亿元，财政拨款为27.75亿元，占了70.6%，而非‘211’‘985’的高校科研经费最多的西南石油大学，4.6亿元中仅有26.1%为财政拨款，约1.2亿元，两者科研经费所获的财政支持相差23倍多”。因此，获取各种项目特别是国家重大项目和工程已成为高校和科研院所的头等大事，与此相比，其他都显得不那么重要了，一切都可以为这个头等大事让路。
    所有来自国家（从中央到地方各级政府）财政的对学术研究的投入（项目和工程）的分配权几乎无一例外地掌握在各级政府手中，而且，行政权力部门不仅负责立项以分配学术资源，还要负责所投放项目的日常管理和最终结项。由于所要分配的是竞争性资源，只有将资源分配给最有能力或最适合做这些项目和工程的科研单位或团队，才可能让资源发挥最大的效益，这就涉及如何从众多的竞争者（申报者）中挑选最终承担者，这实际上是一个评价问题；又由于项目和工程完成周期是一个相对较长的时间（3年至5年甚至更长），必须对项目和工程的进展顺利与否有所跟进和判断，这仍是一个评价问题；还由于项目和工程结束时，对其是否达到预期效果，必须有明确的判断，这也是一个评价问题。可见，只要学术资源以项目或工程的形式呈现，就离不开评价。
    但要命的是，一般说来，行政权力部门的官员并不懂学术，他们对如何投放和管理学术资源必须有所依凭才能做出判断和决定。这个依凭就是学术评价——对学术机构（高校和科研院所）、学者学术能力及其学术成果（项目和工程）质量的评价。让评价直接为行政权力部门服务，这是出于科研体制的需要，也是学术评价不同于其历史上作用的一个新的功能。对学术评价的这一新的功能要求，实则意味着学术研究与学术评价的同一性因为行政权力部门需求的强势介入而开始被打破，由此带来了一系列前所未有的变化。
    其一，学术评价的裂变。由于身份和目的的不同，行政权力部门与学界对学术评价的要求是不同的。前者可以不看过程，要的只是评价结果，且结果越简单越直观越好，因为只有简单直观的结果才便于分配和管理的操作。最简单直观且最“实用”的莫过于学术期刊排行榜和排名表。学术论文是学术成果的主要呈现形式，学术期刊则是学术论文的主要载体。对数量巨大、学科分属不同、其价值常常见仁见智的学术论文进行全面的学术评价、统一的价值判断是件十分困难的事，而通过对学术期刊进行分等分级，再依论文所发表的刊物等级来确定论文的质量，则可以让复杂的论文评价变得简单、直观、易行，并可直接作为分配和管理资源的重要依据，由此可见期刊排行榜和排名表对行政权力部门之重要意义，此亦即所谓“以刊评文”盛行的原因。对于学界来说，学术研究需要的不仅是评价的结果（结论），而且更看重评价的过程，而对学术研究内容层面的具体评价（评论）才是最重要的，这样的评价只有学术共同体的成员才可能完成，无论是过程还是结论都注定是复杂而专业的，绝非排行榜和排名表所能替代，没有专业知识和眼光的人也许连理解都做不到。因此，同一个评价，很难同时满足行政权力部门和学术研究的需要。于是，评价发生了第一层蜕变，评价就此分裂为两端：一种是主要甚至专为行政权力部门服务的评价；另一种是传承了学术批评，主要为更深入的学术研究服务的评价。今天所有对评价体系的批评和对评价乱象的指责，其实大约是针对前者。
    其二，学术评价的工具化。“20世纪以来，我国学术界经历了西方现代各种学术思潮的冲击和影响，这其中科学主义对我国学术思想界的影响不可低估。有学者指出，今天在中国影响最大、最能体现启蒙心态的是科学主义，而不是科学精神。科学精神是求真，力求拓展知识的新领域；而科学主义则是一种工具理性，认为科学高于一切，使得人们常常套用自然科学的标准来评价人文社科研究的过程及成果。这种做法会扼杀人文社会科学的创新性。”正是在这样的科学主义管理理念下，裂变后的学术评价发生了第二层蜕变：评价在成了资源分配的主要依据后，又成了科研管理的重要工具。作为管理工具的评价所需要的并非学术批评的科学精神，而是工具应有的良好的“操作性”，于是，期刊排行榜和排名表在很多时候也就成了管理者的首选，其结果是学术评价进一步与学术研究相分离。
    其三，定性评价的混乱。从学术评价的本质属性来看，只有学术共同体才是理想的学术评价主体。所谓“学术共同体的评价”主要指的是“同行评议”，由于对本学科领域“胸有成竹”，学术共同体所采用的评价方法往往是对评价对象进行直接分析和判断，故有“定性评价”之称。但是，定性评价是有条件的，那就是评价（学术批评）须在学术共同体的范围内进行，以保证评价的专业性；评价者与被评价者具有同等的地位，被评价者具有反批评的权利，而所有的学术共同体成员都有资格参与评价活动，评价呈现出一种透明开放、反复进行、绵延不绝的过程，以保证评价的自律性。离开了这些条件，定性评价的公平、公正就无法得到保证。在评价发生裂变后，作为行政权力部门分配和管理学术资源的评价已不再具备这些必不可少的条件，学术评价实际上就是一场场学术竞赛（评比），参与评价的专家充当了学术竞赛的裁判。裁判需要简单、明确、可操作的规则，不能跟着感觉走；裁判需要与运动员划清界限，不能既当裁判又当运动员；裁判还需要价值中立，不能有个人偏好，不能代表本人所在单位。而定性评价与这一切正好完全相反。因此，当以定性评价来决定资源分配时，遂出现了诚如李剑鸣教授所指出的现象：“这些起源于欧美、并且长期行之有效的东西，却在中国发生了变异，甚至是‘异化’。其中‘异化’最明显、危害最严重的，莫过于‘同行评议’。”“权力支配，人情主导，标准缺失……三者只要居其一，都会使学术评价的意义受到严重损害”，“在我们当前的学术评价中，往往是三者一起发生作用，多路夹击，来自欧美的同行评议，怎么可能不水土不服以致彻底变质呢？”这样的评价还反过来影响到正常的学术批评。批评难免得罪人，也就难免在资源分配的定性评价（学术竞赛）中遭遇报复，传统的以学术批评为特征的评价就这样日渐式微了。事实上，为行政权力部门服务的评价已逐渐遮蔽甚至取代了评价的原有功能而上升为主要功能甚至唯一功能。在这里，评价发生了第三层蜕变：作为学术评价核心内容的学术批评日渐没落，作为学术共同体最突出特点的专业性和自律性已消失殆尽，深陷于学术利益泥淖的定性评价声名狼藉，一度几乎被逐出了评价领域。
    其四，定量评价的走红。自1990年代初开始，随着评价对资源分配和管理介入的不断深入，定性评价因其主观评价的公正性开始受到越来越多的质疑而逐渐陷入了困境，以“科学”和“客观”的定量评价见长的专业评价机构应运而生并迅速蹿红。评价于是发生了第四层蜕变：完全外在于学术研究的专业评价机构的出现使学术研究与学术评价的同一性彻底终结。不断问世的专业评价机构都有着一些共同的特征：其一是几乎均由从事文献情报工作的人员组成，除了其本专业以外，不是任何学术共同体的成员；其二是在明里或暗里都以为政府服务或被政府认可为主要目的；其三是通过采集各种形式数据，以量化评价的“客观”、“公正”、“公平”相标榜；其四是其主打产品即对学术期刊进行分等分级（如所谓“顶级期刊”、“权威期刊”、“核心期刊”等）的排行榜和排名表。尽管专业评价机构的第一个特征就决定了它不可能是学术评价适格的主体，直接采信这样的机构的评价结论已完全违背了只有同行专家才是最合适的评价主体这一学术评价的基本原则，但后三个特征正是行政权力部门最需要的，在同行评议痛遭诟病之后，专业评价机构终于得到了行政权力部门的青睐而上位。
    其五，学术评价的权力化。评价原本是学术共同体成员的一种权利，推而言之，所有学术作品的读者、学术成果的应用者，都有评价的权利。但是，在学术评价裂变之后，为行政权力部门服务的学术评价日益从权利向权力过渡。虽说量化评价只是为行政权力部门提供了一种工具性的服务，但因其能提供行政权力部门需要的“客观”、“公正”、“公平”的排行榜和排名表，“母以子贵”，制作学术期刊排行榜的评价机构也因此而走红，由学术研究的服务者而摇身一变，成为学术舞台上的主角，排行榜和排名表则成为他们手中极具魔力的“指挥棒”，本意是服务于学术研究的评价成为凌驾于学者之上的支配力量，评价终于完成了第五层也是迄今为止最后一层的蜕变：成为一种权力——评价权力。
    在经历了五层蜕变之后，今日的学术评价早已不是昔日的学术批评，从评价主体、评价目的到评价方法、评价标准、评价环境都发生了全面的变异，不仅完全脱离了学术研究，甚至变得与学术研究毫无内在关联，这样的学术评价出现问题是必然的。但评价乱象只是一种表象，透过这一表象，我们应该看到，在乱象的背后，是资源分配和管理而产生的利益驱动。
    二 “评价”真的是“学术乱象”的根源吗？
    “学术乱象”在历史上并不鲜见，但目前的“乱”与历史上的“乱”相比，似乎有些不同于以往的特点：抄袭或剽窃历来为学人所不齿，加之极易被学术同行所识破，冒险而为者历来不多，所以，历史上很少像今天这样颇有些层出不穷的味道，甚至连校长剽窃、院士造假都已不再是稀罕事。但与如今庞大的科研队伍相比较，其实真正明目张胆进行抄袭和剽窃的人比例并不算高。随着科技进步，比如，“查重系统”的广泛使用，单纯地抄袭剽窃因逃不过用大数据进行比对的火眼金睛，将会日益减少。更值得忧虑的学术乱象是本文开篇所引述报道提及的科研成果“数量与质量不成正比”，大量的低水平重复的平庸之作充斥学界，因其普遍，才更为严重。
    从表面上看，不合理的评价确实是造成学术乱象的原因，在每一起学风问题的典型事件背后，都可以找到学术评价的影子——为了在学术评价中胜出以维护或争取与学术相关的利益而主动或被动地不择手段，甚至铤而走险，冒着极易被发觉的危险去抄袭和剽窃；更普遍的平庸之作泛滥问题，也与学术评价直接相关，制造这些作品，既是为了应付科研管理，也是为获取项目、实现晋升准备条件，与抄袭和剽窃比起来，平庸之作安全多了，只要与纯量化评价不问内容和过程只问数量和级别的要求相符，就可获得与学术相关的利益，特别是在被量化指标压得透不过气的时候，以平庸之作来应对评价（管理），在许多人都是不得已之举。的确，这一切都是因为评价。
    但是，当我们将学术乱象的根源归结为评价时，却不得不面对一系列问题，那就是：评价是如何变得如此强势的，强势的评价又是如何作用于学术研究的，学界为何没有能力制约不合理的评价反而被它牵着鼻子走。其实，在上文关于评价乱象是如何形成的分析中，笔者已大致回答了这些问题。我们可以看到，随着学术评价的层层蜕变，一方面，评价变得越来越强势，而与学术研究则渐行渐远。脱离了学术研究的学术评价，更体现出了对行政权力的依赖，评价的地位每上升一个层次，也就意味着它与行政权力的结合又加深一个层次，这在学界应该是尽人皆知的“秘密”。评价机构正是通过行政权力部门的授权，或者其评价结果为行政权力部门采信，才变得如此强势，才具备了对学界发号施令的权威，堪比狐假虎威。另一方面，评价变得越来越简单，以至于简单到就一个排行榜或排名表。某些评价机构虽然设计了十分复杂的指标体系，但姑且不论这些指标及其复杂的加权运算是否合理，仅就其最终产品而言，无非期刊排行榜或排名表，无非用过去的文评现在的刊，再用现在的刊去评未来的文，仍难脱简单化、绝对化和以刊评文的窠臼。学术评价原本是一种复杂的学术活动，何以变得如此简单？正是评价机构出于对行政权力部门偏好的迎合。“不必告诉我为什么，只要告诉我是什么就可以”，排行榜和排名表恰恰符合这一要求。这样评价的荒谬，学界岂有不知？没有行政权力部门对它的青睐，学界何至于被它牵着鼻子走？
    被评价牵着鼻子走除了出于对权力的屈服以外，还有利益的诱惑这一层原因。权力总是与利益相关，国家对于某些自然科学研究项目的投入动辄成百上千万甚至上亿元，对哲学社会科学研究项目的投入虽有所不如，但总量仍十分可观。国家对学术研究的巨大投入带来了中国学术、科研和文化事业的巨大发展，这是有目共睹的事实；毋庸讳言的是，同时也给高校和科研院所及其研究人员带来了收益，现实中的科研人员对名与利的追求当然是可以理解的，而正因为如此，名与利的杠杆在科研管理中也起着重要作用。在分析学术评价何以作用于学术研究时，我们可以看到一条清晰的权力和利益链（当然也是工作链）：权力（资源）—评价（分配）—评价（管理）—科研（机构与人员）链条的顶端是握有巨额学术资源分配权的行政权力部门，链条的底端是科研单位和学术界，串联起顶端和底端的是评价，而规约这一链条运转的则是科研体制。
    行政权力部门因专业所限，并不能直接介入学术研究，要让这条链条运转起来，必须经过中介环节，这一环节就是评价。处于链条底端的高校和科研院所几乎无一不引入量化评价的指标，内部的利益分配越来越向科研项目、学术论文的级别和数量倾斜，学术研究已从随性的个人兴趣彻底转变成了硬性的“科研任务”。因为唯有这样，底端才能迎合顶端，才能从顶端获取更多的资源。可见，评价在这一链条中担当的是沟通顶端和底端双方的桥梁角色。桥梁的宽窄、高低其实是由处于链条顶端的行政权力部门设定的，评价机构只是根据这一设定，设计生产出了符合其要求的评价产品，且因其产品而跻身于学术权力场中，并实现自身的利益。与此同时，评价在这一链条中还担当着工具的角色，工具的型号、规格、尺寸当然是由行政权力部门设定的，评价机构只是通过对评价的打造，使其产品成为行政权力部门得心应手的工具。无论是桥梁的建造还是工具的打造，都是促使评价一层层蜕变的原因，原来的评价是担当不了桥梁或工具的，只有经过蜕变，桥梁才完成了建造，工具才完成了打造。
    这样的桥梁和工具固然符合了行政权力部门的要求，但是否公平呢？诚如高翔研究员所指出的：“过分偏重量化指标，看似客观、公正，其实隐含着深刻的不公……学术界存在着比较严重的功利主义倾向，追名逐利、急功近利现象蔓延，而学术评价机制的不健全、评价标准的不透明、评审过程的不公开、学术监督机制的缺位，导致权力寻租、金钱交易现象时有发生。”仅满足顶端的评价的不公平是不言而喻的，评价对行政权力部门的迎合固然是其异化的原因，但若没利益链的存在，就不会催生出这么多的评价机构；若没有规约利益链的科研体制的需要，评价也不至于如此走入歧途。
    如前所述，以学术批评为特征的学术评价在历史上是学术研究的一个重要组成部分，曾为学术的发展起过非常重要的作用，在此不再重复，只想强调一点，那就是，即使在今天，学术进步仍然离不开学术批评，今天学术研究的低水平重复泛滥成灾，在很大程度上恰恰是因为学术批评的式微和学术评价的异化。学术评价发挥的作用无论是正面的还是负面的，都是有前提的，最重要的前提就是科研体制是否合理。学术评价在经历了五层蜕变后才使得那些以对期刊进行分等分级为最终产品的所谓评价机构脱颖而出，且自我标榜，欲号令天下，其背后的利益驱动是显而易见的。应该追问这一系列变化是如何发生的。上文的分析足以表明，促成学术评价蜕变的正是科研体制。我们可以说，有什么样的科研体制，就有什么样的学术评价；即使没有现成的，也会催生出服务于这一体制的评价体系。比如，原新闻出版总署就曾于2010年7月和12月分别颁布了《报纸期刊出版质量综合评估办法（试行）》和《全国报纸期刊出版质量综合评估指标体系（试行）》，由此在评价制度层面基本完成了具有“通适性”和“纯量化”特征的报纸期刊质量评价体系的打造。
    所以，只要利益链存在，单纯地改进评价方法就难以有效地遏制学术乱象。最早的定量评价始于1990年代初的“核心期刊”评选，依据的是包括引文数据、文摘数据在内的量化数据，但对“核心期刊”的批评在1990年代即已产生。继之是2000年的“CSSCI来源期刊”评选，这是一个纯粹以引文数据为依据的期刊评选，在其制作者声称其具有评价功能之初，对它的质疑之声也就产生了。客观地说，这些质疑和批评大多是有道理的，评价机构也有不同程度的响应，从评价指标到方法以及在功能表述上都有所改进，但总的来说，这些批评和改进都没有取得明显效果，学术之乱一如从前。可见单纯的评价改革并不能取得理想的效果。
    因此，将学术乱象的根源归结为学术评价，以为只要淡化甚或取消了评价，就能终止学术乱象，未免太过简单。终止学术乱象的关键不在于淡化评价或改进评价，而在于消除造成评价乱象的因素。学术评价只是科研体制运行中的一个环节，量化评价更只是学术评价的一部分，而且量化评价的价值也不在排行榜和排名表，而在于采集了各种信息的数据库。在很多时候，为何评价、谁来评价、如何评价等这些直接涉及评价结果是否公平、公正和合理的问题，并不取决于所谓评价专家，不管是从事定量评价还是从事定性评价的专家，而是取决于评价的组织者。换言之，评价的结果如何，更多的是取决于评价组织者的意志。在涉及资源分配和管理的诸种评价中，评价的组织者几无例外地都是行政权力部门，包括从中央到地方各级政府以及高校和科研院所的行政管理部门。规约这些行政管理部门行为的，是科研体制。因此，与其说是评价导致了学术乱象丛生，不如说如今的科研体制必然会带来评价乱象和学术乱象。学术之乱和评价之乱，其实是同源的。将评价视为学术乱象的根源，实际上遮蔽了科研体制对学术乱象之所以产生所应承担的责任。
     (责任编辑：admin)

搜索

热门标签:

朱剑：学术评价的异化