1美国联邦政府开展的基础研究绩效评估 及其启示摘要:近十年来,对政府资助的科学研究进行的绩效评估得到了迅速推广,但在“为何评估”、 “评估什么”和“如何评估”等问题上,各国有着不同的认识和做法本文介绍了美国联邦政府开展的基础研究绩效评估的背景、 《政府绩效与结果法案》(GPRA)实施前后美国国家科学基金会(NSF)和国立卫生研究院(NIH)的绩效评估实践,进而对我国的相关问题提出相应的政策建议关键词:美国《政府绩效与结果法案》(GPRA);NSF;NIH;基础研究Abstract: Although evaluating the performance and outcome of publicly funded research has been increased rapidly in most industrialized and developing countries since the last decade, different opinions and practices remain in this field. The paper analyzes the background of US federal evaluation on performance of fundamental science and introduces the implementation of the Government Performance and Results Act (GPRA) at National Science Foundation (NSF) and National Institutes of Health (NIH). As a conclusion it also gives some suggestions about evaluation on basic research in China. Key words: GPRA; NSF; NIH; basic research第二次世界大战结束以来,随着科学技术的迅猛发展及其对国防、经济、社会等领域越来越深入而广泛的影响,科学技术越来越被视为维护国家安全、促进经济繁荣、提高人民生活水平、增强国家综合国力的重要乃至决定性的因素。
西方各国政府对科学研究的投入不断加大,公众对投资回报的期望值也日益增高公众对科学的认同与期待使科学界和政府面临着共同的压力:公众要求科学界说明公共资金到底花在了哪里?公共资金资助的科学研究与解决公众所关心的问题间有何关联? 对于政府,则要求其对科研投入的预算进行严格管理,并以强有力的手段对科学研究的过程与结果进行绩效评估,以提高研究的质量、效益与效率 政府也2试图通过评估来使资助的科研成果得以彰显并让公众了解,同时提高决策与科研管理水平然而,知识的生产与应用不同于其他领域,对科学研究尤其是基础研究的产出与结果进行评估并非易事虽然自 20 世纪 60 年代后期以来,一些发达国家就陆续开展了对科学研究的评估,并不断探索新的评估方法,但对基础研究的成果及影响能否进行以及如何进行绩效评估,却一直是个有争议的话题 近十余年来,随着“冷战”的结束和国际政治经济秩序的新变化,各国基础研究的环境都发生了较大变化,这些变化给评估的理论与实践带来了新的机遇和挑战 美国在科学研究方面无疑是“超级大国”,不仅在许多研究领域保持着世界领先地位,而且在对联邦政府支持的基础研究开展绩效评估方面也属先行者,有不少可供我们学习和借鉴之处。
本文试图透过国际上对基础研究开展绩效评估的发展趋势,介绍美国《政府绩效与结果法案》(Government Performance and Results Act,简称为 GPRA)1993 年出台的背景、GPRA 的实施对联邦政府支持的科学研究的影响,尤其是以美国国家科学基金会(NSF,National Science Foundation)和国立卫生研究院(NIH,National Institutes of Health)这两个联邦政府资助基础研究的主要机构为例,指出在 GPRA出台前后两个机构绩效评估实践的变化,分析美国开展基础研究绩效评估的背景、历史、方法和特点等等,进而对我国的相关问题提出有关政策建议1 为何评估与该评什么——美国联邦政府开展基础研究绩效评估的背景1.1 国际化趋势:对政府支持的科学研究实行绩效评估科研经费的分配、研究方向的选择、研究机构的调整等等,在“二战”之后成为西方主要国家科学政策的重要内容,而对这些相关政策和计划的实施结果及其影响进3行预测、分析与评估,是政府制定和改进决策的重要途径之一自 20 世纪 60 年代起,经济合作与发展组织(OECD)的一些国家就开始尝试对政府支持的科学研究活动的投入、产出、成果和影响力等方面进行评估。
随着各国政府对科学活动的评估活动日趋重视,评估理论与实践的深入与拓展,特别是近十多年来,信息技术的日益普及和广泛应用使得大量数据的采集、统计、处理与建模越来越简便易行,因此,在包括美国在内的许多发达国家,对科学研究开展的绩效评估甚至已成为一个“快速成长的产业” 近十年来,科学研究的绩效评估实践所发生的变化主要表现在三个方面:(1)虽然评估的对象日趋广泛,既有具体的研究人员、研究小组、实验室、研究机构与大学,也有受资助的学科或研究领域、受资助机构、政府的研究计划、乃至一个国家的研究实力,但“临时性的、大张旗鼓的、针对单独的研究计划开展评估似已成为过去” 由于通过新的信息技术手段可以更有系统地统计和公开科研数据,因此,对科学研究进行经常性制度化的长期监测以及评估系统的建立与运行已占据绩效评估的主流;(2)评估工作已由研究或资助机构旨在改进自身管理的一种自发行为,扩展为来自外部权威的制度性要求,外部专家的介入也成为理所当然,一些专业的评估机构应运而生;(3)评估涉及的方面由过去强调研究活动定量的近期直接“产出(outputs)”,如发表论文、出版专著、发明专利等,扩展为更多地关注其影响覆盖学术界和经济社会诸方面的中期乃至长期的综合性“成果(outcomes)”,如国际合作水平、高水平人才的流向、技术创新形式、经济回报、对文化的整体贡献等等。
评估活动的这些新特点虽然在许多国家有不同体现,但美国的情况较为突出,很有代表性,以下将重点介绍美国联邦机构开展的基础研究绩效评估1.2 GPRA:美国联邦政府改革行政管理的新举措4绩效评估的产生与发展一方面是被评估机构内部管理系统自我完善的体现,但更多的则是对来自包括公众在内的外界压力的回应以美国的情况为例自 20 世纪 60 年代以来,美国联邦政府为了回应公众与立法机构对其改进行政管理水平的要求,几乎每位总统在其任职内都出台了相应的改革措施,从 60 年代中期实行的规划-计划-预算制(PPBS,Planning-Programming-Budgeting-System)到尼克松执政期的目标管理(MBO,Management By Objective),再到卡特时代的零基预算(ZBB,Zero-Based Budgeting)以及里根和老布什政府的全面质量管理(TQM,Total Quality Management),直到克林顿政府时期的《政府绩效与结果法案》(GPRA)虽然每一任政府推出的改革举措各不相同,但构成这些措施的基本要素有着相似之处,其内在目的也大体一致,即,提高公共管理的效益与效率。
与以往政府的改革举措有所不同,GPRA 最主要的特点在于,它不仅仅是行政部门的一项改革动议,而是以立法的形式引入了一种新的管理概念与制度——绩效评估在这一制度要求下,对政府行政管理及结果的评估从以往的投入-产出模式转换为目标-结果模式,即不再是简单地对政府管理资源的过程进行考察,而是根据各机构所设定的任务目标来衡量其结果而且,与以往的改革举措相比,GPRA 具有的立法基础使之具有更大的权威性、持续性和强制作用关于 GPRA 出台的目的等内容,国内相关研究已有涉及 根据 GPRA 的目标指向,可将其目的概括为三个主要方面: (1)目标指向公众:通过系统地说明联邦机构的工作业绩,提高美国公众对政府的信任度;(2)目标指向联邦行政管理机构:要求其从法定任务和工作预期的最终结果出发,设定明确的定量绩效目标,并对照预设目标来检查工作进展和成果,以改善联邦政府的内部管理;(3)目标指向国会:通过联邦机构向国会提供有关政府工作情况的客观、准确的定量信息,为国会5的决策奠定科学的基础为了实现上述目的,GPRA 要求职责各异的联邦机构制定覆盖未来 5 年的战略规划(strategic plans)报告(且每 3 年修订一次),同时,要求联邦机构每年提供将战略规划分解为定量化实施目标的年度绩效规划(annual performance plans)报告,并对照年度绩效规划中的定量目标检查其完成情况,形成年度绩效评估报告(performance reports)。
GPRA 的作用不仅在于要求各联邦机构提供上述 3 份报告,更大的压力还在于,GPRA 要求国会、审计总署(GAO,General Accounting Office)和白宫的管理与预算办公室(OMB,Office of Management and Budget),把对这 3 份报告的审议与预算的批准过程结合起来也就是说,每个政府机构每年所能得到的经费预算,将与其制定的战略规划、绩效规划和绩效评估结果直接相关这就从制度上进一步保证 GPRA 得以贯彻实施,这也是 GPRA 为何会具有强制力的重要原因所在1.3 基础研究:能否成为 GPRA 的例外?GPRA 一经颁布,美国科学界和资助科学研究的联邦机构一片哗然许多科学家和科研资助机构的管理人员的第一反应是,该法案可能不会、也不该用于基础研究 其理由主要集中在以下 3 个方面:(1)科学研究最重要的成果——重大科学突破的产生时机和发展方向无法预测试图通过实施“规划”促使科学突破的产生,尤其是为科学突破产生的过程设置“年度进展的里程碑”(annual milestones),不仅是徒劳的也将是有害的因为这样会迫使科学家因更多地关注短期结果而趋于保守,而不是锐意创新;(2)科学家的研究成果往往不是在某一个资助机构的单独支持下完成的,而是与其他经费来源共同资助的结果。
把这种多渠道资助的成果仅作为某一个资助机构的成果指标,显然是不科学的;(3)没有什么定量方法可以真正衡量基础研究的质量研究结果的许多方面无疑是可以定量化的,但研究活动中最重要的方面却难以用定量指标来衡量因此,他们甚至希望,基础研究领域能6成为 GPRA 的例外然而,法律就是法律,法律不允许有例外国会和白宫坚持,支持基础研究的联邦机构也必须实施 GPRA不过,他们也注意到了基础研究的特殊性,指出该法案的具体实施可以有一定的灵活性,对资助基础研究的机构的年度规划报告和绩效评估报告在定量指标方面的要求也做了一定的让步白宫负责制定科技政策的国家科学和技术理事会(NSTC,National Science and Technology Council)下属的基础科学委员会(Committee on Fundamental Science)于 1996 年发布了具有指导性的报告《评价基础科学》 报告明确指出,支持科学研究的联邦机构必须设计出适合于科学研究特点的评估策略,同时,还要适合于推动基础研究在实现国家总体发展目标中发挥作用委员会在报告中声明,现有的评估手段和有关方法可以反映研究产出的重要组成部分,但研究产出中最主要的方面以及研究的最终结果和影响,很难用直接的评估工具进行量化处理;对基础科学的动态复杂性及其与国家目标间关系的认识,也不可能通过简单的定量手段予以实现。
基于同行评议的价值评议(merit review)不仅是对研究项目(projects)开展事前评议的基础,而且也是对基础科学的计划(pro。