30年科学评价:SCI功与过

  用于评价的定量工具

  2008年12月9日,中国科学技术信息研究所公布的统计结果显示:2007年,SCI收录的中国科技论文数达94800篇,比2006年增长33.5%,占世界份额的7.5%,排在世界第三位,仅处于美国和英国之后。

  SCI是美国《科学引文索引》的英文简称,其全称为Science Citation Index,创刊于1961年,是根据现代情报学家加菲尔德(Engene Garfield) 1953年提出的引文思想创立的。

  就其本身而言,SCI最重要的功能是帮助科技人员获取需要的文献信息。这也是编辑该部索引的主要意图。

  SCI的优点是引文功能,在这里,读者能很快了解到某一作者的某篇论文是否被他人引用过,通过引文次数可以了解某一学科的发展过程。另外,使用SCI还可以了解到科学技术发展的最新信息,如:有没有关于某一课题的评论,某一理论有没有被证实,某方面的工作有没有被扩展,某一方法有没有被改善,某一提法是否成立,某一概念是否具有创新性等等。因此,SCI也具有反映科技论文质量和学术水平的功能。

  SCI的这些优点对科技工作者查阅最新文献、跟踪国际学术前沿、科研立项以及在具体的课题研究中及时了解国际动态都有很大帮助。

  上世纪80年代末,南京大学首先将SCI引入科研评价体系,从某种意义上开启了中国科研评价的定量时代。这件事与1986年国家自然科学基金委员会成立,并引入由科学共同体内专家,以民主决策方式决定科学基金分配的同行评议机制一起,表明我国对研究机构和研究人员的评价以行政手段为主,评价结果以行政级别的形式体现,并按相应行政级别享有国家投入和待遇的行政评议阶段结束了。

  据南京大学当时的校长曲钦岳院士介绍,这样做主要基于两个原因:一是当时处于转型期,国内学术界存在各种不正之风,缺少一个客观的评价标准;二是某些专业国内专家很少,国际上通行的同行评议不现实。引入SCI的目的,是用量化指标引导科研人员注意在国际学术期刊上发表论文,提高学校的学术竞争力。

  南京大学的做法在当时取得了明显成效。上世纪90年代,南京大学SCI论文数量连续多年位居全国首位。1995年10月,美国著名的《科学》杂志在其《中国科学》专刊中,介绍了南京大学的这一做法。

  在当时社会诚信普遍缺失、科研评价中掺杂大量人情等主观因素的现实情境下,SCI因其相对客观的评价标准及其相对超脱的国际“身份”,迅速被国内科学界当成一个可以尽量避免人为因素影响的科研评价标准,并逐步拥有了某种权威地位。可以说,近20年来,我国自然科学研究的发展历程在相当程度上也是一个SCI在国内落地生根、枝繁叶茂的过程。

  逐渐被异化的指标

  从此,以SCI论文数量等量化指标为要素的学术成果考核评价体系,在科研机构和高等院校广泛推行。

  由于改变了此前高校教学、科研管理随意松散的状态,这种考核曾被视为大胆改革的先锋之举。

  在相当长的时间里,SCI就像一个天使:由于对科研人员乃至研究生发表SCI文章数量提出了硬性要求,很多科研机构和高校都尝到了SCI文章数短期内大幅度攀升、学术地位也由此扶摇直上的甜头。

  甜头远不止于此,除了能把其实很难比对的学术水平进行简单量化后供人们热衷的各种排名之用以外,SCI还渗透到了项目评审、申报、科研人员评价奖励等科研领域的每个角落。拥有了SCI文章,特别是影响因子高的SCI文章,你就得到了“芝麻开门”的咒语,在上述各方面几乎可以“通吃”了。各个科研机构和高校则同样可以凭借SCI文章数量争取更多的经费和支持。因此,每年一度由某专门机构公布SCI排名的现场,变得更像是由各科研院所参与的科研政绩的“角斗场”。

  但渐渐地,科学界开始不能不面对这样一个尴尬的事实:在单纯追求数量的指挥棒下,不少单位将SCI由“标准之一”变成“唯一标准”,高额的物质奖励使充满趣味的科学探索变成了“机械化应试”。

  损质保量、一稿多投等是一些研究人员增加SCI数量的惯用手法;引用自己原先发表的论文,或是文章所发表的同一家杂志上的论文,则是造成居高不下的自引率,从而人为提升SCI影响因子的“聪明”做法。

  于是,我们有了许多几乎没有什么别的研究者会关注、引用的文章。这种除了“自娱自乐”和博得更多的名利之外,在科学研究上的意义几乎等于零的文章,被称为“垃圾SCI”。

  “SCI成了Stupid Chinese Idea(愚蠢的中国式观念)”。李国杰院士曾经这样戏谑地评价道。

  而在2001年4月3日的《科学时报》头版头条位置,蔡睿贤院士甚至感叹于SCI被滥用现象,发出“谁来决定中国基础研究方向”的追问,并由此引发了长达近一年的讨论。

  “不要连孩子一起泼掉”

  早在2003年5月,科技部、中国科学院、国家自然科学基金委员会、教育部、中国工程院五部委就联合发文,要求改进科技评价工作,其中特别指出:SCI、EI等收录论文数量只是科学技术评价中的定量指标之一,反对单纯以论文发表数量评价个人学术水平和贡献的做法。

  同年9月,教育部、科技部联合发文,决定取消政府导向的科学引文索引排名,引导高校从重视科研论文的数量向重视论文的质量方向转变。

  国家自然科学基金委员会主任陈宜瑜院士在接受记者的采访时也曾经指出,一定要看发表文章数量、一定要看排名先后的科研评价体系,已经严重阻碍了科技工作者的成长,过于苛刻的量化考核指标让他们无法正常进行科研。他说:科技工作者的浮躁,不光是他们个人的问题,也是管理者的问题,是评价体制的问题,必须尽快进行调整和改革。

  但是,同时要看到的是科学研究有其自身的发展规律,实验——得出结论——上升到理论高度——成文发表,这是任何领域研究的必经之路。

  虽然科研工作需要宽松自由的环境,但这并不代表科研可以散漫式发展。曾有从事管理研究的学者指出:对于我们这样的发展中国家而言,科技投入有限、发展任务很重,绩效管理和评估是必不可少的,这样才有利于我们在国家需求和世界科技前沿交叉点上确定科技创新的目标和方向,并集中有限的科技资源重点突破。

  没有理由拒绝评价。但如果不是SCI,更好的手段又是什么?

  事实上,如何才能科学地评估科学技术自身的工作、成果、效率以及科学家的学术水平等,一直是科研管理领域难以逾越的一道槛。简单运用SCI论文数对科学的伤害有目共睹,但简单利用同行评议的结果同样不是万全之策。

  有关专家表示,在可预见的未来若干年内,要实现对数量众多的科研成果和大量一般质量的论文进行直接评价,SCI体系依然有其现实价值。目前国内科技界存在的真正问题,不是使用SCI体系进行学术评价,而是对这一体系的不合理滥用。因此,我们不能犯列宁批评过的“泼脏水的时候连同小孩也一起泼掉”的错误。

  早在几年前就有学者指出:SCI与几乎在同一时期引入国内的同行评议制度完全可以在科学评价实践活动中,尤其是面对既需要定性评价,又需要定量评价的复杂评价对象和评价问题时有机结合起来,相互补充,形成一个综合的评价方法。

  科学评价期待多元化

  综合评价或许是科学评价方法的发展方向,但还有一个问题值得深思:不同个体对科学评价结果有不同的反应和不同的利用方式;一刀切地要求所有的组织和机构采用同一种标准的做法是不现实也不可能的。

  如何针对基础研究、应用研究、科技产业化等不同类型科学技术活动的特点,确定不同的评价目标、内容和标准,采用不同的评价方法和指标成为一个现实命题。

  在2003年5月15日由科技部、中国科学院等五部委联合下发的《关于改进科学技术评价工作的决定》中,可以清晰感受到官方的考量。《决定》详细区分了各种科技活动的具体评价方法:

  战略性基础研究的评价要以社会经济发展和国家安全中重大基础科学问题为导向,突出国家目标与科学发展目标的有机结合,以科学技术前沿的原始性创新和集成性创新、解决国家重大需求的实质性贡献以及优秀人才培养为主要评价标准。

  自由探索性基础研究的评价要以科学发展目标为导向,主要以新发现、新概念、新理论和新方法等原始创新性成果和创新性人才的培养为评价标准,注重原始性创新和科研人员的创新潜力,鼓励探索,宽容失败。

  应用研究的评价应紧密结合经济建设和社会发展的需求,以技术推动和市场牵引为导向。以技术理论、关键技术、共性技术和核心高技术的创新与集成水平、自主知识产权(专利、版权、标准、专有技术等)的产出、潜在的经济效益、社会效益等要素为主要评价标准。

  科技产业化的评价以建立企业为主体的科技成果转化与产业化机制,发展高新技术产业,优化调整产业结构为导向,以培育具有自主创新能力的高新技术企业为评价重点,以产品的技术先进性和创新性及其未来的产业化水平和发展前景为主要评价标准。这类科学技术活动要以市场评价为主,对这类科学技术活动的评价应注意吸收经济学家、管理专家及产业界人士的意见。

  需要指出的是,上述《决定》的意义更多体现在认识层次上,对科研评价的导向意义是明显的;但30年过去了,科研投入主体日益多元化,这意味着评价导向的多元化也势在必然,在这个过程中,科学的属性将进一步清晰,其服务于不同诉求的能力也将在不同的价值牵引下,获得过去的这30年所不能比拟的巨大提升。

  关于科学评价体系的争论不会因为一个30年的结束而结束,但一个趋势不容置疑,那就是在与社会经济的不断相互作用中,中国科学对现实需求的关照正越来越深刻,越来越细致。

  来源:《科学时报》 2008-12-17

2008年12月18日 09:02:53  清华新闻网

更多 ›图说清华

最新更新