小议学术成果评价之学术性回归

2019-08-13 来源：《中国社会科学报》2019年8月13日总第1755期作者：金成武

分享到：

字号： [大] [中] [小] [关闭] [打印]

　　目前各评价机构对各期刊所载文章的评价，以及对各期刊的评价，主要依赖于影响因子等统计指标。这些指标虽然主要表征了文章在既定时期的学术影响力，但还不能直接等同于文章的学术质量，学术质量要从人类研究发展历程中的边际贡献来把握。

　　近年来，关于学术成果评价的讨论日渐增多，观点主要集中于对以下一些现象的批评：各评价机构根据以影响因子为代表的指标体系评价学术期刊并公布其分类与排名，这诱导不少期刊更关注提升这些指标的技术性处理，比如减少每期载文量、增加著名学者文章比重、向作者强调增加对本刊所载文章引用频次等；高校及科研机构在职称、职务晋升等评议中，普遍以候选者发表文章的期刊度量文章质量，并且更关注已发表文章的数量，同时，绩效考核周期较短并且学术成果发表有严格的结构与数量要求。这些使广大学者更关注写作与发表速度，而相对忽略更深入的思考与锤炼，不利于涌现学术精品，并且教学工作也受到一定的影响。

　　笔者认为，各种讨论如果只停留于问题揭示而不能提供可操作的、可解决相关问题的替代方案，并且比较不同方案所可能带来的各种问题，现实中采用的方案则仍旧可能具有更强的可操作性与更广泛的认同性。学术期刊是学术成果鉴别、加工与传播的最重要载体，学术成果评价不可绕开学术期刊的相关工作。事实上，学术期刊担负了学术成果前期“评而择其相对优者”的重要工作，并且这种工作出于期刊长远发展的考虑，对于众多作者及其所在机构会保持很大的独立性。然而，由于学术期刊都有固定的出版周期及页面数，无论备选稿来源于作者投稿还是期刊主动约稿或觅稿，限于各方面时间上的要求以及作者的研究取向与特色，实际操作中，专家评审与作者修改历程大多数情况下不会显著改变备选稿的主要内容，从而某一时期各期刊所载文章流量的质量整体上还是取决于学术界各领域研究成果流量的质量。当然，从另一方面说，这些成果流量会分领域地通过作者与期刊间的互动（比如期刊的投审稿机制）散布于各期刊。由此，笔者认为，如果讨论某一时期“期刊对学术成果评价”的再评价，前提也应是评价者对该时期内某一领域各期刊所载文章流量总和有足够充分确切的把握，评价结果其实是表明相应文章流量的质量如何分布于该领域各期刊。

　　目前各评价机构对各期刊所载文章的评价，以及对各期刊的评价，主要依赖于影响因子等统计指标。这些指标虽然主要表征了文章在既定时期的学术影响力，但还不能直接等同于文章的学术质量，学术质量要从人类研究发展历程中的边际贡献来把握。特别是，文章的这些指标与以往期刊评价结果具有很强的内生性，以往获得好评的期刊所载文章更容易获得更高的统计指标值，从而极容易导致同一文章因载于不同期刊而具有不同统计指标值的情况。由于影响因子等统计指标仍难以有更好的替代指标，笔者并无意简单一否了之，而是尝试思考，在使用这些指标的基础上，如何弥补其所不能反映的信息。

　　评价文章的根本，是对文章内容作出学术性评价，或者说让学术成果评价本身亦回归本领域的学术性，而不只依赖于一些统计指标。这些统计指标虽然可以提供文献间某些时间关联方面的信息，但不能提供人类诸领域研究各自如何发展的信息，特别是文献间内在逻辑联系方面的信息，这些信息恰恰需要同领域的学者们提供。

　　某一时期某一领域学术成果的学术性评价，要求评价者时刻关注本领域最新学术成果的发表，并对该领域截至评价时发表于各相关期刊的学术成果有相当充分的掌握，从本领域研究的发展历程中把握与陈述该时期所发表学术成果与已发表成果的关系，从中作出评价，并写出该时期本领域学术成果评价报告。

　　该报告应该包括以下内容：报告所涉及的评价时期、研究领域、期刊名单、文章名单及其中的优秀文章名单，这些文章在本领域研究中的贡献及依据。这种评价不同于传统的文献综述，也不是简单的论点与论据的罗列，而是对既定时期内各期刊发表的既定领域学术成果增量截至本时期末在本领域研究发展历程中的贡献作出评价。它有横比与纵比两个维度，并且不超越既定时期。当然这种评价是异常辛苦并需要长期坚守的，需要评价者长期密切关注某一领域的研究动态。但在笔者看来，这比依靠机器与程序得来的各种统计指标重要得多，对学术发展也更有积极意义。它是针对文章的，不是针对期刊的，直接回归于学术成果的学术性评价本身，这既可以弥补学者们侧重阅读并引用以往获得好评期刊所载文章的缺陷，也可以为学者们节约大量搜寻与阅读海量文献的时间，同时可以为学者们提供未来具体研究方向的参考，还可以引导学者们关注成果本身的质量，而非追求一些统计指标。这是一种学术自觉，也为学术界提供了单种学术期刊难以完成的公益性服务，单种期刊在发表前的评价（即稿件评审）一般难以顾及其他期刊在同时期的同类活动。当然，人们不免会担心这种工作主观性很强，没有前述那些统计指标“客观”。

　　然而，许多看似客观的统计指标仍有纯技术操作的空间。更重要的是，由于获得这些统计指标信息的计算机技术并非高壁垒类，这很容易催生不同机构的重复工作，却并没有为学术界提供更多新信息。恰恰是长期“普查式”地关注某一领域学术成果的学者所作出的上述评价报告，才可能构成评价方面真正的核心竞争力，并且这种评价报告亦是一种学术成果，同样接受学术界的评价直至认可。同时，这种报告可以由诸多学者乃至学术机构推出，构成竞争关系。这种竞争关系，相比于众多基于各种统计指标信息的期刊分类与排名系统间的竞争，对学术成果评价乃至推动学术发展更有现实意义。

　　从另一个角度说，现实中人们对学术成果评价莫衷一是，也常常是因为上述这种辛苦但有重要意义的学术性工作几乎没有人长期连续做，从而形成真正意义上的内容评价（而非数据形式评价）的专业化分工。

　　总之，当人们不断讨论学术成果评价时，不能只停留于批评与不满本身，更应该积极思考替代或补充的方案。无论尚存在哪些问题，学术界总是需要实施某种学术成果评价机制。如果总不能形成同领域学者比较公认的更完善的学术成果评价机制，相关讨论对推动学术进步的意义也就不大了。本文只是尝试提供一种可能的方案，前方仍布满荆棘，需要不断探索，其可行性及具体效果也要在实践中不断检验。

　　（作者系国家社科基金重大项目“新时代下地方政府债务风险的新特征与监管研究”子课题负责人、中国社会科学院研究员）

责任编辑：王宁

热点文章