计算中心白晓梅副教授在Journal of Informetrics上发表最新研究成果

计算中心白晓梅副教授在Journal of Informetrics上发表最新研究成果

——预测学术论文的引用量


预测学术论文引用量在政府资金分配、招募新成员和嘉奖等方面具有重要的指导意义。然而,很少知道论文引用模式如何随时间演进。本文通过探索学术论文引用量固有的演进机制如学术论文固有的质量、学术论文影响力随时间的衰减规律、论文早期的引用量以及早期引用者的影响力,提出论文潜力指数模型(PPI model)。如图1所示。


clip_image002.jpg

(图1



为了获得PPI模型中最优参数α, β, W1,W2, 本文采用最大似然估计法,我们得到目标函数如图2所示。


clip_image002.jpg

(图2



此外,通过分析驱动引用量增长的因素,本文还提出了一个基于多特征的论文影响力预测模型(GBDT_ALL GBDT_10)。本文提出的模型和发表在Science上的模型PLI_Science进行了对比,部分实验结果如图3和图4所示。




clip_image002.jpgclip_image002.jpg

3                                    4


实验结果表明,就MAE以及RMSE而言,PPI模型(PPIPPI_NECAI)以及基于多特征的论文影响力预测模型(GBDT_ALL GBDT_10)预测结果好于PLI_Science模型。值得一提的是,就RMSE而言,相比基于多特征的模型,PPI模型产生更好的预测性能,PPI模型具有更好的解释性以及不需要调整参数。相比PPI模型,就MAPEAccuracy而言,基于多特征的论文影响力预测模型,具有更好的预测结果,然而,该模型依赖参数的调节。

相关成果发表在Journal of Informetrics期刊(中科院SCI二区)。文献信息如下:Xiaomei Bai, Fuli Zhang, Ivan Lee. Predicting the citations of scholarly paper [J]. Journal of Informetrics, 2019, 13(1): 407-418. 上述研究工作得到辽宁省重点计划指导项目(2018104021)和辽宁省计划指导项目((20180550011)的资助。