导读 新加坡国立大学的一名统计学家开发了一个指标,可以自动考虑不同学科的引用差异,以衡量科学文章的研究价值。科学论文的研究价值(影响)经常

新加坡国立大学的一名统计学家开发了一个指标,可以自动考虑不同学科的引用差异,以衡量科学文章的研究价值。科学论文的研究价值(影响)经常被用作判断研究成果质量的参数之一。这通常是从已经发表在期刊上的研究工作的引用中获得的。然而,不同的学科有不同的研究行为和引文做法。例如,某些学科(例如数学)的文章通常引用率较低,而其他领域(例如分子生物学)的平均引用次数则更多。因此,基于原始引用计数比较不同学科的研究质量并不能准确反映研究价值。

新加坡国立大学统计与应用概率系的 Linda TAN 教授开发了一种文章级别的度量标准,称为“主题调整可见性度量标准”,它能够自动解释不同研究领域之间引用活动的变化。它在不使用标记到单个文章的现有字段分类的情况下进行计算,而是使用包含属于所选文章的属性的复杂网络。每篇文章不必属于单个领域,但可以不同程度地属于多个领域。这可以为比较不同领域的个别科学出版物提供更好的衡量标准。研究团队还开发了一种使用该指标的高效计算算法,以帮助学术研究人员进行文章推荐。

陈教授说:“当我们的方法应用于 KDD Cup 2003(知识发现和数据挖掘竞赛)基准数据集时,该数据集拥有大约 30,000篇高能物理论文,通过更准确地预测实际引用,它展示了更好的文章推荐性能与其他可用模型相比,来自测试文章。”