基于天际线算法的主题排序方法研究 |
| |
引用本文: | 万校基,李海林,龚燕燕,林海龙.基于天际线算法的主题排序方法研究[J].情报学报,2022(4):388-400. |
| |
作者姓名: | 万校基 李海林 龚燕燕 林海龙 |
| |
作者单位: | 1. 华侨大学工商管理学院;2. 华侨大学东方企业管理研究中心 |
| |
基金项目: | 国家自然科学基金项目“高维时间序列数据聚类分析及应用研究”(71771094);;福建省社会科学规划项目“基于文献主题时间序列数据挖掘的技术预见研究”(FJ2020B088); |
| |
摘 要: | 针对现有主题排序偏主观、高维数据复杂难处理等问题,提出一种基于近邻传播聚类和天际线算法的主题排序方法。结合关键词重要性和近邻传播聚类算法自适应获取文献初始核心主题,借助平均相似性系数进一步对初始主题簇进行二次近邻传播聚类。以簇中心代表关键词的篇均被引量和篇均下载量为主题热度表征指标,利用天际线算法获取主题天际线集合,通过主成分分析法实现主题排序。对中国知网2010—2020年与供应链相关的期刊文献进行数据处理和挖掘时发现,本文提出的新方法可以有效地识别供应链领域研究主题及其热度,不仅可为相关科研人员的科学选题提供指导意见,也可为相关期刊的精准选稿提供决策支持。
|
关 键 词: | 主题热度 天际线算法 近邻传播聚类 主成分分析 |
|
|