面向融合出版前沿主题发现的学术论文未来工作句挖掘研究 |
| |
引用本文: | 谢林蕾,向熠,章成志.面向融合出版前沿主题发现的学术论文未来工作句挖掘研究[J].情报工程,2023(5):123-138. |
| |
作者姓名: | 谢林蕾 向熠 章成志 |
| |
作者单位: | 1. 南京理工大学经济管理学院信息管理系;2. 富媒体数字出版内容组织与知识服务重点实验室 |
| |
摘 要: | 目的/意义]近年来,随着传统出版与数字出版的不断融合,形成了融合出版的新兴范式。如何科学准确地把握融合出版领域未来研究趋势具有重要研究意义。学术论文中描述未来研究工作的句子(简称“未来工作句”),不但可以辅助预测未来可能出现的前沿主题,还可为科研工作者、特别是初学者选题提供参考。方法/过程]对融合出版领域论文中的未来工作句进行人工标注和类别划分,构建未来工作句识别与分类语料库。在此基础上,使用支持向量机、朴素贝叶斯和随机森林三种模型结合SelectKBest特征选择方法,来训练未来工作句自动识别模型。结果/结论]LinearSVC在未来工作句自动识别任务中表现最为出色,其加权F1值达到92.08%。另外,本文对分类语料库中的未来工作句内容及其类别进行分析,得到融合出版领域未来工作句的类别分布及其变化规律。
|
关 键 词: | 融合出版 未来工作句 机器学习 文本分类 内容分析 |
|
| 点击此处可从《情报工程》浏览原始摘要信息 |
| 点击此处可从《情报工程》下载免费的PDF全文 |
|