首页 | 本学科首页   官方微博 | 高级检索  
     检索      

面向融合出版前沿主题发现的学术论文未来工作句挖掘研究
引用本文:谢林蕾,向熠,章成志.面向融合出版前沿主题发现的学术论文未来工作句挖掘研究[J].情报工程,2023(5):123-138.
作者姓名:谢林蕾  向熠  章成志
作者单位:1. 南京理工大学经济管理学院信息管理系;2. 富媒体数字出版内容组织与知识服务重点实验室
摘    要:目的/意义]近年来,随着传统出版与数字出版的不断融合,形成了融合出版的新兴范式。如何科学准确地把握融合出版领域未来研究趋势具有重要研究意义。学术论文中描述未来研究工作的句子(简称“未来工作句”),不但可以辅助预测未来可能出现的前沿主题,还可为科研工作者、特别是初学者选题提供参考。方法/过程]对融合出版领域论文中的未来工作句进行人工标注和类别划分,构建未来工作句识别与分类语料库。在此基础上,使用支持向量机、朴素贝叶斯和随机森林三种模型结合SelectKBest特征选择方法,来训练未来工作句自动识别模型。结果/结论]LinearSVC在未来工作句自动识别任务中表现最为出色,其加权F1值达到92.08%。另外,本文对分类语料库中的未来工作句内容及其类别进行分析,得到融合出版领域未来工作句的类别分布及其变化规律。

关 键 词:融合出版  未来工作句  机器学习  文本分类  内容分析
点击此处可从《情报工程》浏览原始摘要信息
点击此处可从《情报工程》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号