首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于深度学习与需求规则融合的学术文献“目标数据”抽取模型构建与应用——以南海数字资源为例
引用本文:彭玉芳,陈将浩.基于深度学习与需求规则融合的学术文献“目标数据”抽取模型构建与应用——以南海数字资源为例[J].情报科学,2022,39(1):141-147.
作者姓名:彭玉芳  陈将浩
作者单位:南京工程学院经济与管理学院;南京大学信息管理学院;中国科学技术大学数学科学学院
基金项目:国家社会科学基金重大项目“南海疆文献资料整理中的知识发现与维权证据链建构研究”(19ZDA347);南京大学2015年度研究生创新工程“跨学科科研创新基金”项目“民国档案文献中的环中国南海文化电函与报道研究”(2015CW04);江苏省研究生培养创新工程项“基于自动关联技术的南海问题证据链研究”(KYLX15_0025)。
摘    要:【目的/意义】从海量的学术文献内容中,抽取科研人员所需要的目标数据,一方面有助于提高研究者的科 研效率,另一方面有利于改善目前文献数据库的检索服务。【方法/过程】根据科研人员的学术需求,首先通过深度 学习方法从大量的学术文献中抽取目标数据。其次使用NER和TF-IDF抽取目标数据的“5W”规则,接着对目标 数据做第二层需求规则过滤,凡是满足“5W”规则的数据,被鉴定为目标数据。最后对目标数据做第三层人工校 验,最终生成学术文献“目标数据”。【结果/结论】本文构建的学术文献“目标数据”抽取模型的准确率可达0.88,再融 合“5W”规则的过滤和最后的人工校验,不仅有利于提高科研工作者的学术文献查准率,而且一定程度上辅助文献 数据库机构的检索工作。【创新/局限】深度学习与需求规则融合,实现学术文献的检索结果从学术文献的题录信息 层面到进入学术文献内容的数据层面。

关 键 词:深度学习  命名实体识别  词袋模型  TF-IDF  “5W”规则
本文献已被 维普 等数据库收录!
点击此处可从《情报科学》浏览原始摘要信息
点击此处可从《情报科学》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号