首页 | 本学科首页   官方微博 | 高级检索  
     检索      

专利文献中关键词抽取方法的改进
引用本文:刘峰,吴瑞红,徐川,吕学强.专利文献中关键词抽取方法的改进[J].情报杂志,2014(12).
作者姓名:刘峰  吴瑞红  徐川  吕学强
作者单位:1. 公安部第一研究所 北京 100048
2. 北京信息科技大学网络文化与数字传播北京市重点实验室 北京 100101
3. 公安部第一研究所 北京 100048; 北京信息科技大学网络文化与数字传播北京市重点实验室 北京 100101
基金项目:国家自然科学基金项目“基于本体的专利自动标引研究”,北京市教委科技发展计划重点项目暨北京市自然科学基金B类重点项目“面向领域的互联网多模态信息精准搜索方法研究”(
摘    要:专利关键词是对专利文献的高度概括,正确提取专利文献中的关键词对于专利文献的分类、标引、聚类等具有重要意义。结合专利文献的特点,在目前已有方法的基础上,提出了专利文献中领域公共词提取方法、词素加权方法以及并列结构惩罚的方法,将其应用到专利文献关键词抽取中。在过滤公共词的基础上,综合运用词在文献中出现的位置、词频、词素和并列结构计算词对文献主题的影响度,抽取专利文献中的关键词。实验结果表明,在抽取关键词个数为5-9个时,所提方法优于局部加权TF-IDF方法,验证了所提方法的有效性。

关 键 词:专利文献  专利  抽取  公共词

Keyword Extraction of Patent Document:An Improved Approach
Liu Feng,Wu Ruihong,Xu Chuan,Lyu Xueqiang.Keyword Extraction of Patent Document:An Improved Approach[J].Journal of Information,2014(12).
Authors:Liu Feng  Wu Ruihong  Xu Chuan  Lyu Xueqiang
Abstract:
Keywords:patent document  patent keywords  keywords extraction  common word
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号