首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于语义角色标注的专利主题提取研究
引用本文:孟令恩,李颖,何彦青,屈鹏,王惠临.基于语义角色标注的专利主题提取研究[J].图书情报工作,2014,58(19):19-24.
作者姓名:孟令恩  李颖  何彦青  屈鹏  王惠临
作者单位:中国科学技术信息研究所
基金项目:本文系国家自然科学基金项目“面向专利文献的统计机器翻译语境分析”(项目编号:61303152)和中日国际合作项目“面向科技文献的日汉双向实用型机器翻译合作研究”(项目编号:2014DFA11350)研究成果之一。
摘    要:主题自动提取对于专利文献的信息挖掘具有重要的意义。引入语义角色标注信息来辅助自动提取专利文献主题,区别于已有的专利文本分析平台所采用的人工标注或模板方式。为了改善专利文献的语义角色标注,首先描述将专利文献长句自动拆分成简化句的方法;其次,对简化句进行语义角色标注;最后,综合利用简化句语义信息以及自建带语义框架的常用词表,对专利文献进行主题信息抽取,获得必要信息,从而证实本研究的实用价值。

关 键 词:语义角色标注  简化句  主题抽取  专利文献  
收稿时间:2014-07-24

Research on Patent Topics Extraction Based on Semantic Role Labeling
Meng Ling'en,Li Ying,He Yanqing,Qu Peng,Wang Huilin.Research on Patent Topics Extraction Based on Semantic Role Labeling[J].Library and Information Service,2014,58(19):19-24.
Authors:Meng Ling'en  Li Ying  He Yanqing  Qu Peng  Wang Huilin
Institution:Institute of scientific and Technical Information of China, Beijing 100038
Abstract:Automatic topics extraction is crucial to mine information of patent literatures. The existing patent text analysis platforms use either manual annotation or templates to find topics. This paper introduces semantic role labeling (SRL) information to help extract patent topics automatically. To improve application effect of SRL to patent literatures, it first introduces the method of automatical sentences implification, then labels semantic roles for the simplified sentences, finally synthesizes semantic information and frequently used words with semantic framework to extract patent topics. The experimental results show that it can s extract beneficial knowledge from patents, and prove the valve of this study.
Keywords:semantic role labeling  simplified sentence  topic extraction  patent literature  
点击此处可从《图书情报工作》浏览原始摘要信息
点击此处可从《图书情报工作》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号