首页 | 本学科首页   官方微博 | 高级检索  
     

一种从医学文本中实现自动关键词抽取和筛选的技术方法*
引用本文:殷蜀梅,张智雄,吴振新. 一种从医学文本中实现自动关键词抽取和筛选的技术方法*[J]. 现代图书情报技术, 2008, 24(8): 31-36
作者姓名:殷蜀梅  张智雄  吴振新
作者单位:1. 北京大学医学图书馆,北京,100083
2. 中国科学院国家科学图书馆,北京,100190
摘    要:鉴于重要关键词对于文本有着重要的强文本表示功能,关键词抽取和筛选在信息检索、信息抽取和知识挖掘等领域中有着重要的作用。在调研当前关键词抽取的方法后,结合医学领域已有的叙词表和工具以及BM25F加权词频公式提出基于医学文本的重要关键词抽取和筛选的技术方法。该方法主要解决两个关键问题:关键词的识别和抽取、关键词重要性的衡量和筛选。以2001-2007年骨关节炎领域的文献集合为数据来源,对该技术方法进行实践尝试,并验证其实际有效性,为知识挖掘中的重要关键词抽取提供一个行之有效的途径。

关 键 词:关键词抽取  关键词筛选  BM25F  MMTx  文本挖掘  医学数据挖掘
收稿时间:2008-06-16

A Method for Automatic Keyword Extraction and Filtration from Medical Texts
Yin Shumei,Zhang Zhixiong,Wu Zhenxin. A Method for Automatic Keyword Extraction and Filtration from Medical Texts[J]. New Technology of Library and Information Service, 2008, 24(8): 31-36
Authors:Yin Shumei  Zhang Zhixiong  Wu Zhenxin
Affiliation:(Peking University Health Science Library, Beijing 100083,China)  (National Science Library, Chinese Academy of Sciences, Beijing 100190,China)
Abstract:Seeing that the keyword or key phrase can represent the feature of text, keyword extraction and filtration has great significance for information retrieval, information extraction and knowledge discovery. This paper first investigates current keyword extraction methods. Then it uses existing thesaurus and tools in the medical field and BM25F model in proposing a method for keyword extraction and filtration from medical texts. The proposed method mainly solves two key problems:identification and extraction of keywords, evaluation of keyword value and filtration of keywords. This paper applies the method on documents in the field of osteoarthritis from the year 2001 to 2007, and verifies its effectiveness, which offers an effective way for extracting keywords in knowledge discovery.
Keywords:BM25F  MMTx
本文献已被 万方数据 等数据库收录!
点击此处可从《现代图书情报技术》浏览原始摘要信息
点击此处可从《现代图书情报技术》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号