共现关键词—叙词同义关系自动识别研究——基于互信息法、概率法的对比分析 |
| |
引用本文: | 钟伟金.共现关键词—叙词同义关系自动识别研究——基于互信息法、概率法的对比分析[J].图书情报工作,2012,56(18):122-126. |
| |
作者姓名: | 钟伟金 |
| |
作者单位: | 广东医学院图书馆 湛江 520423 |
| |
基金项目: | 教育部人文社会科学研究一般项目“共现词汇语义关系挖掘与本体自动构建研究”(项目编号:10YJC870051);广东高校优秀青年创新人才培育项目“基于词共现的关键词语关系自动识别研究”(项目编号:wym09089)研究成果之一 |
| |
摘 要: | 以科技文献中的共现关键词—叙词词对(以下简称共现词对)为研究对象,运用互信息法、概率法计算方法,以准确率和召回率为衡量指标,通过绝对值方式和相对最高值方式,分析这两种统计方法在不同区间内对同义共现词对的自动识别效果及特点。研究发现,概率法的相对最高值方式具有最佳的同义共现词对识别效果。最后,探讨互信息法、概率法与共现频率的关系,揭示这两种统计方法在同义共现词对的识别上存在互补的特性。
|
关 键 词: | 同义词识别 互信息法 概率法 共现词 |
收稿时间: | 2012-06-11 |
本文献已被 CNKI 等数据库收录! |
| 点击此处可从《图书情报工作》浏览原始摘要信息 |
| 点击此处可从《图书情报工作》下载免费的PDF全文 |
|