IRP中基于聚类分析的主题数据库划分研究 |
| |
引用本文: | 刘文远,杨丹丹,王宝文. IRP中基于聚类分析的主题数据库划分研究[J]. 情报杂志, 2009, 28(1) |
| |
作者姓名: | 刘文远 杨丹丹 王宝文 |
| |
作者单位: | 1. 燕山大学经济管理学院,秦皇岛,066004;燕山大学信息科学与工程学院,秦皇岛,066004 2. 燕山大学信息科学与工程学院,秦皇岛,066004 |
| |
基金项目: | 国家科技部高新技术计划项目,国家电子信息发展基金,河北省信息产业发展计划项目 |
| |
摘 要: | 在亲合度的基础上定义出实体之间的距离公式,并进一步定义出单个实体与实体集之间的平均距离公式,作为实体划分的标准,并结合k-means算法对主题数据库进行划分.此方法改进了亲合度利用单个实体参与的活动数作为划分依据的缺点,更好地体现实体之间的联系,有助于信息资源的规划.
|
关 键 词: | k-means算法 主题数据库 亲合度 平均距离 |
The Research of Subject Database Divide Based on Cluster Analysis in IRP |
| |
Abstract: | |
| |
Keywords: | |
本文献已被 维普 万方数据 等数据库收录! |
|