首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于优化初始类中心点的K-means改进算法
引用本文:秦钰,荆继武,向继,张爱华.基于优化初始类中心点的K-means改进算法[J].中国科学院研究生院学报,2007,24(6):771-777.
作者姓名:秦钰  荆继武  向继  张爱华
作者单位:信息安全国家重点实验室(中国科学院研究生院),北京,100049
摘    要:K-means算法是一种重要的聚类算法,在网络信息处理领域有着广泛的应用。由于K-means算法终止于一个局部最优状态,所以初始类中心点的选择会在很大程度上影响其聚类效果。本文提出了一种K-means算法的改进算法,首先探测数据集中的相对密集区域,再利用这些密集区域生成初始类中心点。该方法能够很好地排除类边缘点和噪声点的影响,并且能够适应数据集中各个实际类别密度分布不平衡的情况,最终获得较好的聚类效果。

关 键 词:聚类  K-means  初始类中心点
文章编号:1002-1175(2007)06-0771-07
修稿时间:2006年10月12

An Improved K-means Algorithm Based on Optimizing Initial Points
QIN Yu,JING Ji-Wu,XIANG Ji,ZHANG Ai-Hua.An Improved K-means Algorithm Based on Optimizing Initial Points[J].Journal of the Graduate School of the Chinese Academy of Sciences,2007,24(6):771-777.
Authors:QIN Yu  JING Ji-Wu  XIANG Ji  ZHANG Ai-Hua
Institution:The State Key Laboratory of Information Security(Graduate University of Chinese Academy of Sciences)
Abstract:K-means is an important clustering algorithm. It is widely used in Internet information processing technologies. Because the procedure terminates at a local optimum, K-means is sensitive to initial starting condition. An improved algorithm is proposed, which searches for the relative density parts of the database and then generates initial points based on them. The method can achieve higher clustering accuracies by well excluding the effects of edge points and outliers, as well as adapt to databases which have very skewed density distributions.
Keywords:K-means
本文献已被 CNKI 万方数据 等数据库收录!
点击此处可从《中国科学院研究生院学报》浏览原始摘要信息
点击此处可从《中国科学院研究生院学报》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号