首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 93 毫秒
1.
提出了一种基于郭涛算法的聚类算法,在WEKA平台上通过使用Iris数据集和Glass数据集对基于郭涛算法的聚类算法和K-means算法进行对比实验,验证了基于郭涛算法的聚类算法的有效性。  相似文献   

2.
K 均值算法(K-Means)是聚类算法中最受欢迎且最健壮的一种算法,然而在实际应用中,存在真实数据集划分的类数无法提前确定及初始聚类中心点随机选择易使聚类结果陷入局部最优解的问题。因此提出一种基于最大距离中位数及误差平方和(SSE)的自适应改进算法。该算法根据计算获取初始聚类中心点,并通过 SSE 变化趋势决定终止聚类或继续簇的分裂,从而自动确定划分的类簇个数。采用 UCI 的 4 种数据集进行实验。结果表明,改进后的算法相比传统聚类算法在不增加迭代次数的情况下,聚类准确率分别提高了17.133%、22.416%、1.545%、0.238%,且聚类结果更加稳定。  相似文献   

3.
聚类和粒度具有天然的相通性,本文探讨了基于粒度聚类算法的一般框架,并基于该框架,研究了一种基于网格密度的文本聚类算法,最后以例证说明这一方法的可行性。  相似文献   

4.
提出了一种基于网格密度的聚类算法(DGCA)。该算法主要利用网格技术去除数据集中的部分孤立点或噪声数据,对类的边缘节点使用一种边缘节点判断函数进行提取,最后利用相近值的方法进行聚类。实验表明,DGCA算法能够很好地识别出孤立点或噪声,聚类结果可以达到一个较高的精度。  相似文献   

5.
聚类算法是数据挖掘的核心技术,基于密度的聚类是一类已经被证明非常有效的聚类方法.与DBSCAN算法作比较,文章提出了一种基于密度的聚类算法(Clustering Using Centers and Density,CUCD).该算法是基于中心点以及密度实现的,其核心对象是根据数据分布计算出来的虚拟的点,并且核心对象的代表性随程序的执行次数而提高;经实验验证,该算法具有较好的时间效率和聚类质量.  相似文献   

6.
K-Means算法是聚类方法中常用的一种划分方法。随着数据量的增加,K-Means算法的局限性日益突出。基于网格划分的思想,提出了一种基于网格的K-Means聚类算法,该算法使用了网格技术在一定程度上去除了孤立点和噪声数据,减少了原始K-Means算法将大的聚类分开的可能。实验表明,该算法能处理任意形状和大小的聚类,对孤立点和噪声数据也能很好地识别,并且在去除孤立点和噪声数据方面可以达到较好的精度。  相似文献   

7.
针对传统的模糊聚类算法(FCM)的不足,提出了具体的改进和提高方法,通过修改聚类目标函数来提高算法处理噪音点的能力和体现样本空间各维度对聚类效果的价值。最后通过实验比较证明了算法的有效性。  相似文献   

8.
相比较于其它聚类算法,密度峰值聚类算法可将任意形状的数据与较少的参数和高效的聚类速度结合起来。针对当某个类中出现多个密度峰值时,聚类结果缺乏准确性的问题,提出一种改进的密度峰值聚类结果有效性造成的影响,算法通过比较类簇之间的密度属性,实现动态的子簇合并,减少主观因素对算法结果的影响。通过实验与已有密度聚类算法对比,改进算法不仅很好地避免了原算法人为确定参数给实验结果造成的影响,而且具有更好的聚类性能。  相似文献   

9.
一种改进的k-means聚类算法   总被引:2,自引:0,他引:2  
针对k-means算法事先必须获知聚类数目以及难以确定初始中心的缺点,提出了一种改进的k-means聚类算法.首先引入轮廓系数的概念,通过计算不同K值下簇集中各对象的轮廓系数确定事先未知分类信息的数据集中所包含的最优聚类数Kopt;然后通过凝聚层次聚类的方法获得数据集的分布,确定初始聚类中心;最后利用传统的k-means方法完成聚类.理论分析表明,所提出的算法具有适度的计算复杂度.IRIS测试数据集的实验结果表明了该算法能够合理区分不同类型的簇集,且可以有效地识别离群点,聚合后的结果簇集具有较低的熵值.  相似文献   

10.
11.
基于均匀网格的自适应密度快速聚类算法   总被引:1,自引:1,他引:0  
提出了一种基于均匀网格的自适应密度快速聚类新算法.首先引入均匀网格和边界网格概念,然后给出了网格均匀度的计算方法和自适应网格划分技术.每次聚类都从均匀度最高的网格开始逐步向周围扩展均匀网格,直到遇到边界网格为止.算法除具有一般网格聚类算法的优点外,还能自适应地发现不同密度的类及其边界,能够有效地识别孤立点并具有较好的扩展性.最后,通过实验验证了该算法的有效性.  相似文献   

12.
重点讨论了聚类分析方法中K-means聚类算法在客户价值分析中的作用,通过对客户的现有价值和潜在价值进行分析,对客户进行细分。在此基础上,企业可结合行业的特征找出各类客户的特点,实行差异化服务策略,让更好的资源和服务提供给最有价值客户,从而达到顾客满意、企业盈利的目的。  相似文献   

13.
提出了一种基于改进蚁群算法的动态K-均值聚类算法思想,该算法首先利用蚁群算法的较强处理局部极值的能力,动态地确定了聚类数目和中心,然后利用蚁群聚类得到的结果,再进行K-均值聚类弥补蚁群算法的不足。两者有机结合起来可以寻求到具有全局分布特性的最优聚类,实现了基于改进的蚁群聚类算法分析。  相似文献   

14.
提出了一种基于改进蚁群算法的动态K-均值聚类算法思想。该算法首先利用蚁群算法较强处理局部极值的能力,动态地确定了聚类数目和中心,然后利用蚁群聚类得到的结果,进行K-均值聚类弥补蚁群算法的不足。两者的有机结合可以寻求到具有全局分布特性的最优聚类,实现基于改进的蚁群聚类算法分析。  相似文献   

15.
基于向量空间模型的文档聚类算法研究   总被引:3,自引:0,他引:3  
随着网络信息的迅速增长,文档聚类技术成为了人们研究的热点课题.探讨了几种基于向量空间模型的文档聚类算法,如常见的k—means算法和凝聚层次算法,针对它们的不足提出了改进的BK-means算法和多层CFK-means算法.最后,根据一定的评价标准,得出Bk—means算法是文档聚类算法中较好的算法.  相似文献   

16.
融合音频特征的比赛场地主颜色聚类算法   总被引:1,自引:1,他引:0  
针对当前手动分割视频获取主颜色实验帧序列,导致算法鲁棒性差,自动化程度低等问题,着重分析了体育比赛的音频特征及场地颜色特征,提出一种融合音频特征的主颜色聚类算法。实验结果表明,该算法不需人工预处理,针对不同比赛场地具有良好的鲁棒性,通过音频特征的辅助分析,有效提高主颜色提取准确率,同时降低时间复杂度。  相似文献   

17.
基于模糊C均值的异常流量检测模型   总被引:1,自引:0,他引:1  
对网络进行流量异常检测,流量出现异常后再对数据包进行分析,通过这种方法能够降低系统开销,聚类算法是一种有效的异常入侵检测方法,可用在网络流量异常检测中,用于判定当前网络流量是否出现异常,本文将模糊C均值算法应用于流量异常检测模型中,通过实验,该模型能够有效检测出流量的异常状态.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号