首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
随着网络的快速发展,入侵检测系统生成的告警信息越来越多,聚类技术广泛的应用于处理告警信息.针对传统的K-Means算法易陷入局部最优,提出一种改进半监督聚类算法ISC.从数据集中抽取若干正常与异常样本分别采用层次聚类算法分别计算作为初始质心辅助K-Means算法进行聚类.实验结果表明,与现有相关算法相比,该算法具有更高的攻击检测率以及更低的误报率.  相似文献   

2.
聚类分析被广泛用于数据挖掘等领域,基于蚁群算法的聚类算法也得以应用。针对K-Means算法和蚁群聚类算法出现的缺点,利用了K-Means算法快速确定聚类中心和精英适应保留值的策略,提出了一种改进的基于K-Means的蚁群聚类算法。仿真实验表明,改进算法的性能得到有效提高。  相似文献   

3.
聚类是指按照事物间的相似性对事物进行区分和分类的过程,是在无指导下自动进行的无监督分类。本文应用数据挖掘技术中的聚类分析,对毕业生就业信息进行研究,介绍了K-Means算法和K-Means算法在毕业生就业信息分析中的应用。  相似文献   

4.
K 均值算法(K-Means)是聚类算法中最受欢迎且最健壮的一种算法,然而在实际应用中,存在真实数据集划分的类数无法提前确定及初始聚类中心点随机选择易使聚类结果陷入局部最优解的问题。因此提出一种基于最大距离中位数及误差平方和(SSE)的自适应改进算法。该算法根据计算获取初始聚类中心点,并通过 SSE 变化趋势决定终止聚类或继续簇的分裂,从而自动确定划分的类簇个数。采用 UCI 的 4 种数据集进行实验。结果表明,改进后的算法相比传统聚类算法在不增加迭代次数的情况下,聚类准确率分别提高了17.133%、22.416%、1.545%、0.238%,且聚类结果更加稳定。  相似文献   

5.
针对文本类型数据的分类进行研究,用VSM模型和TF IDF技术对文本文件进行了数据样本抽取加权,得到文本相似度矩阵;采用不同样本距离计算方法和K-Means算法对数据进行了聚类实验,获得聚类结果并进行了分析和总结;基于实验结论,研究了不同距离计算方法之间的区别以及适用的数据类型。  相似文献   

6.
聚类分析是当今飞速发展的数据挖掘和数据信息分析的一个重要技术,因此聚类分析已经成为数据挖掘领域一个非常活跃的研究课题.针对空间数据库对聚类算法的特殊要求,分析了空间聚类算法的构造思想及其优缺点,探讨了空间聚类算法目前的工作、算法的一些开放性问题以及今后的研究方向.  相似文献   

7.
对空间数据挖掘聚类技术及其在公共设施选址方面的传统应用方法进行了综述,分析了传统应用方法中有待解决的关键问题,对空间距离代价的表示问题和传统方法的算法时间复杂度进行了初步探讨,运用模拟退火算法和图论对传统方法进行了改进,实现了算法时间复杂度的降低和聚类结果的优化。  相似文献   

8.
随着宏基因组学的不断发展,揭示了微生物菌群在研究中的重要作用。采用K-Means聚类算法对来源于北平顶猴阴道微生物群落OTUs数据集的27个样本进行研究,并与PCA主成分分析法进行对比。K-Means聚类将OTUs数据集分成4个Cluster,而PCA将OTUs数据集划分成5个Cluster。此外,结合样本的元数据-pH,发现样本间的pH值相似性更能与K-Means聚类的分类保持一致。相较于PCA主成分析方法,K-Means聚类能更精确地对OTUs数据集进行分类。  相似文献   

9.
针对ISODATA对初始聚类点选取较为敏感,不能处理噪声点的缺陷,提出一种基于结合密度最大的改进型ISODATA的划分聚类方法D-ISODATA。基于高局部密度点距离和局部密度最大原则,优化聚类初始点并去除噪声点。根据考察对象所处空间区域的密度分布情况划分基本簇,结合ISODATA聚类算法良好的自适应性,有效地对数据集进行分类。实验表明,这种基于密度聚类的改进型ISODATA算法能有效去除噪声点,改善初始中心点选择对最后聚类算法的影响,并且具有良好的自适应性,对于数据集处理的准确性优于传统K-means算法和ISODATA算法。  相似文献   

10.
K-Means算法是聚类方法中常用的一种划分方法。随着数据量的增加,K-Means算法的局限性日益突出。基于网格划分的思想,提出了一种基于网格的K-Means聚类算法,该算法使用了网格技术在一定程度上去除了孤立点和噪声数据,减少了原始K-Means算法将大的聚类分开的可能。实验表明,该算法能处理任意形状和大小的聚类,对孤立点和噪声数据也能很好地识别,并且在去除孤立点和噪声数据方面可以达到较好的精度。  相似文献   

11.
聚类方法能够提高Web服务检索的能力,针对传统的K-Means聚类算法聚类时间长的缺陷,文中提出了一种改进的K-Means服务聚类方法,并进行了有效性验证,在利用API服务数据集上进行实验,其结果表明:改进的K-Means服务聚类的方法降低了服务聚类的时间复杂度。  相似文献   

12.
K-means算法在聚类过程中随机选取k个初始聚类中心,容易造成聚类结果不稳定。针对该问题,提出PCA-TDKM算法:使用主成分分析法对数据对象集合的属性进行降维,提取出主属性,去掉无关属性,从而加速聚类过程;基于最小生成树算法及树的剪枝方法将数据对象划分为k个初始聚类簇,然后进行剪枝生成k棵子树,计算每棵子树中所有数据对象的均值,作为初始聚类中心;利用基于密度与最大最小距离的算法思想进行聚类。将PCA-TDKM算法与K-means、KNE-KM、QMC KM、CFSFDP-KM在UCI数据集上进行聚类比较,结果表明该算法聚类结果稳定、聚类准确率高。  相似文献   

13.
传统的集中式聚类算法不适宜对传感器网络的分布式数据进行聚类,用遗传进化机制对传统k-means的分布式聚类算法进行优化,可得出遗传k-means聚类算法。遗传k-means聚类算法即在传感器网络中sink节点传送随机选取的初始k个簇心到各个传感器节点,在这些节点上分别用遗传k-means聚类算法将本地的数据划分到距离最近的簇,然后将簇信息在无线传感器网络里通过路由逐层上传合并汇聚到sink节点,计算k个簇心的平均值,再往下传送k个簇心,反复迭代更新直至聚类目标函数值达到最小为止。实验表明,遗传k-means聚类算法的聚类效果较好,收敛速度较快。  相似文献   

14.
基于核主成分降维的RBF网络降水预测   总被引:1,自引:0,他引:1  
李洁 《柳州师专学报》2012,27(1):111-117
针对径向基函数神经网络(RBF网络)的隐层节点数、中心和宽度难以确定的问题,为提高网络性能,首先采用模糊聚类分析法对样本数据进行初始聚类,以初始分类间的最小距离作为初始宽度;然后引入正交最小二乘法训练出新的数据中心、个数及权值,修改宽度为当前数据中心间的最小距离;最后采用梯度下降法训练并调整中心、宽度及权值;几种算法进行的组合优化改进,使网络泛化性能更优.由于降水影响因子众多,采用了核主成分分析法(KPCA)对样本数据进行特征提取降维预处理.对广西5月3区的日降水量使用上述模型进行预报实验,结果表明,该模型具有较好的泛化性能,预报准确率高于T213降水预报模式,具有一定的推广价值.  相似文献   

15.
数据挖掘中聚类方法比较研究   总被引:4,自引:0,他引:4  
聚类是数据挖掘领域中的一个重要研究课题。聚类在电子商务、图像处理、模式识别、本分类等领域有广泛的应用。本首先建立了数据挖掘中聚类方法的比较标准,然后从基于优化、关系、变换这样一个新的角度对聚类方法进行了分类和比较,最后对数据挖掘中常用聚类算法进行了分析,以便于人们更易于选择研究方向和选择适合于具体问题的聚类算法。  相似文献   

16.
曹平 《教育技术导刊》2012,11(5):100-102
介绍了网络流量分析与预测相关的知识及技术,涉及到:网络流量数据的采集、网络流量的分析技术、网络流量的预测技术以及数据挖掘技术等;分析了经典关联规则挖掘算法Apriori以及FT-Tree算法,指出了它们存在的问题,在此基础上指出了将聚类挖掘算法应用于网络流量研究的优势所在。提出了针对K-Means聚类算法进行分析、研究、改进的方法。根据网络流量研究的流程,从数据采集、流量分析、行为预测等方面研究了系统的实现。  相似文献   

17.
马程  陈杰 《宜春学院学报》2012,34(12):19-21
障碍约束下的空间聚类是空间数据挖掘研究领域中一个重要的研究课题。论文研究了障碍约束的处理方法,引入粒子逃逸原则以避免聚类中心点陷入障碍物中,提出一种基于量子粒子群的绕过障碍物的空间聚类算法(QCOD),通过实验对比分析,该算法不仅有效地克服了划分聚类算法极易陷入局部极小值和对初始值敏感的问题,而且聚类结果比带障碍的k-中心点算法更符合实际情况。  相似文献   

18.
针对Web挖掘,首先论述了Web挖掘的基本理论,接着分析数据挖掘中的聚类算法,讨论了聚类分析的数据结构和数据类型,以及聚类算法的分类,详细介绍了数据挖掘中用到的主要聚类算法,最后对评价聚类结果的方法进行了分析。  相似文献   

19.
文本聚类能够把相似性大的文本聚到同一类中。K-Means常用来聚类文本,但是由于聚类中心的选取对聚类结果有影响,导致聚类不稳定,因此采用一种基于聚类中心的改进算法分析文本,通过实验,验证算法的有效性。  相似文献   

20.
聚类算法是数据挖掘中用来发现数据分布和隐含模式的一项重要技术。通过分析研究数据仓库及数据挖掘中聚类算法的现状,对数据挖掘中常见的几种聚类算法的性能进行相互比较,并分析它们各自的优缺点,对数据挖掘中聚类算法的发展趋势作出展望。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号