首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 62 毫秒
1.
在现代社会发展的过程中,信息技术已经成为必不可少的重要手段之一,广泛应用在生产与生活的各个方面,本文主要探讨了聚类算法在数据挖掘中的应用。聚类算法的具体种类也有很多,一些已经相对成熟,另外一些仍然在研究的阶段,所以本文主要研究了相对成熟的聚类算法,这一算法在数据挖掘中具有重要的作用,相信在今后的发展中还能够得到进一步的优化,以此应用在更加广阔的发展空间中。  相似文献   

2.
数据挖掘中聚类算法研究综述   总被引:1,自引:0,他引:1  
聚类分析是数据挖掘领域一个活跃的研究分支,在数据挖掘中已经开发出许多聚类算法,具体可分为划分方法、层次方法、基于密度方法、基于网格的方法、基于模型的方法。本文对上述几类聚类分析算法进行了讨论,对每种聚类算法都举出了典型例子,并作了分析,指出了各种算法的优缺点并对聚类技术未来的发展作出了展望。  相似文献   

3.
较为系统的综述了当前空间聚类算法的相关研究。依据这些算法的特点,将它们归纳为两类:划分聚类算法、层次聚类算法。针对划分聚类算法,重点分析了PAM、CLARA和CLARANS算法。针对层次聚类算法,重点分析了BIRCH、CURE算法。比较了这些算法的复杂度,并介绍了相关应用。  相似文献   

4.
模糊聚类的最优化算法   总被引:1,自引:0,他引:1  
傅国耀 《科技通报》1996,12(1):1-3,9
求与一个模糊相似矩阵“距离”最近的模糊等价矩阵,至今已提出了两个求局部最优解的算法和一些启发式算法,本文也提出一个简便可行的求局部最优解的算法,这算法与线性规划的单纯形算法一样,也是在有限个“顶点”上寻优。  相似文献   

5.
《科技风》2015,(23)
模糊诊断是器械探伤常用的方法之一,是根据机器故障特征参数通过模糊推理来诊断器械是否有缺陷或是什么类别的缺陷。在声发射信号(AE)的识别研究中,针对突发型声发射信号属于非平稳的随机信号,由于小波分析具有良好的局部分析能力,本文首先提出应用MATLAB中小波分析工具对信号进行连续小波变换和去噪处理。随后结合储罐罐底声发射信号的发生机理和传播的复杂性,以及分离出不同AE源的必要性,提出使用模糊C均值聚类(FCM)算法,以期区分出不同AE源的信号,并经实验验证。  相似文献   

6.
郭文娟 《科技风》2022,(4):63-65
针对传统的K-means算法运行的结果依赖于初始的聚类数目和聚类中心,本文提出了一种基于优化初始聚类中心的K-means算法。该算法通过量化样本间距离和聚类的紧密性来确定聚类数目K值;根据数据集的分布特征来选取相距较远的数据作为初始聚类中心,避免了传统K-means算法的聚类数目和聚类中心的随机选取。UCI机器学习数据库数据集的实验证明,本文所提出的改进的聚类算法获得了良好的聚类效果,同时获得较高的聚类准确率。  相似文献   

7.
数据挖掘中SOM神经网络的聚类方法研究   总被引:5,自引:0,他引:5  
在数据挖掘领域里,SOM神经网络聚类是典型的基于模型思想的聚类方法.本文阐述了SOM神经网络的工作过程、算法的训练过程及应用.通过对我国各地区GDP数据进行聚类分析,可以及时了解各地区经济实力等重要的信息,对各级政府政策制定及宏观调控都具有非常重要的现实意义.  相似文献   

8.
本文提出了一种能够同时考虑关键词和发生时间的新型算法。该算法首先对数据预处理后,建立微博事件集合的LDA模型,生成主题词集合作为事件的描述标志,通过DTW算法对事件关键词间的语义、时序相似度进行计算,得到对应的相似度矩阵,最后采用协同训练普聚类方法,迭代生成最终的特征向量并完成事件选取。仿真实验结果表明,本文提出的算法同以往算法相比具有准确率高以及效率高的特点。  相似文献   

9.
李雷 《科技风》2013,(6):120
针对FCM算法主要应用于点数据聚类,不能直接处理关系型数据的缺点。本文提出了一种基于Web日志的数据挖掘聚类算法,首先对FCM算法进行改进使其能够处理关系型数据,并对算法进行了健壮性改进。然后针对传统FCM算法需要在没有先验知识的基础上,事先确定聚类类别数的缺点,引入了竞争凝聚算法(CA),与FCM算法相结合,形成了CA-FCM算法,使之能够自动确定最佳分类类别数。实验表明,CA-FCM算法的挖掘结果与FCM算法的结果相近,在用户访问会话数量不太大时性能优于FCM算法。  相似文献   

10.
针对客户行为的不确定性和模糊性,将模糊聚类集成技术应用于CRM中的客户细分研究,以提高客户聚类的精度.以模糊C均值(FCM)算法作为基本的聚类器,应用模糊t-范式对生成的多个聚类器进行集成,从而获得最终的客户聚类结果.最后,在1O个UCI数据集上进行聚类测试,结果表明,基于模糊t-范式的模糊聚类集成方法的聚类精度要高于常用的客户聚类FCM和K-means方法.在客户信用卡数据集Australian上的学习曲线还表明,聚类集成方法具有更稳定的聚类性能.  相似文献   

11.
在对最佳任务调度下的Web数据进行优化聚类的过程中,容易出现原始数据损失的情况,导致传统数据优化聚类算法,由于忽略初始数据,无法有效实现Web数据优化聚类。提出一种基于粒子群优化的最佳任务调度下Web数据优化聚类算法,依据任务价值密度以及执行紧迫性,塑造动态优先级,通过适应度函数对分类计划进行评价,给出类间距与类内距计算公式,对相关参数和各粒子的位置以及速度向量进行初始化操作;求出粒子的适应度;求出粒子个体最优与群最优;依据粒子群优化算法的位置以及速度对当前位置和速度进行更新;通过K-means算法对EHCF进行聚类,直至全部Web数据聚类完成。仿真实验结果表明,所提方法在Web数据优化聚类上具有很高的优越性。  相似文献   

12.
针对关联规则挖掘中存在的"尖锐边界问题",重点研究了模糊关联规则挖掘及遗传算法在入侵检测中的应用,在隶属度的计算中采用了折中的准则。实验结果表明该方法能有效区分正常状态和异常状态,提高入侵检测准确度。  相似文献   

13.
模糊C均值(FCM)算法广泛地应用于模式识别、图像分割等领域。根据FCM算法存在对初始解敏感且迭代过程中计算量大的问题,本文提出了一种改进的算法:先通过精简数据集,减少算法迭代的时间;再使用密度函数法得到FCM算法的初始聚类中心,以减少FCM算法收敛所需的迭代次数。实验结果表明,改进后的算法较好地解决了类中心的初值化问题,提高了算法的收敛速度和运行效率。  相似文献   

14.
15.
模糊聚类问题由于其非凸性而成为一个难以解决的数学问题。在解决模糊聚类问题时,会出现很多局部极小值和鞍点。因此,启发式的模糊C-均值算法是应用最为广泛的算法,其缺点是很容易陷入局部极小值。本文提出了一种搜索模糊聚类全局最优解的Tabu搜索算法,并比较这种新算法和模糊C-均值算法的性能。经过多次数据试验,证明Tabu搜索算法在搜索全局最优解时是很有效的。  相似文献   

16.
Web数据的访问一直是当前研究的热门话题。随着网络规模的扩大,海量Web数据访问受到了很大限制,高纬度的数据会大幅的打乱数据知识模式规则,数据可视化结构不能满足算法知识发展的要求,导致海量Web数据访问耗时。为此提出一种基于模糊核递归计算的海量Web数据访问优化算法。计算数据模糊核特征,利用隶属度函数表示模糊特征的归属,利用模糊核递归判别从这些海量数据中发现有用知识包括模式规则、可视化结构。实验表明,该方法能够较好地完成海量Web数据的优化方法,时间复杂度大幅降低。  相似文献   

17.
模糊支持向量机(FSVM)具有很好的抗噪声能力,受到了很多专家的重视。然而模糊支持向量机算法的时间复杂度通常较高。针对这一不足,本文提出了一种基于核聚类的模糊支持向量机算法。首先根据核聚类算法对每一类原始样本进行聚类,然后对每一簇求样本中心,用样本中心作为新的样本点替换该类别的原始样本。最后本文算法利用中心距离型计算新样本的模糊权重,并利用模糊支持向量机算法进行求解。实验充分验证了本文算法相对于传统模糊支持向量机方法具有更快的分类速度。  相似文献   

18.
针对现有直觉模糊集聚类方法存在计算量大、数据失真和易陷于局部最优等问题,提出基于新直觉模糊相似度量的直觉模糊谱聚类算法。首先定义了新的直觉模糊相似度量方法,然后基于该方法构造了直觉模糊相似度矩阵,根据直觉模糊相似度矩阵求解非规范Laplacian矩阵,在此基础上构建特征矩阵,再使用k-means算法对特征矩阵进行聚类。最后在数值算例上的应用证明了所提出算法的可行性和有效性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号