共查询到20条相似文献,搜索用时 375 毫秒
1.
模糊聚类分析在数据挖掘中的应用 总被引:2,自引:0,他引:2
聚类分析是数据挖掘的主要方法之一,而且能够作为一个独立的工具获得数据的分布状况,集中对特定的聚簇集合作进一步的分析。介绍了数据挖掘过程中常见的数据聚类算法,讨论了聚类分析最新的研究方向——模糊聚类方法。 相似文献
2.
陈冬华 《四川教育学院学报》2014,(1):122-124
流数据是近年来关注比较多的一种数据形式,但由于它自身的特点,无法使用传统的算法对它进行聚类分析.数据挖掘是从大规模数据库中提取感兴趣的信息.聚类是数据挖掘的重要工具,它根据数据间的相似性将数据库分成多个类,每类中数据要求尽可能相似.针对流数据的特点,引入一种采用渔夫捕鱼策略的新的聚类算法.该算法采用动态多点随机投鱼网方法,并且根据捕鱼环境的不同采用不同的探测策略.流数据聚类的捕鱼算法是一种即时更新模型的在线聚类算法. 相似文献
3.
4.
针对Web挖掘,首先论述了Web挖掘的基本理论,接着分析数据挖掘中的聚类算法,讨论了聚类分析的数据结构和数据类型,以及聚类算法的分类,详细介绍了数据挖掘中用到的主要聚类算法,最后对评价聚类结果的方法进行了分析。 相似文献
5.
K-means算法是聚类分析划分方法中的一种常用方法,也是目前在数据分析方法中最有应用前景的方法之一。但K mean算法对初始聚类中心十分敏感,这对处理学生成绩等数据而言,会导致聚类结果极为不稳定。为此,提出基于改进遗传算法的K means聚类算法。该算法利用遗传算法解决初始聚类中心,提高聚类结果的稳定性,但存在前期过早收敛和后期收敛过慢的缺点。将改进遗传K means聚类算法应用于高职高专的学生考试成绩分析中,可以很好地解决传统遗传聚类算法对聚类结果的不稳定性问题,并通过聚类结果对学生考试成绩进行分类评价,利用所获得的数据聚类结果指导教学,从而提高教学质量。 相似文献
6.
针对低维多流形非相似结构数据,提出一种基于变化率聚类的算法。首先观察数据,按结构对数据进行分类,然后在同构的数据点之间按变化率进行划分,最终实现数据聚类。实验结果证明,该算法能够有效对低维多流形非相似结构数据进行聚类分析,聚类效果明显优于LRR、SSC等传统算法,且时间复杂度较低,有较强的适用性。 相似文献
7.
K-means聚类算法研究 总被引:2,自引:0,他引:2
华婷婷 《黄山高等专科学校学报》2013,(5):17-19
聚类分析是模式识别中一个重要研究领域,是一种将数据划分或分组处理的重要手段和方法.K-means算法是聚类算法中主要算法之一,文章介绍了K-means聚类算法的实现方法,并对其优点和缺点进行了详细的分析. 相似文献
8.
9.
在生物学研究中,需要对基因进行分类,以获得对种群固有结构的认识,有效鉴别基因表示数据的模式是研究DNA序列的重要基础。在已有最大树聚类理论基础上,引入模糊聚类思想,提出了最大树基因聚类算法,同时将该方法用于基因的聚类分析,实验结果表明它们是有效可行的。 相似文献
10.
李玉梅 《天津职业院校联合学报》2011,13(2):78-81
论文提出了一种基于蚁群动态模糊聚类算法的计算机图像分割方法,有效地利用蚁群算法的聚类分析能力,克服了FCM算法对初始化的敏感,动态地确定了聚类数目和中心。然后利用蚁群聚类算法得到的模型进行修改,再进行模糊聚类弥补蚁群算法的不足。最后将该算法应用到计算机图像分割技术。对比实验表明,该算法实验表明该算法速度快、划分特性好,可以准确地分割出目标。 相似文献
11.
辛晚霞 《商丘师范学院学报》2014,(6):7-11
k'-means是对k-means算法的一种改进,它引入了竞争惩罚学习机制,可以在无监督的情况下确定聚类数目.本文提出了两种新的基于频率敏感差异度量的k'-means算法,新算法利用竞争惩罚学习机制确定聚类数目.针对一组合成数据进行对比实验,结果表明新的k'-means算法可以成功地对数据集进行分类.最后,本文将新算法应用于图像分割. 相似文献
12.
数据挖掘中聚类分析算法研究 总被引:4,自引:0,他引:4
聚类分析是数据挖掘的一个主要研究方向,目前其研究已深入到数据库、数据挖掘、统计等领域并取得了很大的成就.本文介绍了聚类分析的应用及数据挖掘对聚类算法的典型要求,并对现有的传统聚类算法进行了分析与评估.最后介绍了聚类分析最新的研究方向——流数据聚类分析. 相似文献
13.
随着大数据时代的到来,聚类分析算法将面临如数据量巨大、数据维数增加等挑战,分布式处理是解决这类问题的方法之一.本研究将ROCK算法与Hadoop平台相结合,按照分布式处理原则,通过计算机集群模式去处理大规模的多样性数据.实验证明,在Hadoop平台下的ROCK聚类算法很大程度上提升了对高维数据进行聚类的能力. 相似文献
14.
对于已经分类的数据和大量未分类数据,在运算过程中,采用一种新的半监督聚类算法为支持向量机提供新的训练数据.随后,利用支持向量机判别出所有数据的类别属性,并选取最可靠的点加入已分类集合.为了验证算法的效率,收集了67张黄瓜叶片色调的数字信息,并对具有6个已分类数据与61个未分类数据的数据集进行半监督聚类分析,以判断这些叶片的健康程度.结果表明,该聚类算法优于其他算法. 相似文献
15.
为了适应大数据时代,新课标初中阶段增加了“数据分类”内容.数据分类有两种类型,一种是体现判别思想的数据分类,一种是体现聚类思想的数据分类,新课标初中阶段的“数据分类”体现了聚类思想.结合聚类分析的定义、特点等讨论得出,新课标初中阶段的“数据分类”是聚类分析中的最优分割法的一种特殊、简化形式,能够满足为初中生提供入门级的“聚类”学习的基本需求. 相似文献
16.
17.
为提高大数据集粗分类识别率,提出一种基于聚类分析的SVM-Kd-tree树型粗分类方法。首先根据数据集特征分布进行k-means两簇聚类,对聚类后的数据集进行类别分析,同时将属于两簇的同一类别样本划分出来;然后使用两簇中剩余样本训练SVM二分类器并作为树型结构根节点,将两簇数据分别合并,将划分出来的样本作为左右子孩子迭代构建子节点,直到满足终止条件后,叶子节点开始训练Kd-tree。实验结果表明,迭代构建树型粗分类方法使训练单一SVM平均时间减少了61.977 4%,比Kd-tree同近邻数量的准确率提高了0.03%。在进行大规模数据集粗分类时,使用聚类分析迭代构建组合分类器时间更短、准确率更高。 相似文献
18.
提出了一种新的多数据流聚类算法.该算法可以有效地对有相似行为但存在一定时间延迟的多数据流进行聚类.算法采用自回归模型技术度量数据流间的延迟相关,利用频谱估计来抽取数据流的特征.每一个数据流用其谱分量的和来表示,从而来计算每对数据流间的相关关系.每个谱分量用振幅、相位、衰减率、频率4个参数来描述.算法计算谱分量对之间的ε-延时相关关系,并以此为基础来得到聚类分析中数据流间距离的度量.此外,算法采用滑动窗口技术对多数据流进行聚类,实时地得出聚类结果且动态地调节聚类的个数.在人工数据集和实际数据集上的实验结果表明,所提出的算法比其他类似的算法具有更快的速度和更好的聚类效果. 相似文献
19.
随着航空事业的发展,对航迹进行聚类分析,存在许多应用价值。在分析历史飞行航迹特征的基础上,将航迹看作时间序列,采用近邻传播聚类算法,对航迹进行聚类分析,得到聚类结果并进行优化分析。近邻传播算法(AP)是建立在相似度矩阵基础上进行的聚类,为了得到相似度矩阵,结合航迹不等长的特征,选择使用DTW距离作为航迹间相似性的度量;同时,使用DCT对航迹时序列进行降噪,以求得到更好的聚类效果。实验结果表明:该方法在393条航迹的数据集中,划分出11个聚类,提高了航迹聚类的准确性。 相似文献