首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 156 毫秒
1.
聚类分析是数据挖掘中的一个重要研究领域,是一种数据划分或分组处理的重要手段和方法。聚类无论在商务领域,还是在生物学、Web文档分类、图像处理等其他领域都得到了有效的应用。本文主要研究的是基于迭代思想的聚类算法。  相似文献   

2.
提出一种新的层次聚类方法,着重分析了该算法的思想体系及算法实现过程。该算法具有使结果簇更紧凑和独立的效果,具有更高的效率。  相似文献   

3.
层次聚类算法是一类重要的聚类分析方法。传统的层次聚类算法的时间为O(n2)空间复杂度很大,这使得聚类分析在大型数据集上的应用受到限制。该文提出一种基于分治递推改进算法,该算法将大大减少算法的时间复杂度和空间复杂度。  相似文献   

4.
基于K-means聚类算法的网络个性化学习行为研究   总被引:1,自引:0,他引:1  
聚类是指按照事物间的相似性对事物进行区分和分类的过程。对网络个性化学习行为中的大量数据,首先对样本数据进行了预处理,然后运用数据挖掘算法中的K-means算法进行分类,获取各类与网络学习行为属性的关系。在Clementine中的实验结果表明,该算法能够将数据准确聚类,为教师教学培养目标的制定提供一定的决策支持。  相似文献   

5.
基于层次的模糊K均值聚类算法研究   总被引:1,自引:0,他引:1  
通过对K均值聚类算法的研究,本文提出了一种基于层次聚类与模糊聚类思想的K均值聚类算法。算法首先使用层次方法对数据进行初始聚类,然后用得到的聚类数作为模糊K均值聚类中的K值,对聚类进行修正。最后通过实验,验证了该算法不需要人为假设聚类算法中的K值,而且引入了模糊隶属关系使类别的划分更接近于事实,从而证明了该算法的有效性。  相似文献   

6.
为解决传统K-means算法在处理海量数据时存在的不足,提出了1种适用于并行Canopy-Kmeans算法的迭代式MapReduce模型。通过Canopy算法对数据进行初始聚类,得到初始聚类中心,并按照初始聚类将数据存储于Mapper节点,减少Mapper和Reducer节点之间通信线路,减小运算量;在Mapper节点和Reducer节点之间建立互通信,将聚类中心作为迭代流通信息,减少信息流量;最终通过1次运算过程输出最终聚类结果。实验结果证明,改进的算法在时间、正确率和加速比性能方面,均优于传统的串行K-means算法,并在基于传统MapReduce模型的K-means算法基础上有所提高。  相似文献   

7.
K-means聚类算法研究   总被引:2,自引:0,他引:2  
聚类分析是模式识别中一个重要研究领域,是一种将数据划分或分组处理的重要手段和方法.K-means算法是聚类算法中主要算法之一,文章介绍了K-means聚类算法的实现方法,并对其优点和缺点进行了详细的分析.  相似文献   

8.
聚类分析在涉及多维数据分析或处理的学科中都是很普遍的。由于计算机视觉领域中的图像分割经常表示成一个聚类问题,所以聚类方法在模式识别、图像处理、信息检索中的应用越来越受关注。结合采样技术、分块技术及数据压缩技术,研究了层次聚类算法在图像处理中的应用。  相似文献   

9.
随着计算机技术的迅猛发展以及网络技术的普及,人们有更多机会通过网络与外界进行信息交流。然而,随着数据大量的涌入,增加了我们获取有用信息的难度,数据挖掘正是在这一背景下诞生的。聚类分析是数据挖掘中的一种重要技术,是分析数据并从中发现有用信息的一种有效手段。本文主要研究的是基于宽度优先搜索的聚类分析算法。  相似文献   

10.
数据流聚类算法研究   总被引:1,自引:0,他引:1  
数据流是一类新的数据时象,流挖掘是数据库领域的研究热点,有很大的应用前景,本文首先综述了传统聚类算法的分类及其各自特点,并对它们进行了分析评价.然后结合流聚类分析的要求,对目前最新的几个数据流聚类研究成果进行了分析。并对数据流聚类进一步的研究方向进行了讨论.  相似文献   

11.
在动态数据流挖掘过程中,对数据流进行聚类,把未知的数据流划分或者生成到一个簇中。发现隐含的知识、价值和模式,是一种非常有效的数据流挖掘技术。分析和研究了数据流挖掘的聚类算法,并对数据流聚类技术发展进行了展望,提出了数据流挖掘的研究方向。  相似文献   

12.
流数据是近年来关注比较多的一种数据形式,但由于它自身的特点,无法使用传统的算法对它进行聚类分析.数据挖掘是从大规模数据库中提取感兴趣的信息.聚类是数据挖掘的重要工具,它根据数据间的相似性将数据库分成多个类,每类中数据要求尽可能相似.针对流数据的特点,引入一种采用渔夫捕鱼策略的新的聚类算法.该算法采用动态多点随机投鱼网方法,并且根据捕鱼环境的不同采用不同的探测策略.流数据聚类的捕鱼算法是一种即时更新模型的在线聚类算法.  相似文献   

13.
在现有蚁群算法的基础上,加入公式改进、半径递增、短期记忆、空间分割等策略,同时采用一种距离测度函数将数值特征与类属特征相结合,实现了混合属性数据的聚类.仿真实验表明,新算法能加快聚类速度,得到较好的聚类结果。  相似文献   

14.
聚类算法是数据挖掘中用来发现数据分布和隐含模式的一项重要技术。通过分析研究数据仓库及数据挖掘中聚类算法的现状,对数据挖掘中常见的几种聚类算法的性能进行相互比较,并分析它们各自的优缺点,对数据挖掘中聚类算法的发展趋势作出展望。  相似文献   

15.
近年来,数据挖掘技术的研究备受国内外关注,其主要原因是信息技术发展产生了大量分散的数据,迫切需要将这些数据转换成有用的信息和知识.此前的研究,主要集中于分类算法及应用方面的研究,但某些特殊领域,如生物信息学研究等,需要通过聚类方法解决一些实际问题.本文从横向深入分析了数据挖掘技术中聚类算法的发展,对层次法、划分法、模糊法,以及量子聚类、核聚类,基于密度和网格等10种聚类算法的原理、过程和特点等都进行了比较详细的分析论述.  相似文献   

16.
本文对入侵技术和聚类算法进行分析,明确相关技术在实践中存在的问题,在此基础上对变异因子进行分析,通过相关程序的计算,保证计算结果的准确性。然后把蚁群算法相关问题作为研究点,对蚁群算法的改进技术进行系统的探究。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号