首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
数据流聚类算法研究   总被引:1,自引:0,他引:1  
数据流是一类新的数据时象,流挖掘是数据库领域的研究热点,有很大的应用前景,本文首先综述了传统聚类算法的分类及其各自特点,并对它们进行了分析评价.然后结合流聚类分析的要求,对目前最新的几个数据流聚类研究成果进行了分析。并对数据流聚类进一步的研究方向进行了讨论.  相似文献   

2.
为了优化BP人工神经网络在大规模样本聚类中的准确度,基于改进人工神经网络数据聚类方法,使用粒子群算法与遗传算法对BP人工神经网络的初始权值与阈值实施优化,将神经网络分类误差作为粒子群的适应度,利用遗传算法更新粒子速度与位置信息,获得最优粒子位置最优解,优化后的粒子群对BP神经网络初始权值与阈值寻优。实验结果显示,改进的BP神经网络训练误差与测试误差较为接近,表明网络模型的聚类性能较为精准、稳定。  相似文献   

3.
首先比较了数据流聚类分析与传统的聚类分析方法的一些不同点,对目前最新的一些数据流聚类研究成果进行了分析,最后对数据流聚类发展方向进行了展望。  相似文献   

4.
针对数据流的特点,提出了一种新的网格密度结合的GCTS算法.它采用了双层架构,在线层实现了网格密度参数的自设定,离线层以网格单元的重心为中心点,建立一个最大的子网格,使候选网格中的局部密集区域转化成了密集网格.最后使用最小生成树的算法生成进行聚类结果.提高了聚类效果.  相似文献   

5.
在动态数据流挖掘过程中,对数据流进行聚类,把未知的数据流划分或者生成到一个簇中。发现隐含的知识、价值和模式,是一种非常有效的数据流挖掘技术。分析和研究了数据流挖掘的聚类算法,并对数据流聚类技术发展进行了展望,提出了数据流挖掘的研究方向。  相似文献   

6.
聚类算法一直备受研究者青睐。随着信息技术和数据技术的发展,数据的种类和数量急剧增长,云计算平台Hadoop成为这些数据存储和处理的新平台,基于云计算平台Hadoop的聚类算法逐渐成为热门。针对数据挖掘中的聚类问题,依托云计算模式及Hadoop平台,研究了K-means算法,有效改变了现有算法的局限性。  相似文献   

7.
数据流聚类和传统的聚类有很大不同,本文首先介绍了数据流的定义和窗口模型的分类,然后比较了几种具有代表性的数据流聚类算法,最后展望了数据流聚类的发展.  相似文献   

8.
提出一种基于数据流聚类的出租车载客点实时推荐算法,该算法通过对当前一段时间内的载客发生位置,采用数据流聚类方法获取各簇的概要结构以准确地捕获当前载客位置的分布情况,并通过簇的概要结构计算簇心作为载客点进行推荐,不同于传统的推荐算法只对历史数据进行挖掘。实验表明,该实时推荐算法具有较高的精确度。  相似文献   

9.
为了降低偶然因素的影响,提出了一种基于改进预测强度的大数据K 均值聚类方法,其基本思想是:首先将数据集若干等分,每一等分轮流作为测试集,取其平均预测强度,然后根据预测强度确定聚类数和聚类变量,再用K 均值聚类方法对数据集进行聚类。用上述方法研究了访客在某网站各栏目的平均停留时间,结果表明,基于预测强度的聚类方法较常规聚类方法更适宜于大数据的聚类分析。  相似文献   

10.
沈泓  刘顺 《教育技术导刊》2017,16(3):103-107
阐述了如何使用数据分析模型进行数据收集分析和处理,以及如何通过K-means聚类算法及线性回归模型建立合理预估模型。电能在从发电厂传输到用户的过程中,在输电、变电、配电以及营销管理的各环节中会产生电能损耗,如果线路损耗较高,则会对电网运行的安全性与经济性造成直接影响,同时也会加快线路老化或损坏速度。合理分析预估模型,可以找出差异性较大的台区着重进行管理与监测,并于用户操作区的Web端进行展示,进而有效预测出哪些台区可能存在偷窃电行为或其它影响正常供电的不合理行为,为供电工作提供有效辅助。  相似文献   

11.
针对功能磁共振成像(functional Magnetic Resonance Imaging,f MRI)数据的特点,在聚类fMRI数据时,两个体素之间的距离通常并非是一种简单的空间距离,而是和它们之间的相关程度有关的距离测度.在双曲相关系数(Hyperbolic Correlation Coefficient,HCC)距离度量基础上发展了一种新的距离测度,并提出了改进模糊聚类算法的定义、算法评价标准和算法参数的优化方法,然后将改进后的模糊聚类算法分别在任务态和静息态f MRI数据上与基于HCC距离度量的模糊聚类算法进行比较,最后通过比较结果证明改进后的模糊聚类算法具有较好的聚类效果和收敛速度.  相似文献   

12.
基于向量空间模型的文档聚类算法研究   总被引:3,自引:0,他引:3  
随着网络信息的迅速增长,文档聚类技术成为了人们研究的热点课题.探讨了几种基于向量空间模型的文档聚类算法,如常见的k—means算法和凝聚层次算法,针对它们的不足提出了改进的BK-means算法和多层CFK-means算法.最后,根据一定的评价标准,得出Bk—means算法是文档聚类算法中较好的算法.  相似文献   

13.
提出一种新颖的基于谱聚类的音频聚类算法,首先对音频数据进行预处理,得到三维音频向量,然后根据向量之间的距离计算音频相似度,最后设计谱聚类算法获得音频数据聚类结果。在网易云音乐数据上的对比实验表明,与K means算法和快速查找密度峰值聚类算法相比,该算法获得的聚类结果更加优越。  相似文献   

14.
为了提高并行遗传算法在大数据聚类问题中的时间效率,通过利用粗粒度遗传算法的并行化思想,提出了Hadoop平台上基于MapReduce计算框架的粗粒度遗传算法的并行化设计。该思想主要来源于大数据体量庞大的特点,聚类算法时间消耗巨大。并行是解决算力不足的一个较为有效的方法,实验结果表明,并行化的遗传算法在处理大数据聚类时相比传统的串行化处理在时间消耗方面有明显的降低。  相似文献   

15.
针对网络学习者及其对案例访问的模糊性提出采用模糊聚类的方法对学习者和案例进行聚类分析。在算法中,以各学习者对案例的访问次数、时间、学习效率等刻画学习者对案例的关注程度建立模糊相似矩阵,再由平方法求出模糊等价矩阵,然后进行聚类分析。通过具体实例阐述算法的计算过程,证明算法实现的可行性和有效性。  相似文献   

16.
侯贺  马林  郑伟 《教育技术导刊》2017,16(1):117-119
梳理了微课的网络评价、大赛评价、技术评价方法。结合这3种方法优点,在大数据背景下,提出了一种基于网络行为的多评价主体、多评价内容的微课评价模型,实现了数据化客观评价。  相似文献   

17.
文章以研究生生源质量为切入点,从基础知识结构、学习与科研能力、创新素质与能力、身心素质等四个方面构建研究生招生质量评价指标体系和基于灰色聚类的研究生招生质量评价模型,结合数据进行实证研究,验证灰色聚类评价模型在研究生招生质量评价中的科学性和实效性,为研究生招生工作提供科学依据。  相似文献   

18.
为解决传统K-means算法在处理海量数据时存在的不足,提出了1种适用于并行Canopy-Kmeans算法的迭代式MapReduce模型。通过Canopy算法对数据进行初始聚类,得到初始聚类中心,并按照初始聚类将数据存储于Mapper节点,减少Mapper和Reducer节点之间通信线路,减小运算量;在Mapper节点和Reducer节点之间建立互通信,将聚类中心作为迭代流通信息,减少信息流量;最终通过1次运算过程输出最终聚类结果。实验结果证明,改进的算法在时间、正确率和加速比性能方面,均优于传统的串行K-means算法,并在基于传统MapReduce模型的K-means算法基础上有所提高。  相似文献   

19.
A novel model of fuzzy clustering using kernel methods is proposed. This model is called kernel modified possibilisticc-means (KMPCM) model. The proposed model is an extension of the modified possibilistic c-means (MPCM) algorithm byusing kernel methods. Different from MPCM and fuzzy c-means (FCM) model which are based on Euclidean distance, theproposed model is based on kernel-induced distance. Furthermore, with kernel methods the input data can be mappedimplicitly into a high-dimensional feature space where the nonlinear pattern now appears linear. It is unnecessary to docalculation in the high-dimensional feature space because the kernel function can do it. Numerical experiments show thatKMPCM outperforms FCM and MPCM.  相似文献   

20.
吴卉男 《考试周刊》2010,(38):146-148
本文提出了一种基于数据挖掘方法的入侵检测模型,通过数据挖掘的聚类算法,提高入侵检测的时效性与准确性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号