期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

赵明明张桂芸潘冬宁王蕊《教育技术导刊》2018,17(4):64-66

随着如今数据量的爆发式增长,传统的数据挖掘方法已经远远不能满足人们需求,K-means聚类作为一种经典的聚类算法,其应用领域很广。但是K-means算法在随机选取初始聚类K个中心时,容易使聚类结果不稳定,因此提出基于核函数的K-means聚类算法。与此同时,结合MapReduce分布式框架对改进后的K-means聚类算法作分布式计算。研究结果表明,基于高斯核函数的K-means聚类在分布式下的计算能够加速K-means聚类过程,且结果优于单独基于核密度估计的K-means算法。 相似文献

2.

一种改进的基于粒子群的离线聚类算法

张英武《鞍山师范学院学报》2013,(4):46-49

为了解决K-means算法中对于初值的敏感,提出了一种基于粒子群的改进的K-means聚类算法(IPSOFCM).在K-means算法中引入粒子群算法,可有效提高算法的全局搜索能力,有助于粒子更容易跳出局部束缚.实验结果证明,IPSOFCM算法聚类准确度高,稳定性好. 相似文献

3.

基于K-means均值算法的学生成绩分析——以福州外语外贸学院信息管理与信息系统专业为例

叶福兰《贵阳学院学报(自然科学版)》2017,12(3)

文章应用数据挖掘的K-means均值算法对学生成绩进行分析.首先介绍了几种主要的聚类分析算法;接着介绍了K-means聚类算法以及其相似性度量方法;最后,结合实例通过实验详细介绍了K-means 聚类算法在学生成绩分析中的应用.通过聚类分析,挖掘学生成绩的内在价值,从而为管理者及教师提供有效的决策支持,提高教学质量. 相似文献

4.

数种基于SPSS统计工具的聚类算法效率对比

吕正萍纪汉霖《教育技术导刊》2018,17(11):81-85

利用统计分析软件SPSS对99组实例数据进行聚类分析,包括K-means聚类、系统聚类、两步聚类三大类,其中K-means聚类包括K-means未标准化聚类和K-means标准化聚类两小类,选取判断类内紧致性指标1和类间分离性指标2综合衡量聚类结果有效性,从而比较聚类数种算法中三大聚类方法的聚类效果。实验发现,K-means聚类有效性普遍比系统聚类好,系统聚类普遍比两步聚类有效,且系统聚类分析效果随着聚类个数的增加不断改善。相似文献

5.

基于点概率的K-means算法的改进

《柳州师专学报》2015,(6):108-110

K-means算法是一种基于划分的方法,该算法对初始聚类中心的选取依赖性极大,初始中心值的不同导致聚类效果不稳定.为此,本文利用几何概率的思想,认为每个数据点都是等概率的存在于数据集,通过计算每个数据点的点概率值,结合距离因素,选择K个点作为初始聚类中心.实验证明,改进后的K-means算法聚类效果更好. 相似文献

6.

基于直方图的K-means聚类中心自动检测方法

江健生朱会萍《廊坊师范学院学报(自然科学版)》2013,13(2)

K-means聚类算法常用在图像分割中,聚类中心多采用随机选取,以彩色图像为研究对象,提出在彩色图像RGB三个分量灰度直方图中分别检测峰值,经三者排列后形成自动聚类中心的方法.实验结果表明:该方法简单、快速,检测出的峰值准确,形成的K-means聚类中心较为合理. 相似文献

7.

最小局部方差优化初始聚类中心的 K-means 算法

王世其张文斌蔡潮森李建军《教育技术导刊》2020,19(6):196-200

针对传统 K-means 算法随机选取初始聚类中心导致聚类结果随机性大、优劣不定的缺点,通过定义局部方差,利用方差反映数据密集程度的特性,提出一种基于最小局部方差优化初始聚类中心的 K-means 算法。该算法选取数据集中局部方差最小的点作为一个初始聚类中心,并利用数据信息更新数据集,直到选到 k个初始聚类中心,实现初始聚类中心优化。基于 UCI 数据集与人工数据集进行实验,与传统 K-means 算法及最小方差优化初始聚类中心的 K-means 算法进行性能比较。实验结果表明,基于最小局部方差优化初始聚类中心的 K-means算法具有良好的聚类效果和很好的鲁棒性,且聚类时间较短,验证了算法有效性和优越性。相似文献

8.

传统的K-means聚类算法的研究与改进

张红荣张峰《咸阳师范学院学报》2010,25(4)

K-means算法是解决聚类问题的经典算法,在满足一定的条件情况下,聚类的结果比较好.但这种算法对初始聚类中心敏感,聚类结果随不同的初始输入而波动.针对这种缺陷,提出了一种新的基于数据样本分布选取初始聚类中心的算法. 相似文献

9.

一种改进的K-means算法

韩春燕《内江师范学院学报》2009,24(8):27-30

传统的K—means算法对初始聚类中心敏感,聚类的结果随不同的初始输入而波动．为了消除这种敏感性,提出了一种改进的K-means算法,改善聚类算法中选取初值的依赖性,提高聚类结果的稳定性．仿真实验结果表明：改进后的K-means算法优于原始算法．相似文献

10.

基于 Spark 的均值漂移算法在网络舆情聚类中的应用

张京坤王怡怡《教育技术导刊》2009,19(9):190-195

为改善网络舆情态势感知与预警中舆情信息分析不准确的问题,提出基于 Spark 技术的均值漂移（MS）算法,利用该算法原理分析 Spark 框架特性,给出该算法在 Spark 框架中的实现过程,包括舆情信息预处理、特征提取、特征向量模型构建和算法聚类设计。在相同数据集下将 MS 算法和 K-means 算法聚类效果进行对比,实验结果显示,K-means 算法聚类结果受 k 值选取的影响,存在聚类结果不准确的问题;基于 Spark 的 MeanShift 算法在没有任何先验条件下舆情聚类效果优于 K-means 聚类算法,且符合预期期望。相似文献

11.

基于层次的模糊K均值聚类算法研究 总被引：1，自引：0，他引：1

苏瑞《安阳师范学院学报》2010,(2):47-50

通过对K均值聚类算法的研究,本文提出了一种基于层次聚类与模糊聚类思想的K均值聚类算法。算法首先使用层次方法对数据进行初始聚类,然后用得到的聚类数作为模糊K均值聚类中的K值,对聚类进行修正。最后通过实验,验证了该算法不需要人为假设聚类算法中的K值,而且引入了模糊隶属关系使类别的划分更接近于事实,从而证明了该算法的有效性。相似文献

12.

一个K-均值文档聚类的改进算法

吴景岚刘燕朱文兴《闽江学院学报》2004,25(2):48-52

k均值算法是一个常用的局部搜索算法，它的主要缺陷是容易陷入局部极小，并且该局部极小解与全局最优解往往有很大的偏差。本文提出一个基于K-均值的迭代局部搜索文档聚类算法。该算法以k均值算法所得到的解作为初始解，从该初始解开始作局部搜索。在搜索过程中接受部分劣解。当解无法改进时，算法对所得到的局部极小解做适当强度的扰动后进行下一次的迭代，以跳出局部极小，从而拓展了搜索的范围。实验结果表明该算法对文档数据集聚类的正确性迭99％以上。相似文献

13.

一种K-means算法的k值优化方案 总被引：1，自引：0，他引：1

吴艳文胡学钢《巢湖学院学报》2007,9(6):21-24

聚类算法是数据挖掘中核心技术之一,而k-means算法在经典聚类算法中占有重要地位。针对k-means聚类算法的最佳聚类个数k不易获得,因而使得该聚类算法的应用受到限制,为此提出一种k值优化方法:通过给出大于最佳聚类数的可能聚类数,而得到优化的聚类个数。通过实例给予验证,其结果说明该方法合理有效。相似文献

14.

改进蚁群算法的动态K-均值聚类分析

匡青鲍梦《教育技术导刊》2008,(1)

提出了一种基于改进蚁群算法的动态K-均值聚类算法思想,该算法首先利用蚁群算法的较强处理局部极值的能力,动态地确定了聚类数目和中心,然后利用蚁群聚类得到的结果,再进行K-均值聚类弥补蚁群算法的不足。两者有机结合起来可以寻求到具有全局分布特性的最优聚类,实现了基于改进的蚁群聚类算法分析。相似文献

15.

用于客户分类的K-means算法

陈琍《钦州学院学报》2006,21(6):36-37,41

从数据挖掘方法中常用的聚类算法的基本原理，将聚类算法中的K—means算法用于客户关系管理系统中，实现客户分类．并且对K—means算法进行了改进，根据客户信用特征对客户进行预分类，提高了算法的效率．相似文献

16.

改进蚁群算法的动态K-均值聚类分析

郭斐斐《教育技术导刊》2007,(7)

提出了一种基于改进蚁群算法的动态K-均值聚类算法思想。该算法首先利用蚁群算法较强处理局部极值的能力,动态地确定了聚类数目和中心,然后利用蚁群聚类得到的结果,进行K-均值聚类弥补蚁群算法的不足。两者的有机结合可以寻求到具有全局分布特性的最优聚类,实现基于改进的蚁群聚类算法分析。相似文献