共查询到20条相似文献,搜索用时 15 毫秒
1.
2.
针对传统的K-means算法运行的结果依赖于初始的聚类数目和聚类中心,本文提出了一种基于优化初始聚类中心的K-means算法。该算法通过量化样本间距离和聚类的紧密性来确定聚类数目K值;根据数据集的分布特征来选取相距较远的数据作为初始聚类中心,避免了传统K-means算法的聚类数目和聚类中心的随机选取。UCI机器学习数据库数据集的实验证明,本文所提出的改进的聚类算法获得了良好的聚类效果,同时获得较高的聚类准确率。 相似文献
3.
采用传统算法进行混合型数据库查询,由于文档与查询的匹配过于严格,存在对检索词的重要程度无法区分的问题,造成无法进行检索结果的排序的缺陷。为此,提出了一种基于改进均值聚类算法的混合型数据库查询优化方法。建立混合型数据库查询执行计划代价模型,精准的定义了数据库查询执行代价。将改进均值聚类算法与粒子群算法有效的相融合,将粒子群中的粒子划分为多个子群,更新所有的粒子,通过粒子间的相互信息融汇,搜寻到数据库查询最优解。实验仿真证明,基于改进均值聚类算法的混合型数据库查询优化方法精确度高,效率高。 相似文献
4.
5.
数据挖掘是在海量的数据中寻找模式或规则的过程。数据挖掘强调的是发现知识,获得的知识类型包括关联规则、分类、回归、聚类、依赖模型等。本文对其中聚类分析技术进行了较为深入地研究与分析,提出基于信息素的蚁群聚类算法PCBP,利用信息素指导蚂蚁移动,用不同速度的蚂蚁来改善聚类质量,并在这个思想基础上提出层次化蚁群聚类方法。为人们研究聚类提供了新思路和新途径,因此本文的研究具有一定的理论和实践意义。 相似文献
6.
文章提出了一种基于人工免疫增量的聚类算法。该算法在人工免疫可更新聚类算法的基础上,结合蚁群增量聚类算法的思想,将原聚类得到的记忆抗体矩阵作为初始矩阵,调用人工免疫聚类算法处理增量数据,然后采用类解体机制处理类内误差超过规定阈值的聚类。 相似文献
7.
基于社会演化算法的聚类新算法 总被引:1,自引:0,他引:1
K均值聚类算法通常只能以局部最优结束,很难找到全局最优。提出了一种基于社会演化算法和K均值算法相结合的聚类新算法。在该算法中提出了认知主体在聚类中对范式学习的新的方式。实验证明该算法能大大提高聚类的效率和精度。 相似文献
8.
无导师聚类过程中将数据集合分割成几个类是一个很难确定的问题,目前还没有较好的解决方法。文章使用粒子群优化算法应用于无导师聚类算法——K-均值的参数学习,实现了使用粒子群优化算法进行聚类中心参数的确定,旨在提供一种选择中心参数个数的方法,同时给出了适应于聚类参数学习的粒子群fitness函数算法设计。通过对UCI机器学习数据库中的7个数据库进行实验,证实此方法是比较有效的。 相似文献
9.
10.
11.
12.
13.
传统方法直接设定聚类数量,得到的结果并非最优聚类数,且针对大规模电力数据,单一聚类方法无法同时达到聚类精度与效率两方面要求。为此,提出一种新的非线性季节型电力负荷曲线集成聚类算法。用DBI指标对聚类效果进行评价,将与DBI最小值相应的聚类数据作为最优聚类数量。通过模糊C均值聚类方法,依据原始非线性季节型电力数据对象间的相似程度,获取初始聚类中心。利用聚类性能更优、稳定性更高的层次聚类方法完成对聚类中心的组合,获取有效的集成聚类结果。实验结果表明,所提方法能够同时保证聚类精度与聚类效率,整体性能较强。 相似文献
14.
15.
16.
在对最佳任务调度下的Web数据进行优化聚类的过程中,容易出现原始数据损失的情况,导致传统数据优化聚类算法,由于忽略初始数据,无法有效实现Web数据优化聚类。提出一种基于粒子群优化的最佳任务调度下Web数据优化聚类算法,依据任务价值密度以及执行紧迫性,塑造动态优先级,通过适应度函数对分类计划进行评价,给出类间距与类内距计算公式,对相关参数和各粒子的位置以及速度向量进行初始化操作;求出粒子的适应度;求出粒子个体最优与群最优;依据粒子群优化算法的位置以及速度对当前位置和速度进行更新;通过K-means算法对EHCF进行聚类,直至全部Web数据聚类完成。仿真实验结果表明,所提方法在Web数据优化聚类上具有很高的优越性。 相似文献
17.
18.
19.
依据文化算法框架对文化算法的种群空间、信仰空间以及这两个空间的通信协议进行研究,分析各种函数的工作机制,设计基于进化策略的改进文化算法的种群空间,实现基于改进文化算法的聚类模型,实验结果表明,该聚类模型可以有效的提高聚类效果。 相似文献
20.
一种基于密度最大值的聚类算法 总被引:1,自引:0,他引:1
提出了一种结合了基于密度聚类思想的划分聚类方法——"密度最大值聚类算法(MDCA)",以最大密度对象作为起始点,通过考察最大密度对象所处空间区域的密度分布情况来划分基本簇,并合并基本簇获得最终的簇划分.实验表明,MDCA能够自动确定簇数量,并有效发现任意形状的簇,对于未知数据集的处理能力和聚类准确度都优于传统的基于划分聚类算法. 相似文献