共查询到20条相似文献,搜索用时 15 毫秒
1.
针对DCF聚类描述法存在的问题,提出一种基于组合策略的聚类描述方法,即综合利用"先描述、后聚类"和"先聚类、后描述"的优点,解决聚类描述的可理解性问题.实验结果表明该方法的有效性,将该方法用于搜索结果聚类这一应用中. 相似文献
2.
3.
4.
针对K-Means算法中对初始聚类中心进行随机选择并未达到理想优化的情况,提出一种改进的初始聚类中心选择算法。改进算法首先将原始数据进行预处理并计算各维有效数据的最大值和最小值,然后利用各维有效数据的最大值和最小值进行数据分段和初始聚类中心选择,最后采用VS集成开发环境进行建模。采用遵义医学院2010级的学生计算机考试成绩数据对模型进行仿真,仿真结果显示聚类挖掘性能相对K-Means算法较高,证明改进的初始聚类中心选择算法可以提供精确的聚类挖掘结果。 相似文献
5.
针对社会化标签语义模糊,传统K-medoids聚类算法对初始聚类中心敏感、收敛速度缓慢、只能将归类对象划入到单一类别的缺点,提出一种基于改进K-medoids的社会化标注资源两阶段聚类算法。算法应用一种简洁快速的初始聚类中心选取新规则以及改进的聚类准则函数,首先进行标签聚类,然后将同一标签簇中标签标注的网络资源初步划分到同一资源簇中,最后在这些资源簇中再次进行资源聚类。实验结果表明,提出的算法能自主、合理地确定初始聚类中心,聚类过程收敛速度快,聚类结果有更好的准确性。 相似文献
6.
建立了有时间窗口的车辆路径问题多目标优化模型,提出了一种基于聚类的混合多目标优化遗传算法。该算法采用并列选择方法,用擂台赛法则构造非支配集,并用聚类方法缩小非支配集,避免了求解非凸解的困难,提高了遗传算法搜索速度及避免了"早熟"等不足。实验结果表明,该算法为解决车辆数不确定的时间窗车辆路径问题提供了一个较为有效的求解方法。 相似文献
7.
聚类分析用于高校科技活动的评价体现了简捷、实用的特点,是高校科技实力评估的一种可行的新途径。本文以江苏省15所部委和省属重点高校1998年至2002年科技统计指标为例,分别用动态聚类和静态聚类的方法进行分析,研究动态聚类和静态聚类用于高校科技统计指标分析时的不同特点和不同用途。 相似文献
8.
针对传统的K-means算法运行的结果依赖于初始的聚类数目和聚类中心,本文提出了一种基于优化初始聚类中心的K-means算法。该算法通过量化样本间距离和聚类的紧密性来确定聚类数目K值;根据数据集的分布特征来选取相距较远的数据作为初始聚类中心,避免了传统K-means算法的聚类数目和聚类中心的随机选取。UCI机器学习数据库数据集的实验证明,本文所提出的改进的聚类算法获得了良好的聚类效果,同时获得较高的聚类准确率。 相似文献
9.
随着信息技术和Web技术的发展,如何从海量的Web文本信息中找到自己所需信息已成为一个重要的研究领域。在众多信息获取方法中,聚类技术是一种被广泛应用的方法。总结了文本聚类算法的研究现状,比较了算法的主要差异和整体思想,并分析了各种方法的优劣,同时指出了文本聚类研究今后的发展趋势,即在粒子群聚类过程中融入其它传统聚类方法的思想,以提高聚类性能。 相似文献
10.
主要研究了均值聚类图像分割问题。针对传统的聚类图像分割算法对图像地分割精度较低等问题,提出一种基于模糊控制的C-均值聚类快速图像分割新方法。本文采用快速模糊C-均值聚类算法对图像分割。实验结果表明,图像分割边缘清晰,分割效果明显优于传统的聚类图像分割算法。 相似文献
11.
针对FCM(模糊C均值聚类算法)对初始聚类中心的选取敏感以及梯度法易收敛到鞍点,在此基础上提出了一种分层遗传算法(HGA)优化的核模糊C均值聚类算法(HGA-KFCM)来提升聚类性能,首先用分层遗传算法(HGA)在全局筛选出高品质聚类中心以替代FCM的随机产生的聚类中心,再利用高斯径向核函数改变FCM中的距离函数并且重新定义目标函数,最终根据新参数进行迭代流程。在仿真实验中用两种数据集作为实验数据,利用FCM、HGA-KFCM以及其他三种聚类算法进行聚类测试,结果显示HGA-KFCM在一定程度上解决了FCM的缺陷,此外将新算法与另外三种性能不错的聚类算法在抗局部收敛能力,迭代次数和精度上比较,结果显示新算法具有良好的聚类性能。 相似文献
12.
13.
14.
在基于粗糙集的属性约简算法中引入模糊等价关系的一种新的度量方法,重新定义了高维数据中的属性重要度,提出了一个结合粗糙集和模糊聚类方法的属性约简算法,并通过实验得到了用户满意的属性约简结果。 相似文献
15.
针对FCM算法主要应用于点数据聚类,不能直接处理关系型数据的缺点。本文提出了一种基于Web日志的数据挖掘聚类算法,首先对FCM算法进行改进使其能够处理关系型数据,并对算法进行了健壮性改进。然后针对传统FCM算法需要在没有先验知识的基础上,事先确定聚类类别数的缺点,引入了竞争凝聚算法(CA),与FCM算法相结合,形成了CA-FCM算法,使之能够自动确定最佳分类类别数。实验表明,CA-FCM算法的挖掘结果与FCM算法的结果相近,在用户访问会话数量不太大时性能优于FCM算法。 相似文献
16.
本文介绍了目前较为流行的搜索引擎聚类技术,对国外著名聚类搜索引擎进行了测评,并预测了搜索引擎聚类技术的未来发展。 相似文献
17.
提出一种基于文本聚类的开放式信息自动归类方法.它的主要特点是:适合自动归类不断增量的文档信息;不需要人为干预,完全靠自主学习的方式来确定各个主题的内涵范围:类别在聚类过程中动态产生.实验证明,该方法能实现增量信息的自动归类,且从评价函数的评价结果看,归类效果良好. 相似文献
18.
19.
BP算法与遗传算法是神经网络中两个非常重要的算法,但各有优缺点,本文对遗传算法的交叉率进行了改进,使得算法的效率得到提高;并将其用于BP网络的权值优化,实验结果表明,比传统的方法效率有明显提高. 相似文献
20.
基于社会演化算法的聚类新算法 总被引:1,自引:0,他引:1
K均值聚类算法通常只能以局部最优结束,很难找到全局最优。提出了一种基于社会演化算法和K均值算法相结合的聚类新算法。在该算法中提出了认知主体在聚类中对范式学习的新的方式。实验证明该算法能大大提高聚类的效率和精度。 相似文献