共查询到20条相似文献,搜索用时 93 毫秒
1.
2.
3.
一种基于密度最大值的聚类算法 总被引:1,自引:0,他引:1
提出了一种结合了基于密度聚类思想的划分聚类方法——"密度最大值聚类算法(MDCA)",以最大密度对象作为起始点,通过考察最大密度对象所处空间区域的密度分布情况来划分基本簇,并合并基本簇获得最终的簇划分.实验表明,MDCA能够自动确定簇数量,并有效发现任意形状的簇,对于未知数据集的处理能力和聚类准确度都优于传统的基于划分聚类算法. 相似文献
4.
k-means算法在运行过程中对聚类中心有着很高的要求,本文通过萤火虫算法初始化k-means算法的聚类中心,从而确保k-means算法得到更好的聚类效果。 相似文献
5.
线性判别分析(LDA)具有很好的分类性能,但是计算复杂度一般较高。为了有效地降低LDA算法的计算复杂度,本文提出了一种基于k-means聚类的快速学习算法。该算法首先根据k-means聚类算法对原始样本进行聚类,计算聚类簇的样本中心作为新训练样本,然后再利用LDA算法进行分类。由于通过聚类算法有效地压缩了训练样本集的规模,因此算法具有更高的效率。在语音识别数据集上的实验充分验证了本文算法具有较好的分类性能,而且效率更高。 相似文献
6.
【目的/意义】基于机器学习算法对信息进行聚类及预测引起了广泛关注,本文将以航空公司客户信息为对
象构建出k-means,BP神经网络模型,对航空用户进行聚类及预测,实现用户的精准营销。【方法/过程】首先,对航
空公司的客户信息进行预处理,并根据信息聚类和信息预测理论,构建出k-means客户聚类模型与BP神经网络的
流失预测模型。【结果/结论】实证结果表明,在聚类模型上,k-means算法将客户聚为五类,实现了不同价值客户的
差异化识别;在客户预测模型上,BP神经网络的准确性更高。【创新/局限】本次研究将LRFMC模型引入到用户聚
类模型的实验中,使得模型泛化能力上存在了一定的局限,但也为该问题的未来研究提供了新的方式。 相似文献
7.
阿达来提·阿布力克木 《科技风》2009,(20)
非晶变压器的噪音污染问题随着电气时代的变迁正在遥步地显示出来,所以如何控制降低变压器噪音始终是变压器领域的一大难题.本文先是通过对噪声基础知识的介绍什么是噪声,噪声的量度怎样定义以及环境对噪音要求是什么.接着文章引入到变压器噪音这个主题上,分别对变压器噪音的来缘、影响非晶合金变压器噪音的几大重要因素(例如:铁心的磁通密度、磁致伸缩、铁心的结构、隔音材料、加工工艺等)进行一定地阐述和分析,如何有效地降低非晶合金变压器噪音的几大方法. 相似文献
8.
9.
10.
11.
基于优化初始类中心点的K-means改进算法 总被引:2,自引:0,他引:2
K-means算法是一种重要的聚类算法,在网络信息处理领域有着广泛的应用。由于K-means算法终止于一个局部最优状态,所以初始类中心点的选择会在很大程度上影响其聚类效果。本文提出了一种K-means算法的改进算法,首先探测数据集中的相对密集区域,再利用这些密集区域生成初始类中心点。该方法能够很好地排除类边缘点和噪声点的影响,并且能够适应数据集中各个实际类别密度分布不平衡的情况,最终获得较好的聚类效果。 相似文献
12.
本文将数据挖掘算法应用干智能答疑系统中,提出了一套基于数据挖掘算法的答疑设计方案并加以改进,传统的K-均值算法聚类虽然速度快,在文本聚类中易于实现,但其同样依赖于所有变量,聚类效果往往不尽如人意.为了克服这一缺点,提出一种改进的K-均值文本聚类算法.它在K-均值聚类过程中,向每一个聚类簇中的关键词自动计算添加一个权重,重要的关键词赋予较大的权重.经过实验测试.获得了一种基于子空闻变量自动加权的适合文本数据聚类分析的改进算法,它不仅可以在大规模、高维和稀疏的文本数据上有效地进行聚类.还能够生成质量较高的聚类结果.实验结果表明基于子空闻变量自动加权的K-均值文本聚类算法是有效的大规模文本数据聚类算法. 相似文献
13.
构建医药制造业竞争力评价指标体系,运用数据挖掘技术(K-均值聚类算法)定量评价竞争力,得出相应结论,为政府和企业决策提供参考。 相似文献
14.
15.
[目的/意义]使用K-means聚类分析方法,对外交机构遭受的恐怖主义袭击进行定量、客观的评估.[方法/过程]构造K-means聚类方法风险评估模型,对1970—2018年外交机构遭遇恐怖袭击事件进行分析,客观地计算出几类袭击方式、袭击目标和不同国家的风险,其中重点分析了该外交机构政治隶属和该外交机构地理位置所在国家的... 相似文献
16.
在对K均值算法和图像聚类的蚁群优化算法(ACO)进行对比分析后,本文提出了K均值ACO算法来解决K均值误分类和ACO慢聚敛的问题。K均值ACO算法将K均值的结果当成ACO的启发式信息,如此提高了ACO在蚁群寻找规则方面的光照概率和光照像素,允许蚁群根据信息素集中度而非概率来筛选节点,以致可以在不对ACO的随机搜索质量进行改变的情况下就可以完全获取到启发式信息。对模拟数据和真实数据进行验证后,K均值ACO算法证实可以改善K均值误分类的聚类精确度并提高ACO的收率速度。 相似文献
17.
文献著者消歧是人名消歧的一种,近年来引起了学术界的广泛关注。其中,文献聚类方法是文献著者消歧的重要方法,但其实验效果往往不佳。基于此,对文本聚类K—means方法进行改进,并在此基础上来实现文献著者消歧。实验结果表明,改进的K—means算法能有效提高文献著者消歧的实验效果。 相似文献
18.
模糊支持向量机(FSVM)具有很好的抗噪声能力,受到了很多专家的重视。然而模糊支持向量机算法的时间复杂度通常较高。针对这一不足,本文提出了一种基于核聚类的模糊支持向量机算法。首先根据核聚类算法对每一类原始样本进行聚类,然后对每一簇求样本中心,用样本中心作为新的样本点替换该类别的原始样本。最后本文算法利用中心距离型计算新样本的模糊权重,并利用模糊支持向量机算法进行求解。实验充分验证了本文算法相对于传统模糊支持向量机方法具有更快的分类速度。 相似文献
19.
20.
提出基于图的半监督学习算法,即类别传播算,结合K均值算法改进,用于网页分类。该K均值类别传播方法使用欧式距离的建立带权∈NN图。在这个图中,图节点表示已标记或未标记的网页,边上的权重表示节点的相似度,已标记节点的类别沿着边向邻居节点传播,从而将网页分类问题形式化为类别在图上的传播。结合K均值方法,提高了计算速度以及图方法的归纳能力,经UCI数据集测试,结果表明,此算法比类别传播算法有更好的性能,能够有效地用于半监督网页分类。 相似文献