首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 31 毫秒
1.
针对现有序列聚类算法在对大规模数据进行聚类时,内存空间和计算时间开销较大的问题,提出了基于MapReduce的人工蜂群聚类算法。该算法通过引入MapReduce并行编程范式,快速计算聚类中心适应度,可实现对大规模数据的高效聚类。基于仿真数据对算法的聚类效果和聚类效率进行了验证。实验结果表明,与现有PK-Means算法和并行K-PSO算法相比,该算法具有更好的聚类效果和更高的聚类效率。  相似文献   

2.
为了提高聚类结果和允许在结果中进行选择,将本体语义与文档聚类相结合,在文档处理过程中提出了基于WordNet的新的文档聚类算法.首先通过tf-idf对文档进行了表示,为了将WordNet的概念出现在文档集合中,通过新的实体对每一个单词向量进行扩展.其次,运用特征提取算法对文档进行特征提取.最后提出了本体集合聚类算法用以提高文本的聚类效果.实验构建在Reuters20新闻组的数据基础上,应用互信息作为试验结果的比较.结果表明:与已经存在的一些算法如MNB,CLU-TO,co-clustering等相比,基于本体的聚类算法在文本聚类上有很明显的提高.  相似文献   

3.
《柳州师专学报》2015,(6):108-110
K-means算法是一种基于划分的方法,该算法对初始聚类中心的选取依赖性极大,初始中心值的不同导致聚类效果不稳定.为此,本文利用几何概率的思想,认为每个数据点都是等概率的存在于数据集,通过计算每个数据点的点概率值,结合距离因素,选择K个点作为初始聚类中心.实验证明,改进后的K-means算法聚类效果更好.  相似文献   

4.
为了改善传统基于聚类的图像分割算法对噪声敏感以及仅使用单一特征无法精确描述目标特性等问题,提出了一种基于区域的多特征图像分割算法。首先,使用 Meanshift 算法对原图像进行预分割,获得一组区域块;其次,提取每个区域块的颜色特征和纹理特征,使用 FCM 算法分别对每个特征进行聚类,针对每个特征获得一个类标签邻接矩阵;再次,将多个邻接矩阵叠加,形成多特征邻接矩阵;最后,使用 NCUT 算法对叠加邻矩阵进行聚类,获得最终分割图像。实验结果表明,基于区域多特征的分割算法优于对比算法,融合多特征对图像分割可以更准确地识别不同的目标结构,具有更好的分割效果。  相似文献   

5.
聚类算法是数据挖掘算法中的重要方法之一.本文在分析了FCM算法和基于遗传聚类算法的不足基础上,提出了一种基于免疫单亲遗传和模糊C均值的混合聚类算法,克服了FCM的局部最优问题以及普通遗传算法聚类时的搜索速度和聚类精度的矛盾,实验表明该算法是有效的.  相似文献   

6.
为改善网络舆情态势感知与预警中舆情信息分析不准确的问题,提出基于 Spark 技术的均值漂移(MS)算法,利用该算法原理分析 Spark 框架特性,给出该算法在 Spark 框架中的实现过程,包括舆情信息预处理、特征提取、特征向量模型构建和算法聚类设计。在相同数据集下将 MS 算法和 K-means 算法聚类效果进行对比,实验结果显示,K-means 算法聚类结果受 k 值选取的影响,存在聚类结果不准确的问题;基于 Spark 的 MeanShift 算法在没有任何先验条件下舆情聚类效果优于 K-means 聚类算法,且符合预期期望。  相似文献   

7.
在对免疫聚类类型和流程分析的基础上,结合混沌变量的遍历性和聚类融合方法,提出了基于改进aiNet(artificial immune net)聚类算法CO-aiNet(Chaos optimization of artificial immune net)的异常检测算法ICDA(Immune clustering based Anomaly detection)。CO-aiNet算法在引入权重矢量、相关度等基础上,采用模拟退火算法和概率准则优化监测数据,优化了聚类效果;引入异常因子概念,通过对多次聚类融合后的数据按照异常标记次数排序,得到异常数据集。实验表明,CO-aiNet算法聚类效果优于同类算法,基于聚类融合的异常检测准确性和稳定性显著提升。  相似文献   

8.
仿射传播聚类算法是一种比较新的基于质心的聚类算法,在图像分割领域得到了广泛应用。仿射传播聚类算法最终聚类数目会受到偏向参数P(Preference)的影响,得到的聚类数目往往偏多,影响分割质量。鉴于此,提出一种改进的仿射传播聚类的图像分割算法,该算法将仿射传播聚类算法与CURE层次聚类算法相结合,CURE算法能够对仿射传播聚类算法的分割结果进行优化。实验验证表明,改进后的算法图像分割效果更好。  相似文献   

9.
聚类分析在数据挖掘领域中占有重要地位,到目前为止学者们提出了许多的聚类算法.本文提出了一种基于k NN的聚类算法k-Nearest Neighbor Cluster(k NNC).该算法首先找到每个数据点的k个邻居点,然后设置匹配点数n,通过使用每个点的邻居点进行匹配进而达到聚类效果.本文通过三个实验去验证该算法,并且与k-means算法进行比较.实验结果表明,该算法具有稳定的正确率,而其最大的优点是不需要预先设定聚类簇数,它可以大致的找到聚类的簇数.  相似文献   

10.
K-means算法是解决聚类问题的经典算法,在满足一定的条件情况下,聚类的结果比较好.但这种算法对初始聚类中心敏感,聚类结果随不同的初始输入而波动.针对这种缺陷,提出了一种新的基于数据样本分布选取初始聚类中心的算法.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号