首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
一种基于密度最大值的聚类算法   总被引:1,自引:0,他引:1  
提出了一种结合了基于密度聚类思想的划分聚类方法——"密度最大值聚类算法(MDCA)",以最大密度对象作为起始点,通过考察最大密度对象所处空间区域的密度分布情况来划分基本簇,并合并基本簇获得最终的簇划分.实验表明,MDCA能够自动确定簇数量,并有效发现任意形状的簇,对于未知数据集的处理能力和聚类准确度都优于传统的基于划分聚类算法.  相似文献   

2.
SA-DBSCAN:一种自适应基于密度聚类算法   总被引:10,自引:0,他引:10  
DBSCAN是一种经典的基于密度聚类算法,能够自动确定簇的数量,对任意形状的簇都能有效处理.DBSCAN算法需要人为确定Eps和minPts?2个参数,导致聚类过程需人工干预才能进行.在DBSCAN的基础上提出了SA-DBSCAN聚类算法,通过分析数据集统计特性来自动确定Eps和minPts参数,从而避免了聚类过程的人工干预,实现聚类过程的全自动化.实验表明,SA-DBSCAN能够选择合理的Eps和minPts参数并得到较高准确度的聚类结果.  相似文献   

3.
将前期工作进行了改进并将训练集各簇中语义相似度大的文档进行合并,减少了训练集容量,实验表明该算法大大提高了KNN算法的效率。  相似文献   

4.
王冬秀 《科技通报》2013,(6):40-43,46
对目前主流数据流算法的优缺点进行分析后,提出了一种衰减窗口模型下基于密度的数据流聚类算法DWDCluSteam。算法采用衰减窗口技术,然后利用改进的树结构来维护和更新数据流的摘要信息,最后利用周期性的剪枝策略,定期删除过期、稀疏的网格单元。仿真实验表明,相对于以往的数据流聚类算法,该算法可获得较好的聚类质量,较小的内存开销和较高的数据处理能力。  相似文献   

5.
随着现代数字化的技术和发展趋势,要求对最有发展空间的影视数据进行分析并得到知识。针对影视数据挖掘技术,讨论了数据挖掘系统各主要模块的功能及影视数据挖掘的可行性和意义,对影视数据挖掘进行研究和探讨。  相似文献   

6.
基于文本挖掘的分类与聚类技术   总被引:5,自引:0,他引:5  
从基于文本挖掘理论和实践两方面,探讨了文本的分类与聚类的理论、技术及两者之间的区别,讨论了聚类与分类技术在文本挖掘过程中的重要作用,通过所列举的自动分类与聚类的应用实例,能给读者的实际工作以一定的借鉴。  相似文献   

7.
针对FCM(模糊C均值聚类算法)对初始聚类中心的选取敏感以及梯度法易收敛到鞍点,在此基础上提出了一种分层遗传算法(HGA)优化的核模糊C均值聚类算法(HGA-KFCM)来提升聚类性能,首先用分层遗传算法(HGA)在全局筛选出高品质聚类中心以替代FCM的随机产生的聚类中心,再利用高斯径向核函数改变FCM中的距离函数并且重新定义目标函数,最终根据新参数进行迭代流程。在仿真实验中用两种数据集作为实验数据,利用FCM、HGA-KFCM以及其他三种聚类算法进行聚类测试,结果显示HGA-KFCM在一定程度上解决了FCM的缺陷,此外将新算法与另外三种性能不错的聚类算法在抗局部收敛能力,迭代次数和精度上比较,结果显示新算法具有良好的聚类性能。  相似文献   

8.
在研究照片背景去除技术的领域,已有的方法都是针对黑白照片的。文章利用数据挖掘领域的聚类技术,提出一种直接去除彩色照片背景的技术,实验证明去除效果良好,具有较强的实用价值。  相似文献   

9.
基于核聚类算法的高校图书借阅信息分类方法   总被引:3,自引:0,他引:3  
李盼池 《现代情报》2003,23(9):186-188
针对高校图书馆读者借阅文献类型、流量实时监测问题,提出了一种基于模式识别中核聚类算法的自动分类和统计分析方法。首先按照中图法所列22个大类对馆藏图书类型和借阅记录情况进行量化编码,然后对编码后的数据进行规整处理。以流通系统的读者数据库为底层数据支持,采用本文提出的方法开发出流量分类统计和预报应用系统。对大庆石油学院图书馆流通数据进行实际处理,结果证明了该算法的有效性和可靠性。  相似文献   

10.
郭文娟 《科技风》2022,(4):63-65
针对传统的K-means算法运行的结果依赖于初始的聚类数目和聚类中心,本文提出了一种基于优化初始聚类中心的K-means算法。该算法通过量化样本间距离和聚类的紧密性来确定聚类数目K值;根据数据集的分布特征来选取相距较远的数据作为初始聚类中心,避免了传统K-means算法的聚类数目和聚类中心的随机选取。UCI机器学习数据库数据集的实验证明,本文所提出的改进的聚类算法获得了良好的聚类效果,同时获得较高的聚类准确率。  相似文献   

11.
刘涛  宋涛  欧迎春  施富强 《科技风》2022,(22):65-67
为解决在无先验情报信息条件下复杂信号环境中目标分选困难的问题,提出了一种基于DBSCAN算法的目标聚类分选技术。该技术首先基于信号的位置信息进行聚类分选,再统计分选结果的电磁参数特性,并根据统计结果进一步自适应分选,最终获得目标雷达的电磁情报信息和精确定位结果。仿真结果验证了本技术正确有效。  相似文献   

12.
王鹤 《中国科技信息》2007,(15):280-281
数据挖掘是在海量的数据中寻找模式或规则的过程。数据挖掘强调的是发现知识,获得的知识类型包括关联规则、分类、回归、聚类、依赖模型等。本文对其中聚类分析技术进行了较为深入地研究与分析,提出基于信息素的蚁群聚类算法PCBP,利用信息素指导蚂蚁移动,用不同速度的蚂蚁来改善聚类质量,并在这个思想基础上提出层次化蚁群聚类方法。为人们研究聚类提供了新思路和新途径,因此本文的研究具有一定的理论和实践意义。  相似文献   

13.
Spark提供基于内存计算的开源计算,支持全栈式解决批处理、数据查询和机器学习等业务场景。Spark生态系统在机器学习领域的重要应用MLlib,具有很多常用算法,实现了K-means等多种分布式机器学习算法。本文主要探讨Spark的功能、体系结构和Spark的特点,聚类算法和基于Spark机器学习库MLlib及其K-means算法。  相似文献   

14.
谢静  苏一丹 《大众科技》2010,(12):38-39
文章提出了一种基于人工免疫增量的聚类算法。该算法在人工免疫可更新聚类算法的基础上,结合蚁群增量聚类算法的思想,将原聚类得到的记忆抗体矩阵作为初始矩阵,调用人工免疫聚类算法处理增量数据,然后采用类解体机制处理类内误差超过规定阈值的聚类。  相似文献   

15.
SOM聚类算法在文本分类上的应用   总被引:2,自引:0,他引:2  
丁露  崔平 《现代情报》2007,27(9):162-164
随着网络信息指数级的增长,如何高效地组织海量的文本信息成为众多终端信息查询的基本要求。本文利用神经网络的联想记忆原理,提出一种改进自组织映射(SOM)神经网络聚类算法来对这些信息进行索引和分类。改进SOM聚类算法通过文本的预处理和词汇权值的计算,SOM网络的训练过程以及多次聚类来细化各文本类别,最终产生概念空间。试验结果表明该算法对文本有很好的分类管理功能,便于文本检索。  相似文献   

16.
目前国内对于专利地图的研究大部分仍停留在应用阶段,对其制作的基础理论研究较少。概述目前专利地图类别,分析现有专利地图制作方法的缺陷,从增强专利文献信息可信度和价值的角度,运用TF-IDF(term frequency-inverse document frequency)统计特征将非结构化的专利文献信息映射到低维空间中,采用密度峰值快速搜索聚类(clustering by fast search and find of density peaks,CFSFDP)算法进行聚类,对同一聚类中的专利文献特征进行分析,得到不同专利文献间的发展关系并映射为图表示,从而构建以有向图表示的专利地图。改进提出的这种专利地图制作方法,同时利用了结构化信息与非结构化信息,以使专利地图更为真实准确地反映目标技术领域的技术发展过程。  相似文献   

17.
基于社会演化算法的聚类新算法   总被引:1,自引:0,他引:1  
郝占刚  王正欧 《情报杂志》2006,25(5):5-6,10
K均值聚类算法通常只能以局部最优结束,很难找到全局最优。提出了一种基于社会演化算法和K均值算法相结合的聚类新算法。在该算法中提出了认知主体在聚类中对范式学习的新的方式。实验证明该算法能大大提高聚类的效率和精度。  相似文献   

18.
密度峰值聚类(Density peaks clustering简称DPC)算法是2014年在美国Science期刊上发表的一种非常简洁优美的聚类算法,它不需要像经典K-means算法那样迭代,也不需要很多参数。DPC算法的核心思想在于对聚类中心的刻画,它通过计算数据集中每个数据点的局部密度和该点到具有更高局部密度的点的最小距离,当数据点的■的值较大时,该点为聚类中心。然而通过分析,发现这样选取聚类中心得聚类效果不具有稳健性,依赖于和的量纲。本文提出一种改进的密度峰值聚类算法,将和归一化后的和记为每个点的权重,构造函数■作为选取聚类中心的判决函数,结合模拟计算,验证本文的方法更鲁棒,选取聚类中心效果更好,且复杂度降低。  相似文献   

19.
人工免疫算法具有生物免疫系统中的克隆选择原理和记忆机制,将人工免疫算法用于聚类分析,在取得全局最优解上显示出了很大的优势.文章介绍和分析了C和K均值混合聚类算法,讨论了基于人工免疫的图像聚类算法及其对于兵器类图像检索的作用.  相似文献   

20.
随着21世纪的到来,市场上出现了以淘宝和亚马逊为代表的一些电商平台,这些平台为消费者提供了极大购物便利的同时,也出现了很多因为数据过大而导致的一系列问题,例如数据量过大,导致聚类算法效率低下,不能及时给用户推荐产品,同时数据量过大,导致数据稀疏性问题明显。因此,文章研究了基于用户聚类的服装推荐技术。基于传统协同过滤算法中,由于其本身特性造成的推荐效果实时性不高以及效率低下的问题,引入用户兴趣变化模型,以及评分预测时间模型,提出基于时间和用户兴趣改变的协同过滤推荐算法,对传统过滤算法进行针对性的修改。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号