首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
DBSCAN是一种经典的基于密度聚类算法,能够自动确定簇的数量,对任意形状的簇都能有效处理.DBSCAN算法需要人为确定Eps和minPts?2个参数,导致聚类过程需人工干预才能进行.在DBSCAN的基础上提出了SA-DBSCAN聚类算法,通过分析数据集统计特性来自动确定Eps和minPts参数,从而避免了聚类过程的人工干预,实现聚类过程的全自动化.实验表明,SA-DBSCAN能够选择合理的Eps和minPts参数并得到较高准确度的聚类结果.  相似文献   

2.
提出了一种结合了基于密度聚类思想的划分聚类方法——"密度最大值聚类算法(MDCA)",以最大密度对象作为起始点,通过考察最大密度对象所处空间区域的密度分布情况来划分基本簇,并合并基本簇获得最终的簇划分.实验表明,MDCA能够自动确定簇数量,并有效发现任意形状的簇,对于未知数据集的处理能力和聚类准确度都优于传统的基于划分聚类算法.  相似文献   

3.
结合K-means算法和谱聚类方法的优点,提出一种新的高光谱图像聚类方法。该方法在对高光谱图像数据进行特征降维的基础上,采用K-means算法对图像进行粗聚类处理,然后采用谱聚类方法对粗聚类结果进行较高精度的聚类。与K-means聚类算法相比,该方法有效提高了高光谱图像聚类的分类精度。对模拟数据和真实的高光谱数据的对比实验表明,相对于K-means和谱聚类方法,该方法具有良好的聚类性能。  相似文献   

4.
提出一种基于最近邻居距离分布的空间聚类算法——NNDDB算法.实验分析表明,与划分聚类算法CLARANS相比,NNDDB能动态地决定聚类数目且能发现任意形状的聚类;与密度聚类算法DBSCAN相比,NNDDB算法无输入参数;在效率方面,NNDDB算法对于大型数据库是有效的.  相似文献   

5.
文本聚类是建立大规模文本集合的分类体系实例的有效手段之一。本文讨论了利用标准的分类测试集合进行聚类质量的量化评价的手段,选择了k-Means聚类算法、STC(后缀树聚类)算法和基于Ant的聚类算法进行了实验对比。对实验结果的分析表明,STC聚类算法由于在处理文本时充分考虑了文本的短语特性,其聚类效果较好;基于Ant的聚类算法的结果受参数输入的影响较大;在Ant聚类算法中引入文本特性可以提高聚类结果的质量。  相似文献   

6.
聚类是人类一项最基本的认识活动 ,通过适当的聚类 ,事物才便于研究 ,事物的内部规律才可能为人类所掌握。但是 ,由于人们不总是能对客观世界进行精确的描述 ,很多信息和数据都是不确定的、模糊的。为了处理模糊数据 ,把模糊性引入数据库系统中 ,从而形成了模糊关系数据库。本文对模糊关系数据库下的基于距离函数的聚类算法进行了研究 ,并通过例子来说明如何建立和应用这种数据挖掘模型  相似文献   

7.
数据流聚类算法分析   总被引:1,自引:0,他引:1  
首先比较了数据流聚类分析与传统的聚类分析方法的一些不同点,对目前最新的一些数据流聚类研究成果进行了分析,最后对数据流聚类发展方向进行了展望.  相似文献   

8.
根据目前应用于入侵监测的算法中普遍存在的对输入顺序敏感,无法自适应地确定参数以及需要大量的训练数据等问题,且k-means算法存在初值选取的问题,因而提出一种新的聚类算法进行入侵行为的监测。该方法的优点是对输入数据顺序不敏感以及能够比较准确地选择聚类的初值。实验中采用了KDD99的测试数据,结果表明该方法可以比较有效地检测真实网络数据中的已知和未知的入侵行为。  相似文献   

9.
针对目前组卷系统数量多但真正能满足用户需求的却非常少的问题。提出了一种新型的智能组卷策略。以蚁群算法自题库中挑出对于不同程度的学生最合适的测试卷。实验表明本文算法能快速有效地完成组卷过程,具有较强的实用性。  相似文献   

10.
使用调和均值的KHM聚类算法,不像KM聚类算法,具有对初始值不敏感的优点。但它作为一个基于中心聚类算法,难以摆脱早熟收敛的问题。为了克服KHM算法的不足,本文提出结合ABC和KHM的ABC-KHM混合聚类算法。在混合算法中,聚类行为可以分为两个阶段:全局搜索的ABC聚类阶段和局部求精的KHM聚类阶段。通过仿真实验,并与KHM聚类算法进行了比较,结果表明:ABC-KHM混合聚类算法,不仅对聚类初始值不敏感,而且具有较快的聚类速度、良好的全局聚类效果,是一个不错的聚类算法。  相似文献   

11.
文章根据聚类分析和模糊相似矩阵理论,采用基于模糊聚类的综合排序方法,提出一种基于聚类的指标综合评价模型,并通过实例应用验证了这个模型的可用性。借助该模型对多目标决策中的决策指标项进行综合评价,可为决策者提供有效的决策依据。  相似文献   

12.
本文详细分析了数据流聚类算法CluStream的不足之处,如对非球形的聚类效果不好、对周期性数据的聚类变化反映不完整等,并针对这些不足提出了一种采用空间分割、组合以及按密度聚类的算法SClustream。实验结果表明,SCluStream在准确度和速度上都比CluStream有较大的提高。  相似文献   

13.
针对海上交通监控中船舶数量众多,且对具有潜在碰撞危险的船舶识别效率不高的问题,提出一种基于DBSCAN(带噪声的基于密度的空间聚类)的船舶会遇实时识别方法。根据海上交通风险监控的研究需求,分析船舶会遇局面的定义。运用墨卡托算法计算船舶之间的距离,采用DBSCAN算法进行船舶会遇聚类识别。基于浙江舟山群岛西南海域航行船舶的AIS数据,对设置不同船舶会遇距离的试验结果进行比较分析,结果表明:当船舶会遇距离为1 n mile时,可以将56艘船划分为7个会遇船舶类,占船舶总数的32.1%,每个会遇船舶类包括2~3艘船。将该方法运用到实际海上交通监控中,可对每个会遇船舶类中的船舶航行动态进行重点关注,降低海上交通监控人员的工作负担,提高海上交通监控的效率。  相似文献   

14.
流程挖掘是一种从实际业务执行日志中发现结构化流程信息的过程。流程挖掘技术广泛应用于业务流程的发现和辅助建模过程中,并能够通过差异分析的方法帮助改进已有业务流程。如何处理流程模型中的重复任务,是流程挖掘技术的一个关键问题。提出了一个在标准流程挖掘算法执行之前进行的重复任务处理阶段,这一重复任务处理方法可以很好地兼容目前已有的各种流程挖掘算法使之能够处理重复任务。并提出了一种能够将事件记录上下文信息的差别数值化的距离度量定义,使用这种度量能够利用聚类方法来识别输入数据中的重复任务。最后利用典型的带有重复任务的流程模型,对所提出的处理方法进行了模拟实验,并取得了良好的实验效果。  相似文献   

15.
在客户关系管理的流程中,由于超市的规模庞大,客户的背景、收入、年龄、教育程度、行为特征的不同,对商品的需求也呈现多层次、个性化、差异化的趋势,因此必须根据客户的特点对客户进行细分,并在此基础上对不同的细分市场提供有针对性的差异化服务。数据挖掘技术中的聚类分析,将有助于超市从堆积如山的数据中,发掘更多有利于营销的具有商业价值的信息。  相似文献   

16.
为处理线性不可分、结构复杂的数据集,提出基于核聚类的K 均值聚类(Kernel Clustering based K means Clustering,KCKC).该方法先在原始空间中对模式进行聚类,再由径向基函数(Radial Basis Function, RBF)核把它们映射到核空间,从而保持大部分模式之间的关系.把提出的方法应用到基于RBF的神经网络(RBF based Neural Network,RBFNN)、基于RBF的支持向量机(RBF based Support Vector Machine, RBFSVM)和核最近邻分类器(Kernel Nearest Neighbor Classifier,KNNC)中,结果表明本文提出的算法可以生成更有效的核,节省在核空间中的核生成时间,避免核数目设置的敏感性,并提高分类性能.  相似文献   

17.
针对SAR图像的分割问题,对K均值聚类算法进行研究.分析动态K均值聚类算法,用聚类样本数的正比函数对该聚类适应度函数进行平均,改进适应度函数的计算.毫米波SAR图像分割实验结果表明,对于城区建筑及路、桥场景的分割,改进后的动态K均值聚类算法和自适应动态K均值聚类算法的分割质量与改进前相同,但是分割时间有一定的减少,改进适应度函数后分割效率得到了提高.  相似文献   

18.
为弥补具有径向基函数(radial basis function, RBF)核的支持向量机(support vector machine, SVM)的不足,即如何获得合适的RBF核并且包含更多的数据信息,提出一个关于核聚类的有效方法。该方法通过关于核数目、中心、宽度的一些公式来生成核。这个生成方法可以容易、合理、优化地获得核。在美国邮政手写数字数据集(记为USPS)和字母识别数据集(记为Letter)上的试验可以验证,具有这些新生成的RBF核的SVM拥有更少更合理的核以及更高的分类性能。通过这个新提出的方法,可以处理更多的大规模分类问题。  相似文献   

19.
为解决船舶自动识别系统(automatic identification system, AIS)数据挖掘不够充分,对航路辨识分析不够全面等问题,提出一种基于改进谱聚类算法的数据挖掘方式。利用Sliding Window算法对船舶轨迹AIS数据进行压缩,减少数据冗余提高聚类效率。改进亲和距离函数,提出新的亲和矩阵的标准,提高聚类的稳定性,进一步对数据去噪,减少噪声敏感。通过优化初始中心对k均值算法进行改进,优化全局搜索能力,缓解初始值的选取对聚类效果的影响。以天津港AIS数据为样本进行算法验证。结果表明,该聚类算法能准确提取和划分某水域船舶主要航迹段,算法消耗系统资源少,计算速度快。改进后的算法可为航路辨识、分道通航制定等提供理论支持。  相似文献   

20.
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号