首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 62 毫秒
1.
提出了一种基于网格密度的聚类算法(DGCA)。该算法主要利用网格技术去除数据集中的部分孤立点或噪声数据,对类的边缘节点使用一种边缘节点判断函数进行提取,最后利用相近值的方法进行聚类。实验表明,DGCA算法能够很好地识别出孤立点或噪声,聚类结果可以达到一个较高的精度。  相似文献   

2.
现有大多数多密度聚类算法存在参数依赖性较高、精确度较低的问题。提出一种基于网格相对密度差的扩展聚类算法(ECRGDD)的改进算法,即基于动态的网格相对密度差聚类算法(CDGRDD)。CDGRDD针对ECRGDD对于中心密度大、边缘密度稀疏的类聚类效果差的问题,把初始单元网格密度定义为动态,在密度相似相邻的网格合并时加入一个距离判断条件,由此减少盲目合并的可能性。实验表明,CDGRDD能有效对多密度、任意形状的数据进行聚类。  相似文献   

3.
为了使基于网格的聚类技术适用于多密度数据集,提出一种基于局部密度的聚类算法。算法提出将数据单元格密度分类的方法,使得具有不同密度的单元格使用不同密度阈值的进行聚类。同时给出了边界单元的处理方法以提高聚类结果的精度。实验结果表明,GLD算法比其他类似算法有较高的聚类精度和效率。  相似文献   

4.
基于均匀网格的自适应密度快速聚类算法   总被引:1,自引:1,他引:0  
提出了一种基于均匀网格的自适应密度快速聚类新算法.首先引入均匀网格和边界网格概念,然后给出了网格均匀度的计算方法和自适应网格划分技术.每次聚类都从均匀度最高的网格开始逐步向周围扩展均匀网格,直到遇到边界网格为止.算法除具有一般网格聚类算法的优点外,还能自适应地发现不同密度的类及其边界,能够有效地识别孤立点并具有较好的扩展性.最后,通过实验验证了该算法的有效性.  相似文献   

5.
聚类算法是数据挖掘的核心技术,基于密度的聚类是一类已经被证明非常有效的聚类方法.与DBSCAN算法作比较,文章提出了一种基于密度的聚类算法(Clustering Using Centers and Density,CUCD).该算法是基于中心点以及密度实现的,其核心对象是根据数据分布计算出来的虚拟的点,并且核心对象的代表性随程序的执行次数而提高;经实验验证,该算法具有较好的时间效率和聚类质量.  相似文献   

6.
K-Means算法是聚类方法中常用的一种划分方法。随着数据量的增加,K-Means算法的局限性日益突出。基于网格划分的思想,提出了一种基于网格的K-Means聚类算法,该算法使用了网格技术在一定程度上去除了孤立点和噪声数据,减少了原始K-Means算法将大的聚类分开的可能。实验表明,该算法能处理任意形状和大小的聚类,对孤立点和噪声数据也能很好地识别,并且在去除孤立点和噪声数据方面可以达到较好的精度。  相似文献   

7.
针对数据流的特点,提出了一种新的网格密度结合的GCTS算法.它采用了双层架构,在线层实现了网格密度参数的自设定,离线层以网格单元的重心为中心点,建立一个最大的子网格,使候选网格中的局部密集区域转化成了密集网格.最后使用最小生成树的算法生成进行聚类结果.提高了聚类效果.  相似文献   

8.
聚类和粒度具有天然的相通性,本文探讨了基于粒度聚类算法的一般框架,并基于该框架,研究了一种基于网格密度的文本聚类算法,最后以例证说明这一方法的可行性。  相似文献   

9.
本文提出一种新的基于聚类的网格简化方法。算法的简化过程从简单模型向复杂模型过渡。算法可根据给定的误差进行简化,整个简化过程由一个八叉树进行组织,简化过程中的简化平面由模糊推理得到。该算法便于数据组织,易于精度控制。  相似文献   

10.
随着网络的普及和信息量的急剧增加,从海量数据中提取有用的数据信息已迫在眉睫。本文提出了一种基于密度偏差抽样的聚类算法,实验表明,随着信息量、数据维数的增加,该算法聚类的正确率以及对数据的处理速度都要较传统的聚类算法有所提高。  相似文献   

11.
针对粒子群优化算法存在的早熟收敛问题,提出了一种既保持粒子活性又保证粒子快速收敛于全局极值点的修补粒子群算法.在修补更新方程中设置参数以限制粒子在搜索区域内、采用减弱速度更新的策略减少速度更新的次,如果种群多样性逐步减小下限时,种群纷纷远离该最优位置,而当种群多样性逐步增大超出上限时,种群又开始向整体最优位置靠拢,从而保持了粒子的多样性.数值实验结果表明,算法在解决问题上表现出了良好的性能.  相似文献   

12.
网格中数据传输的速度对整个网格性能起着非常重要的作用,网格数据传输本质上讲是对受约束的网格环境求最大网络流的问题,文章提出了一种基于贪婪思想的受约束网格数据传输算法。该算法首先分析网络的拓扑图形,然后确定网络上链路的转发速度,生成一个带权的约束图,应用贪婪的思想逐层传递数据,当前一层数据传输发生超约束情况时,进行回退,修正上传数据传输,直到汇聚点,最终形成优化的网络流。  相似文献   

13.
关联规则是数据挖掘中一个非常重要的任务,有许多针对于关联规则的挖掘算法,然而需要提高算法的有效性来处理现实世界中的数据集。基于聚类的关联规则挖掘算法法通过扫描数据库创建聚类表,将收集的事务记录放入聚类表中,通过局部聚类表的约束来产生频繁项集,不仅可以剪枝候选项集,降低数据扫描的时间,而且确保挖掘结果集的正确性。实验结果表明,基于聚类的关联规则挖掘算法比Apfiori算法有更高的执行效率。  相似文献   

14.
P2P与网格都是新型的分布式计算模型,在分析现有网格动态资源发现机制的基础上,将P2P的相关技术引入其中,提出了一种基于DHT的网格动态资源查找算法.该算法结合DHT技术和泛洪式查找技术,在实际的分布式网络之上建立一层结构化的Overlay层.实验结果表明,当用户需要在系统中获取信息时,通过该查找算法,查询只在一些特定的结点上进行,这样就避免了泛洪式查找的盲目性,因此大大提高了信息搜索的效率.  相似文献   

15.
针对单优先级数据分发任务调度算法存在的缺陷,依据网格任务分发服务质量(QoS)效益函数理论,运用加权法将网格系统的性能指标转化为加权效益和函数,将加权效益和函数作为启发式函数,设计了一种基于效益函数的任务调度算法对数据分发任务进行调度,并进行仿真实验。结果表明,该算法弥补了只考虑单优先级数据分发任务调度算法的缺陷,具有一定的实用性。  相似文献   

16.
东巴文字作为人类早期的一种向象形文字、标音文字过渡的图画文字形式,既具有图画文字以图表意特点,又具有现代文字使用简单线条表达含义的特点。东巴文字本身的复杂性使其相关研究一直较少且连贯性不强。从东巴文字的构字要素入手,通过分析东巴文字的组成要素、结构特征及造字习惯,给出适用于东巴象形文字的预处理及基于网格分解的分类识别算法。该算法思路简单、复杂度低、易于实现,能够快速实现不同类型东巴文字的检索和识别,具有较好的缩放和平移不变性,从而为东巴文字的造字研究提供强有力的技术支持,也为研究其它象形文字的检索和识别技术提供重要参考。  相似文献   

17.
提出了一种基于正余弦算法(Sine-Cosine Algorithm,SCA)的电网故障诊断方法。SCA算法采用正弦函数与余弦函数实现迭代运算,结构简单、搜索快速、易于实现。根据电网故障诊断问题的特点设计了二进制SCA算法,通过单重故障、多重故障并伴有保护和断路器不正确动作的多个算例,从准确性、快速性、收敛性等多个角度对比分析了SCA故障诊断方法的有效性。仿真结果表明,与遗传算法和粒子群算法相比,SCA算法可以快速获得更加准确的诊断结果,且合理的算法参数设置对诊断结果产生重要影响。  相似文献   

18.
总结了数据挖掘的基本方法、文本数据挖掘的关键技术,讨论了文本挖掘的定义和文本分类的一些形式,并对文本数据的数据挖掘算法进行了研究。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号