首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 46 毫秒
1.
本文详细分析了数据流聚类算法CluStream的不足之处,如对非球形的聚类效果不好、对周期性数据的聚类变化反映不完整等,并针对这些不足提出了一种采用空间分割、组合以及按密度聚类的算法SClustream。实验结果表明,SCluStream在准确度和速度上都比CluStream有较大的提高。  相似文献   

2.
文本聚类是建立大规模文本集合的分类体系实例的有效手段之一。本文讨论了利用标准的分类测试集合进行聚类质量的量化评价的手段,选择了k-Means聚类算法、STC(后缀树聚类)算法和基于Ant的聚类算法进行了实验对比。对实验结果的分析表明,STC聚类算法由于在处理文本时充分考虑了文本的短语特性,其聚类效果较好;基于Ant的聚类算法的结果受参数输入的影响较大;在Ant聚类算法中引入文本特性可以提高聚类结果的质量。  相似文献   

3.
聚类是人类一项最基本的认识活动 ,通过适当的聚类 ,事物才便于研究 ,事物的内部规律才可能为人类所掌握。但是 ,由于人们不总是能对客观世界进行精确的描述 ,很多信息和数据都是不确定的、模糊的。为了处理模糊数据 ,把模糊性引入数据库系统中 ,从而形成了模糊关系数据库。本文对模糊关系数据库下的基于距离函数的聚类算法进行了研究 ,并通过例子来说明如何建立和应用这种数据挖掘模型  相似文献   

4.
使用调和均值的KHM聚类算法,不像KM聚类算法,具有对初始值不敏感的优点。但它作为一个基于中心聚类算法,难以摆脱早熟收敛的问题。为了克服KHM算法的不足,本文提出结合ABC和KHM的ABC-KHM混合聚类算法。在混合算法中,聚类行为可以分为两个阶段:全局搜索的ABC聚类阶段和局部求精的KHM聚类阶段。通过仿真实验,并与KHM聚类算法进行了比较,结果表明:ABC-KHM混合聚类算法,不仅对聚类初始值不敏感,而且具有较快的聚类速度、良好的全局聚类效果,是一个不错的聚类算法。  相似文献   

5.
结合K-means算法和谱聚类方法的优点,提出一种新的高光谱图像聚类方法。该方法在对高光谱图像数据进行特征降维的基础上,采用K-means算法对图像进行粗聚类处理,然后采用谱聚类方法对粗聚类结果进行较高精度的聚类。与K-means聚类算法相比,该方法有效提高了高光谱图像聚类的分类精度。对模拟数据和真实的高光谱数据的对比实验表明,相对于K-means和谱聚类方法,该方法具有良好的聚类性能。  相似文献   

6.
DBSCAN算法对输入参数Eps敏感,尤其当数据密度分布不均时,采用全局Eps导致聚类效果差;该算法对高维数据的处理能力也不理想。提出一种改进的DBSCAN算法LF-DBSCAN,结合蚁群聚类算法实现数据集的划分以获取参数Eps的值组,然后根据不同的Eps值分别调用DBSCAN算法,从而实现对非均匀数据集的聚类。实验结果表明,改进后的算法的有效性有所提高。  相似文献   

7.
在客户关系管理的流程中,由于超市的规模庞大,客户的背景、收入、年龄、教育程度、行为特征的不同,对商品的需求也呈现多层次、个性化、差异化的趋势,因此必须根据客户的特点对客户进行细分,并在此基础上对不同的细分市场提供有针对性的差异化服务。数据挖掘技术中的聚类分析,将有助于超市从堆积如山的数据中,发掘更多有利于营销的具有商业价值的信息。  相似文献   

8.
DBSCAN是一种经典的基于密度聚类算法,能够自动确定簇的数量,对任意形状的簇都能有效处理.DBSCAN算法需要人为确定Eps和minPts?2个参数,导致聚类过程需人工干预才能进行.在DBSCAN的基础上提出了SA-DBSCAN聚类算法,通过分析数据集统计特性来自动确定Eps和minPts参数,从而避免了聚类过程的人工干预,实现聚类过程的全自动化.实验表明,SA-DBSCAN能够选择合理的Eps和minPts参数并得到较高准确度的聚类结果.  相似文献   

9.
文章根据聚类分析和模糊相似矩阵理论,采用基于模糊聚类的综合排序方法,提出一种基于聚类的指标综合评价模型,并通过实例应用验证了这个模型的可用性。借助该模型对多目标决策中的决策指标项进行综合评价,可为决策者提供有效的决策依据。  相似文献   

10.
提出一种基于最近邻居距离分布的空间聚类算法——NNDDB算法.实验分析表明,与划分聚类算法CLARANS相比,NNDDB能动态地决定聚类数目且能发现任意形状的聚类;与密度聚类算法DBSCAN相比,NNDDB算法无输入参数;在效率方面,NNDDB算法对于大型数据库是有效的.  相似文献   

11.
将聚类算法应用于教学质量评价结果分析中,对教学质量评价结果各项指标进行聚类,得到不同等级的划分,并对聚类结果进行详细的分析,找出各项指标与最终评价结果间的隐含关系,改变了传统的以平均成绩排名先后来划分等级的不足。  相似文献   

12.
使用流媒体已逐渐成为网络教学软件的潮流,但该技术的时基特性和可同步植入各种数据的潜力还未得到充分重视。流媒体文件的标头结构,是流媒体文件结构的一部分。该技术在远程教学领域具有广泛的应用前景。  相似文献   

13.
高校思政课教学作为培育大学生认同主流意识形态的主渠道,发挥了重大作用。但是当下高校思政课教学在主流意识形态教育方面仍存在一些问题值得关注。分析原因,文章从高校党政领导者、高校思政课教师、大学生、思政课教学内容、教学方法和手段、教学效果评价机制等几方面对高校思政课教学中加强主流意识形态教育的进行了深入的思考。  相似文献   

14.
聚类是空间数据挖掘的主要技术之一 ,目前空间数据库的应用日益广泛 ,但空间数据有许多不同于关系数据库的特征。所以把已有的聚类算法应用到大型空间数据库中有许多缺点 ,且效率很低。因此必须借助高效的索引技术来提高空间数据的处理效率。  相似文献   

15.
为优化无线传感器网络目标跟踪的簇和簇之间的转换,控制节点间能量消耗,本文提出一种新的分簇算法。算法通过计算节点与原簇头的距离及该节点对于跟踪目标与原簇头的夹角,自组织的形成下一簇,在此过程中不用维护邻居表,亦无中央控制。仿真结果表明,本算法能够降低节点的计算复杂度,提高分簇的成功率,有效实现大规模区域的WSN跟踪。  相似文献   

16.
概率潜在语义分析(Probabilistic Latent Semantic Analysis,PLSA)中通过将文档—单词关系转变成文档—主题—单词关系对文档进行排序、过滤、分类等操作,计算量巨大。文章设计了基于MPI(Message Passing Interface)的PLSA高效并行方案,对模型系统和训练数据处理以及并行算法加以优化,提出了一种大数据条件下PLSA并行算法,解决了以往数据规模太大难以计算的问题,算法较优化前训练速度有较大提升,具有扩展性和可行性。  相似文献   

17.
相似重复记录检测是数据清洗的重要环节,大数据环境下对相似重复记录检测方法的效率和精度提出了更高的要求。文章针对大数据环境下对相似重复记录检测提出了一种聚类分组检测的KCG算法。该方法首先采用改进的K-modes聚类对大数据进行有效的分组,然后在各分组中采用Pair-wise比较算法检测出所有相似重复记录检测。实验分析结果表明,该方法对大数据环境下的相似重复记录检测的效率和精度有明显提高。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号