首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
许多现实应用中,由于数据流的特性,使人们难以获得全部数据的类标签。为了解决类标签不完整数据流的分类问题,本文首先分析了有标签数据集对基于聚类假设半监督分类算法分类误差的影响;然后,利用分类误差影响分析以及数据流的特点,提出一种基于聚类假设半监督数据流集成分类器算法(semi-supervised data stream ensemble classifiers under the cluster assumption,SSDSEC),并针对个体分类器的权值设定进行了探讨;最后,利用仿真实验验证本文算法的有效性。  相似文献   

2.
限制性聚类是一种试图将用户监督信息加入到已有聚类算法中的一种分类技术,目前已经被广泛应用于K-means算法和层次聚类算法中.在本文中,提出一种将限制条件加入到谱聚类算法的半监督聚类方法,利用正约束和负约束限制来构造约束矩阵,通过它们来引导聚类过程,并结合最优化技术,达到聚类的目的.数据实验验证了这种方法具有很好的精确度.  相似文献   

3.
本文提出了一种免疫克隆选择算法与模糊C-均值聚类算法相结合的混合聚类算法。首先用克隆选择算法对模糊聚类中心的个数和聚类中心的选取进行指导,然后进行聚类,是一种有监督学习和无监督学习结合的一种算法,将该算法用于汽轮机的故障诊断中,诊断结果表明,该方法能够正确地诊断出存在的故障,具有实用价值。  相似文献   

4.
针对II型糖尿病风险评估过程中血液检测成本高,标记数据获取困难的问题,提出一种基于半监督聚类的II型糖尿病风险分级方法。该方法首先通过最大化最小距离的思想,利用改进的KKZ方法初始化类心;并在聚类过程中引入软约束,构造半监督聚类模型,能够将人群划分为无风险、低风险、中风险、高风险四个风险等级。经实验测试,本方法的灵敏度相比于对比算法的灵敏度至少提高10%,能够有效地划分II型糖尿病的风险等级,为进一步诊断提供指导意见。  相似文献   

5.
为提高入侵检测的检测率,降低误检率,结合半监督方法和模糊聚类的样本选择属性约简的入侵检测方法,对数据预处理之后,利用半监督模糊聚类选择样本,再对样本进行基于属性依赖度的约简。利用KDD99数据集仿真实验,结果表明,检测效率有了很大提高。  相似文献   

6.
郭文娟 《科技风》2022,(4):63-65
针对传统的K-means算法运行的结果依赖于初始的聚类数目和聚类中心,本文提出了一种基于优化初始聚类中心的K-means算法。该算法通过量化样本间距离和聚类的紧密性来确定聚类数目K值;根据数据集的分布特征来选取相距较远的数据作为初始聚类中心,避免了传统K-means算法的聚类数目和聚类中心的随机选取。UCI机器学习数据库数据集的实验证明,本文所提出的改进的聚类算法获得了良好的聚类效果,同时获得较高的聚类准确率。  相似文献   

7.
线性判别分析(LDA)具有很好的分类性能,但是计算复杂度一般较高。为了有效地降低LDA算法的计算复杂度,本文提出了一种基于k-means聚类的快速学习算法。该算法首先根据k-means聚类算法对原始样本进行聚类,计算聚类簇的样本中心作为新训练样本,然后再利用LDA算法进行分类。由于通过聚类算法有效地压缩了训练样本集的规模,因此算法具有更高的效率。在语音识别数据集上的实验充分验证了本文算法具有较好的分类性能,而且效率更高。  相似文献   

8.
通过研究聚类算法在图像处理上的应用,提出了一种基于高斯混合模型聚类的图像检索方法。该检索方法首先提取每幅图像的特征,并以特征值为数据集建立高斯混合模型,得到所有图像的高斯混合模型。再以所有图像的混合模型参数集作为数据集,用基于高斯混合模型的聚类算法进行聚类。最后输出检索例图所在的类,即得到检索结果。  相似文献   

9.
目前提出的大多数聚类融合算法在策略选择上未能同时兼顾聚类成员的多样性及质量,而且对高维数据的聚类结果均不理想,针对以上问题,本文提出一种改进的投影聚类融合算法,该算法主要在以往经典的投影聚类算法的基础上进行了改进,将投影聚类与分形维数结合,可对高维数据集进行降维聚类处理;而且该算法将选出最优参照成员,并设计出合理的选择策略,对部分优质成员进行选择,以得到一个更加准确的最终结果。高维数据聚类仿真实验结果表明,本文提出的改进的投影聚类融合算法与其他经典数据聚类融合算法相比,提高了聚类的有效性,大大提高了数据融合性能。  相似文献   

10.
提出一种新的选择性聚类融合算法,该算法主要基于分形维数来处理一些高维数据,选择策略则是主要基于互信息,考虑到已选聚类成员的重要程度与聚类成员的质量和多样性,此算法比较适用的数据聚集类为任意形状的,聚类融合可通过加权定义实现。仿真实验中在UCI数据集环境运用本文提出的选择性聚类融合算法,实验结果表明该算法具有良好的有效性。  相似文献   

11.
针对K-means聚类算法无法确定k值,并容易忽视在多维角度下进行聚类的缺点,本文提出了改进的多维度的加权的算法,在自适应K-means聚类算法的基础上引入了视图权重和变量权重,得到了包含多层变量的目标函数,通过数学证明使得目标函数最小化,得到最优的聚类效果。实验采用3个标准数据集作为聚类研究的对象,通过与FCM算法比较,说明了本文算法在聚类方面具有良好的效果。  相似文献   

12.
介绍了自适应近邻聚类算法的原理,并对算法中的几个名词进行了解释;分别采用自适应近邻聚类与K-Means聚类对半月形数据集进行了实验演示;将自适应近邻聚类与个性化推荐系统相结合,采用自适应近邻聚类对某高校3个专业65名学生读者的借阅记录数据进行聚类处理,验证了相同专业读者具有相似借阅行为这一规律,进而说明了该算法应用在个性化推荐中有效可行。自适应聚类是一种优秀的聚类算法,在实际数据聚类应用中具有良好的效果。  相似文献   

13.
提出了一种自动化的网格聚类算法GAC。该算法主要采用密度阈值技术提取不同的类,使用边界点处理技术提高聚类精度。GAC算法只要求对数据集进行一遍扫描。实验表明,该算法可扩展性好,能处理任意形状和大小的聚类,能够很好地识别出孤立点或噪声,在处理多密度聚类方面有很好的精度。  相似文献   

14.
提出基于半监督混合模型的海量入侵数据检测方法。利用蚁群算法进行入侵数据的特征选择,在结合半监督的混合模型分类方法进行入侵数据的分类,利用混合模型对数据样本空间的聚类分布进行描述,利用数据函数将聚类的信息与分类算法相结合,进行数据分类时对没有标示的数据样本进行考虑,对入侵数据进行检测。克服传统方法存在的弊端,提高了分类器的泛化能力,保证数据分类的效果,提高了入侵数据检测的准确性,完成对大数据环境下网络主动入侵海量数据检测的研究。实验的结果表明,利用本文方法能有效地提高入侵数据检测的准确性。  相似文献   

15.
文本自动聚类技术研究   总被引:1,自引:0,他引:1  
自动聚类作为一种自动化程度较高的无监督机器学习技术,在信息检索和数据挖掘领域得到了广泛的应用.探讨了文本聚类的定义和步骤,依据文本自动聚类的步骤分别对文本的处理、自动聚类算法以及文本聚类结果的评价进行了阐述.  相似文献   

16.
针对FCM(模糊C均值聚类算法)对初始聚类中心的选取敏感以及梯度法易收敛到鞍点,在此基础上提出了一种分层遗传算法(HGA)优化的核模糊C均值聚类算法(HGA-KFCM)来提升聚类性能,首先用分层遗传算法(HGA)在全局筛选出高品质聚类中心以替代FCM的随机产生的聚类中心,再利用高斯径向核函数改变FCM中的距离函数并且重新定义目标函数,最终根据新参数进行迭代流程。在仿真实验中用两种数据集作为实验数据,利用FCM、HGA-KFCM以及其他三种聚类算法进行聚类测试,结果显示HGA-KFCM在一定程度上解决了FCM的缺陷,此外将新算法与另外三种性能不错的聚类算法在抗局部收敛能力,迭代次数和精度上比较,结果显示新算法具有良好的聚类性能。  相似文献   

17.
针对客户行为的不确定性和模糊性,将模糊聚类集成技术应用于CRM中的客户细分研究,以提高客户聚类的精度.以模糊C均值(FCM)算法作为基本的聚类器,应用模糊t-范式对生成的多个聚类器进行集成,从而获得最终的客户聚类结果.最后,在1O个UCI数据集上进行聚类测试,结果表明,基于模糊t-范式的模糊聚类集成方法的聚类精度要高于常用的客户聚类FCM和K-means方法.在客户信用卡数据集Australian上的学习曲线还表明,聚类集成方法具有更稳定的聚类性能.  相似文献   

18.
为中文搜索引擎返回结果的每一条记录构建一种修改的PAT-tree结构,为整个返回结果集构建修改的整体PAT-tree结构.通过计算PAT-tree中有效节点代表短语的排序权值函数,提取基本聚类.使用与STC框架相似的聚类算法得出最后的聚类.实验表明该算法能很好地完成中文搜索引擎结果的聚类.  相似文献   

19.
SA-DBSCAN:一种自适应基于密度聚类算法   总被引:10,自引:0,他引:10  
DBSCAN是一种经典的基于密度聚类算法,能够自动确定簇的数量,对任意形状的簇都能有效处理.DBSCAN算法需要人为确定Eps和minPts?2个参数,导致聚类过程需人工干预才能进行.在DBSCAN的基础上提出了SA-DBSCAN聚类算法,通过分析数据集统计特性来自动确定Eps和minPts参数,从而避免了聚类过程的人工干预,实现聚类过程的全自动化.实验表明,SA-DBSCAN能够选择合理的Eps和minPts参数并得到较高准确度的聚类结果.  相似文献   

20.
提出基于非线性Kdv-KSV方程平衡泛函的优化聚类算法,运用非线性kdv-ksv方程式定义映射集范数设置初始类聚中心,通过泛函空间完成聚类数据的中心向量数域计算,划分聚类数据目标函数,利用隶属矩阵判断划分得到最优聚类的过程。仿真实验表明,基于非线性Kdv-KSV方程平衡泛函的优化聚类算法,数据收敛速度更快,动态特性跟踪效果更好,并且降低了聚类计算对初始值的依赖性。提高了处理高维数据的能力。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号