首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
文章提出了一种基于高斯核的KSOFM聚类算法,通过核函数将输入空间中的样本映射到高维特征空间中,并在特征空间中进行聚类。核函数的应用使得在原空间中未曾体现的信息得以展现并被聚类算法所运用,使得聚类算法在性能上有较高的提升。  相似文献   

2.
针对FCM(模糊C均值聚类算法)对初始聚类中心的选取敏感以及梯度法易收敛到鞍点,在此基础上提出了一种分层遗传算法(HGA)优化的核模糊C均值聚类算法(HGA-KFCM)来提升聚类性能,首先用分层遗传算法(HGA)在全局筛选出高品质聚类中心以替代FCM的随机产生的聚类中心,再利用高斯径向核函数改变FCM中的距离函数并且重...  相似文献   

3.
对大数据的分层建树聚类,提高对大数据的检测和大数据应用系统的故障分析能力。传统方法中对大数据的分层聚类采用K-Means聚类算法,容易陷入局部收敛,聚类效果不好。提出一种基于核向量机的数据的分层建树聚类。采用四叉树算法对多维数据进行数据预处理,进行KNN中心区域的聚类中心扩展处理,针对大数据的类域交叉性进行了一次核向量机差分比较,得到KNN模糊划分矩阵,根据所属类别的不同对已知样本进行分层,得到一维差分分层建树模型和二维差分分层建树模型,计算数据核向量之间的相似度特征,实现矩阵的数据点数模糊集合贴近度填充,实现聚类算法改进。仿真结果表明,该算法具有优越的大数据聚类性能,收敛性好,应用到网络在线故障诊断中,实现对故障信号的和恢复跟踪,提高了故障诊断效益,展示了较好的应用价值。  相似文献   

4.
黄旭  马凯 《大众科技》2011,(2):65-66
传统的聚类算法在处理复杂特征数据时效果不理想,为此提出使用高斯径向基核函数将原空间上的数据映射到高维特征空间后,再用蚂蚁算法进行第一次聚类,针对第一次聚类结果得到较多簇等问题,提出再用马赛克算法进行二次聚类,得到较为接近真实情况的簇数目。  相似文献   

5.
郭文娟 《科技风》2022,(4):63-65
针对传统的K-means算法运行的结果依赖于初始的聚类数目和聚类中心,本文提出了一种基于优化初始聚类中心的K-means算法.该算法通过量化样本间距离和聚类的紧密性来确定聚类数目K值;根据数据集的分布特征来选取相距较远的数据作为初始聚类中心,避免了传统K-means算法的聚类数目和聚类中心的随机选取.UCI机器学习数据...  相似文献   

6.
随着数据库技术的不断发展,现有的聚类分析算法已经无法满足数据挖掘的聚类分析的需求。本文主要针对传统的模糊C聚类算法,将其中存在的问题进行改进,并在核函数和权值优化的基础上,提出模糊C聚类算法。首先对模糊C聚类算法的特征权值进行优化,然后引入核函数的概念,对模糊C聚类算法的寻优过程进行改进。仿真验证得到的结果是,本文所提出的模糊C聚类算法,能够在核函数和权值优化上有更好和更加稳定的聚类。  相似文献   

7.
李雷 《科技风》2013,(6):120
针对FCM算法主要应用于点数据聚类,不能直接处理关系型数据的缺点。本文提出了一种基于Web日志的数据挖掘聚类算法,首先对FCM算法进行改进使其能够处理关系型数据,并对算法进行了健壮性改进。然后针对传统FCM算法需要在没有先验知识的基础上,事先确定聚类类别数的缺点,引入了竞争凝聚算法(CA),与FCM算法相结合,形成了CA-FCM算法,使之能够自动确定最佳分类类别数。实验表明,CA-FCM算法的挖掘结果与FCM算法的结果相近,在用户访问会话数量不太大时性能优于FCM算法。  相似文献   

8.
针对K-means聚类算法无法确定k值,并容易忽视在多维角度下进行聚类的缺点,本文提出了改进的多维度的加权的算法,在自适应K-means聚类算法的基础上引入了视图权重和变量权重,得到了包含多层变量的目标函数,通过数学证明使得目标函数最小化,得到最优的聚类效果。实验采用3个标准数据集作为聚类研究的对象,通过与FCM算法比较,说明了本文算法在聚类方面具有良好的效果。  相似文献   

9.
利用粒子群优化算法(PSO)强大的全局搜索能力,提出了用PSO算法优化FCM聚类中心的方法,有效地避免了传统的FCM由于初始值及噪声的影响,容易陷入局部最优的不足,同时图像分割的效果得到了提高,性能比传统的FCM方法更加稳定。实验结果表明,该方法在图像分类中的应用效果较好。  相似文献   

10.
针对变压器红外检测中存在图像清晰度不足、故障位置指示不明显的问题。本文提出将改进稳健模糊核聚类算法(IRKFCM)应用到散热器红外检测图像分割中,以提高散热器的故障诊断正确率。通过将红外设备采集到的散热器实时图像信息融入到改进的稳健模糊核聚类算法,根据图像所包含的灰度信息和空间信息对其进行进行区域分割,并引入聚类中心的初始化方法有效减少迭代次数,增强算法的稳健性。实验表明该算法相对于FCM分割算法能准确有效地分割出有故障的散热器片和位置,精度满足系统要求。  相似文献   

11.
核聚类算法研究   总被引:1,自引:0,他引:1  
徐小峰  朱杰  张舒 《大众科技》2010,(9):24-24,23
聚类算法是数据挖掘的基本算法之一,核聚类方法通过引入核方法,把输入空间的数据非线性映射到高维特征空间,增加了数据点的线性可分概率,扩大数据类之间的差异,使得到的聚类结果更准确的反应分布的情况。  相似文献   

12.
针对客户行为的不确定性和模糊性,将模糊聚类集成技术应用于CRM中的客户细分研究,以提高客户聚类的精度.以模糊C均值(FCM)算法作为基本的聚类器,应用模糊t-范式对生成的多个聚类器进行集成,从而获得最终的客户聚类结果.最后,在1O个UCI数据集上进行聚类测试,结果表明,基于模糊t-范式的模糊聚类集成方法的聚类精度要高于常用的客户聚类FCM和K-means方法.在客户信用卡数据集Australian上的学习曲线还表明,聚类集成方法具有更稳定的聚类性能.  相似文献   

13.
为了满足手绘图案绘制的个性化需求,提高手绘图案绘制的效率,本文从手绘图案的特征入手,以矢量图元素为输入值,提出了一种基于矢量图元素聚类的手绘图案绘制算法。首先依照视觉特征对样本图案中的矢量图元素进行聚类,并分别提取样本图案中元素分布的整体和局部特征,然后从矢量图元素分布开始,分两个阶段对手绘图案的不同特征进行优化,以使优化后的图案与样本图案具有很高的视觉相似性,先对图案中元素类型比例和相邻关系进行优化,再对相邻元素间的距离进行调整,以更好的控制图案中矢量图元素之间的距离这一重要视觉特征。通过实例仿真实验表明,本文提出的基于矢量图元素聚类的手绘图案绘制算法在实际应用过程中,绘制效果良好。  相似文献   

14.
提出改进的并行化谱聚类算法。该算法对于距离矩阵与相似度矩阵进行了改进,并在其中加入了kd树技术以对大规模数据进行稀疏化处理;然后在进行数据特征计算时,将数据以拉普拉斯矩阵的方式存入Hadoop之中,通过运行Lanczos分布计算的形式得到了其向量特征;最后运用在聚类算法中的较为高效的k-means聚类算法对向量特征的转置矩阵进行处理从而得到了需要的聚类结果。仿真实验结果表明,本文所提出的谱聚类并行算法能够为大规模的数据挖掘工作带来性能的巨大提升。  相似文献   

15.
基于多因素方差分析的文本向量特征挖掘算法   总被引:2,自引:0,他引:2  
文本向量特征挖掘应用于信息资源组织和管理领域,在大数据挖掘领域具有较大应用价值,传统算法精度不好。提出一种基于多因素方差分析的文本向量特征挖掘算法。使用多因素方差分析方法得到多种语料库的特征挖掘规律,结合蚁群算法,根据蚁群适应度概率正则训练迁移法则,得到种群进化最近时刻获得的数据集有效特征概率最大值,基于最优划分的K-means初始聚类中心选取算法,先对数据样本进行划分,然后根据样本分布特点来确定初始聚类中心,提高文本特征挖掘性能。仿真结果表明,该算法提高了文本向量特征的聚类效果,进而提高了特征挖掘性能,具有较高的数据特征召回率和检测率,时间耗时较少,在数据挖掘等领域应用价值较大。  相似文献   

16.
二阶锥规划是在有限个二次锥的笛卡尔空间仿射变换交集上的极小化和极大化线性函数,采用修正的二阶锥规划模型,结合二阶锥的凸优化条件,进行大数据聚类算法改进,提高数据的聚敛性。传统方法中对大数据聚类的二阶锥规划模型采用线性对偶锥规划方法,对数据聚类的路径跟踪性能不好。提出一种基于修正的齐次二阶锥规划模型的大数据聚类算法。进行数据的特征挖掘和信息流模型构建,从大量的、有噪声的、模糊的数据中进行大数据的功率谱密度特征提取,采用粗糙概念格方法对大数据信息流进行二阶锥规划模型构建,结合齐次二阶锥规划模型算法有限收敛性,对每一数据聚类样本进行可靠性衡量,实现数据聚类中心的准确搜索。对聚类误差函数求最优解,使得误差收敛到零。仿真结果表明,该算法进行数据聚类的精度较高,收敛性较好,避免了出现局部最优解,性能优越于传统算法。  相似文献   

17.
基于模糊商空间的模糊C-均值算法(QFCM)是在模糊商空间和模糊模糊C-均值(FCM)的基础上提出的。通过引入相似函数并构造出归一化距离,得到模糊商空间的分层递阶的结构,在此基础上提出了基于粒度思想的准则函数并选择出一个最佳层次,从而确定聚类的个数,并选择具有相似度高的样本作为初始聚类中心,结合鲁棒性统计观点运用归一化距离来替代FCM目标函数中的欧式距离度量,提出了QFCM算法。实验证明与传统的算法比较,QFCM算法能够自动确定最佳聚类数目,发现大小不均的聚类,迭代次数少,有效地消除了传统FCM算法对初始值敏感,提高了算法的稳定性和准确率。  相似文献   

18.
对海量数据信息进行迭代聚类能够为数据挖掘提供准确的依据,具有重要的应用价值。传统算法对于初始参数的选取过于敏感,从而降低了迭代聚类的准确率。提出基于并归聚类的海量数据信息中的迭代聚类方法。采用离差隶属度进行数据信息聚类中心的计算,确定数据信息的聚类中心;采用类间距离作为并归聚类判别的标准,用于判定数据信息特征与聚类中心的距离;对海量数据信息特征与聚类中心的计算结果进行归类处理,直至所有的数据信息的聚类中心都结束并归,从而获得准确的迭代聚类结果。仿真实验结果表明,改进算法能够提高海量数据信息中的迭代聚类结果,效果令人满意。  相似文献   

19.
模糊支持向量机(FSVM)具有很好的抗噪声能力,受到了很多专家的重视。然而模糊支持向量机算法的时间复杂度通常较高。针对这一不足,本文提出了一种基于核聚类的模糊支持向量机算法。首先根据核聚类算法对每一类原始样本进行聚类,然后对每一簇求样本中心,用样本中心作为新的样本点替换该类别的原始样本。最后本文算法利用中心距离型计算新样本的模糊权重,并利用模糊支持向量机算法进行求解。实验充分验证了本文算法相对于传统模糊支持向量机方法具有更快的分类速度。  相似文献   

20.
聂珍  王华秋 《现代情报》2012,32(7):112-116,121
本文采取了3种必要的措施提高了聚类质量:考虑到各维数据特征属性对聚类效果影响不同,采用了基于统计方法的维度加权的方法进行特征选择;对于和声搜索算法的调音概率进行了改进,将改进的和声搜索算法和模糊聚类相结合用于快速寻找最优的聚类中心;循环测试各种中心数情况下的聚类质量以获得最佳的类中心数。接着,该算法被应用于图书馆读者兴趣度建模中,用于识别图书馆日常运行时各读者借阅图书的类型,实验表明该算法较其它算法更优。这样的读者兴趣度聚类分析可以进行图书推荐,从而提高图书馆的运行效率。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号