首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
本文将数据挖掘算法应用干智能答疑系统中,提出了一套基于数据挖掘算法的答疑设计方案并加以改进,传统的K-均值算法聚类虽然速度快,在文本聚类中易于实现,但其同样依赖于所有变量,聚类效果往往不尽如人意.为了克服这一缺点,提出一种改进的K-均值文本聚类算法.它在K-均值聚类过程中,向每一个聚类簇中的关键词自动计算添加一个权重,重要的关键词赋予较大的权重.经过实验测试.获得了一种基于子空闻变量自动加权的适合文本数据聚类分析的改进算法,它不仅可以在大规模、高维和稀疏的文本数据上有效地进行聚类.还能够生成质量较高的聚类结果.实验结果表明基于子空闻变量自动加权的K-均值文本聚类算法是有效的大规模文本数据聚类算法.  相似文献   

2.
湛燕  陈昊 《大众科技》2010,(6):63-64
无导师聚类过程中将数据集合分割成几个类是一个很难确定的问题,目前还没有较好的解决方法。文章使用粒子群优化算法应用于无导师聚类算法——K-均值的参数学习,实现了使用粒子群优化算法进行聚类中心参数的确定,旨在提供一种选择中心参数个数的方法,同时给出了适应于聚类参数学习的粒子群fitness函数算法设计。通过对UCI机器学习数据库中的7个数据库进行实验,证实此方法是比较有效的。  相似文献   

3.
K-均值聚类算法是一种基于划分方法的聚类算法,本文通过对传统的K-均值聚类算法的分析,提出了一种改进的K-均值算法,并对该算法的时间复杂度和空间复杂度进行了分析。该算法在计算聚类中心点时采用了一种最近邻的思想,可以有效地去除"噪声"和"孤立点"对簇中平均值(聚类中心)的影响,从而使聚类结果更加合理。最后通过实验表明该算法的有效性和正确性。  相似文献   

4.
构建医药制造业竞争力评价指标体系,运用数据挖掘技术(K-均值聚类算法)定量评价竞争力,得出相应结论,为政府和企业决策提供参考。  相似文献   

5.
模糊c均值聚类在wav格式音频检索中的研究   总被引:1,自引:0,他引:1  
应用模糊c均值聚类方法对wav格式的音频检索。不同于以前为音频建模和分类的监督机制,而是通过对音频数据的特征进行模糊聚类形成聚类质心,根据聚类质心的相似度匹配来实现非监督机制的音频检索,并优化参数以提高检索准确度。  相似文献   

6.
郭文娟 《科技风》2022,(4):63-65
针对传统的K-means算法运行的结果依赖于初始的聚类数目和聚类中心,本文提出了一种基于优化初始聚类中心的K-means算法.该算法通过量化样本间距离和聚类的紧密性来确定聚类数目K值;根据数据集的分布特征来选取相距较远的数据作为初始聚类中心,避免了传统K-means算法的聚类数目和聚类中心的随机选取.UCI机器学习数据...  相似文献   

7.
针对FCM(模糊C均值聚类算法)对初始聚类中心的选取敏感以及梯度法易收敛到鞍点,在此基础上提出了一种分层遗传算法(HGA)优化的核模糊C均值聚类算法(HGA-KFCM)来提升聚类性能,首先用分层遗传算法(HGA)在全局筛选出高品质聚类中心以替代FCM的随机产生的聚类中心,再利用高斯径向核函数改变FCM中的距离函数并且重...  相似文献   

8.
任燕 《科技通报》2012,28(4):206-208
主要研究了均值聚类图像分割问题。针对传统的聚类图像分割算法对图像地分割精度较低等问题,提出一种基于模糊控制的C-均值聚类快速图像分割新方法。本文采用快速模糊C-均值聚类算法对图像分割。实验结果表明,图像分割边缘清晰,分割效果明显优于传统的聚类图像分割算法。  相似文献   

9.
基于主成分和聚类分析的图书馆服务效率综合评价   总被引:1,自引:0,他引:1  
论述了主成分分析和K-均值聚类分析方法.选取具有8指标的10个图书馆样本数据,利用Matlab进行主成分分析,得到4个综合评价指标及其名次评价结果,利用K-均值聚类分析方法给出聚类结果.结果表明该方法能从众多因素中发现影响图书馆服务效率评价的主要因素,确保了评价的客观准确性;在大样本情况下由于维数下降,计算复杂度大大降低.  相似文献   

10.
本文提出了一种免疫克隆选择算法与模糊C-均值聚类算法相结合的混合聚类算法。首先用克隆选择算法对模糊聚类中心的个数和聚类中心的选取进行指导,然后进行聚类,是一种有监督学习和无监督学习结合的一种算法,将该算法用于汽轮机的故障诊断中,诊断结果表明,该方法能够正确地诊断出存在的故障,具有实用价值。  相似文献   

11.
图书馆的读者借阅记录中通常会隐含读者的借阅兴趣和规律,如何有效地从中提取出读者对各类图书的兴趣,对读者的借阅模式加以区分,可以对图书的分类组织、图书的采购编目、以及读者服务等方面起到良好的指导作用。引入数据挖掘中的聚类思想,提出了一种基于聚类的借阅模式分析方法,在读者借阅记录上的实验表明通过读者对不同类别图书的兴趣作为度量对读者借阅模式加以区分的方法是行之有效的。  相似文献   

12.
基于社会演化算法的聚类新算法   总被引:1,自引:0,他引:1  
郝占刚  王正欧 《情报杂志》2006,25(5):5-6,10
K均值聚类算法通常只能以局部最优结束,很难找到全局最优。提出了一种基于社会演化算法和K均值算法相结合的聚类新算法。在该算法中提出了认知主体在聚类中对范式学习的新的方式。实验证明该算法能大大提高聚类的效率和精度。  相似文献   

13.
讨论了聚类分析及文本挖掘,分析了一种用模拟退火思想改进的K均值聚类算法在文本挖掘中的应用。传统的信息检索技术已经不适应日益增加的、大量文本数据处理的需求。如何从数据中分析和提取有用信息即文本挖掘已经成为数据挖掘中日益流行与重要的研究课题。  相似文献   

14.
研究高效进行数据聚类,提高数据聚类能力的问题。传统的模糊C均值算法具有对初始值和噪声极为敏感和遗传算法在局部极值点收敛的缺陷。基于模糊c均值聚类算法,提出一种改进的优化聚类算法。利用混沌序列的均匀遍历特性和差分进化算法的高效全局搜索能力,对模糊c均值算法进行改进,利用Logistics混沌映射对聚类算法进行优化搜索,把混沌扰动量引入到进化种群当中,弥补了模糊C均值算法的缺陷。采用改进的Logistics映射扰动搜索聚类算法,以目标识别为案例,综合4类目标特征参数为研究对象,开发了一套有价值的目标识别专家系统软件。仿真实验表明,改进的数据聚类算法,具有优越的数据聚类性能,聚类判断准确率提高明显,设计的专家系统软件对目标识别特征分类具有较好的准确性和可靠性,具有一定的应用价值。  相似文献   

15.
基于支持向量机的电信客户欠费评估   总被引:1,自引:0,他引:1  
应用基于风险最小化原理的支持向量机,研究了电信客户欠费分类问题,并与K-均值聚类法、三层人工神经网络进行对比研究,发现支持向量机分类正确率平均为95.48%,K-均值聚类法为83.87%,三层BP人工神经网络为89.80%.结果表明支持向量机能够更好的反映电信客户欠费分类,是一种研究电信客户欠费分类问题的有效方法。  相似文献   

16.
在K-均值聚类分析算法和网格聚类算法基础上,对两种算法进行整合并提出了一种新的KG.CA聚类分析算法。通过对计算密度阀值的函数的改进,本文提出了一种基于网格的K-均值聚类分析算法。最后通过详细的数据分析和计算验证KGCA聚类分析算法可以有效降低凝聚度,和提高分离度从而有效提高聚类效率。  相似文献   

17.
马丽 《科技通报》2013,29(2):166-168
针对现有的车辆故障挖掘方法鲁棒性、抗干扰性不强,挖掘故障的准确性不高的问题.为了提高车辆故障挖掘的准确性,提出了一种基于降维聚类算法的车辆故障挖掘技术.通过准确建立车辆行驶模型,进而进一步建立车辆特征点搜索模型,提取车辆特征点,并且降低关联特征的维度,降低干扰.利用改进的K均值聚类方法,对车辆故障进行聚类处理,迅速排除冗余特征的干扰,增加挖掘的鲁棒性,从而实现车辆故障挖掘.实验结果表明,这种算法能够对车辆故障情况进行有效挖掘,取得了令人满意的效果.  相似文献   

18.
分析和研究了粗糙集和模糊聚类两种常用的数据挖掘算法,将其应用到图书馆个性化服务中,建立了一个基于数据挖掘的图书馆个性化服务系统,并对我院图书馆借阅数据进行了分析,为图书馆个性化服务提出了一种新的研究思路和分析方法。  相似文献   

19.
杨志浩  刘基 《科技广场》2010,(1):211-214
模糊C-均值聚类方法研究人类活动影响下大亚湾海域水体生态环境空间分布规律,揭示大亚湾水体生态环境空间分布分成两类区域:其一为受人类活动影响为主的大鹏澳、澳头以及大亚湾东北部区域;其二为受湾外南海海水交换影响较大的大亚湾南部、中部和东部海域。模糊C-均值聚类分析作为一种数据信息提取方法,为海洋环境生态研究提供新的方法。  相似文献   

20.
一种改进的模糊C-均值算法   总被引:1,自引:0,他引:1  
提出一种改进的模糊C-均值算法。实现了算法中聚类数c及权指数m两个参数的确定方法。该算法能很好地实现参数快速、有效的确定。比传统FCM算法具有一定的优越性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号