共查询到20条相似文献,搜索用时 31 毫秒
1.
本文将数据挖掘算法应用干智能答疑系统中,提出了一套基于数据挖掘算法的答疑设计方案并加以改进,传统的K-均值算法聚类虽然速度快,在文本聚类中易于实现,但其同样依赖于所有变量,聚类效果往往不尽如人意.为了克服这一缺点,提出一种改进的K-均值文本聚类算法.它在K-均值聚类过程中,向每一个聚类簇中的关键词自动计算添加一个权重,重要的关键词赋予较大的权重.经过实验测试.获得了一种基于子空闻变量自动加权的适合文本数据聚类分析的改进算法,它不仅可以在大规模、高维和稀疏的文本数据上有效地进行聚类.还能够生成质量较高的聚类结果.实验结果表明基于子空闻变量自动加权的K-均值文本聚类算法是有效的大规模文本数据聚类算法. 相似文献
2.
无导师聚类过程中将数据集合分割成几个类是一个很难确定的问题,目前还没有较好的解决方法。文章使用粒子群优化算法应用于无导师聚类算法——K-均值的参数学习,实现了使用粒子群优化算法进行聚类中心参数的确定,旨在提供一种选择中心参数个数的方法,同时给出了适应于聚类参数学习的粒子群fitness函数算法设计。通过对UCI机器学习数据库中的7个数据库进行实验,证实此方法是比较有效的。 相似文献
3.
K-均值聚类算法是一种基于划分方法的聚类算法,本文通过对传统的K-均值聚类算法的分析,提出了一种改进的K-均值算法,并对该算法的时间复杂度和空间复杂度进行了分析。该算法在计算聚类中心点时采用了一种最近邻的思想,可以有效地去除"噪声"和"孤立点"对簇中平均值(聚类中心)的影响,从而使聚类结果更加合理。最后通过实验表明该算法的有效性和正确性。 相似文献
4.
构建医药制造业竞争力评价指标体系,运用数据挖掘技术(K-均值聚类算法)定量评价竞争力,得出相应结论,为政府和企业决策提供参考。 相似文献
5.
6.
针对传统的K-means算法运行的结果依赖于初始的聚类数目和聚类中心,本文提出了一种基于优化初始聚类中心的K-means算法.该算法通过量化样本间距离和聚类的紧密性来确定聚类数目K值;根据数据集的分布特征来选取相距较远的数据作为初始聚类中心,避免了传统K-means算法的聚类数目和聚类中心的随机选取.UCI机器学习数据... 相似文献
7.
8.
主要研究了均值聚类图像分割问题。针对传统的聚类图像分割算法对图像地分割精度较低等问题,提出一种基于模糊控制的C-均值聚类快速图像分割新方法。本文采用快速模糊C-均值聚类算法对图像分割。实验结果表明,图像分割边缘清晰,分割效果明显优于传统的聚类图像分割算法。 相似文献
9.
10.
本文提出了一种免疫克隆选择算法与模糊C-均值聚类算法相结合的混合聚类算法。首先用克隆选择算法对模糊聚类中心的个数和聚类中心的选取进行指导,然后进行聚类,是一种有监督学习和无监督学习结合的一种算法,将该算法用于汽轮机的故障诊断中,诊断结果表明,该方法能够正确地诊断出存在的故障,具有实用价值。 相似文献
11.
图书馆的读者借阅记录中通常会隐含读者的借阅兴趣和规律,如何有效地从中提取出读者对各类图书的兴趣,对读者的借阅模式加以区分,可以对图书的分类组织、图书的采购编目、以及读者服务等方面起到良好的指导作用。引入数据挖掘中的聚类思想,提出了一种基于聚类的借阅模式分析方法,在读者借阅记录上的实验表明通过读者对不同类别图书的兴趣作为度量对读者借阅模式加以区分的方法是行之有效的。 相似文献
12.
基于社会演化算法的聚类新算法 总被引:1,自引:0,他引:1
K均值聚类算法通常只能以局部最优结束,很难找到全局最优。提出了一种基于社会演化算法和K均值算法相结合的聚类新算法。在该算法中提出了认知主体在聚类中对范式学习的新的方式。实验证明该算法能大大提高聚类的效率和精度。 相似文献
13.
14.
研究高效进行数据聚类,提高数据聚类能力的问题。传统的模糊C均值算法具有对初始值和噪声极为敏感和遗传算法在局部极值点收敛的缺陷。基于模糊c均值聚类算法,提出一种改进的优化聚类算法。利用混沌序列的均匀遍历特性和差分进化算法的高效全局搜索能力,对模糊c均值算法进行改进,利用Logistics混沌映射对聚类算法进行优化搜索,把混沌扰动量引入到进化种群当中,弥补了模糊C均值算法的缺陷。采用改进的Logistics映射扰动搜索聚类算法,以目标识别为案例,综合4类目标特征参数为研究对象,开发了一套有价值的目标识别专家系统软件。仿真实验表明,改进的数据聚类算法,具有优越的数据聚类性能,聚类判断准确率提高明显,设计的专家系统软件对目标识别特征分类具有较好的准确性和可靠性,具有一定的应用价值。 相似文献
15.
16.
17.
针对现有的车辆故障挖掘方法鲁棒性、抗干扰性不强,挖掘故障的准确性不高的问题.为了提高车辆故障挖掘的准确性,提出了一种基于降维聚类算法的车辆故障挖掘技术.通过准确建立车辆行驶模型,进而进一步建立车辆特征点搜索模型,提取车辆特征点,并且降低关联特征的维度,降低干扰.利用改进的K均值聚类方法,对车辆故障进行聚类处理,迅速排除冗余特征的干扰,增加挖掘的鲁棒性,从而实现车辆故障挖掘.实验结果表明,这种算法能够对车辆故障情况进行有效挖掘,取得了令人满意的效果. 相似文献
18.
19.
模糊C-均值聚类方法研究人类活动影响下大亚湾海域水体生态环境空间分布规律,揭示大亚湾水体生态环境空间分布分成两类区域:其一为受人类活动影响为主的大鹏澳、澳头以及大亚湾东北部区域;其二为受湾外南海海水交换影响较大的大亚湾南部、中部和东部海域。模糊C-均值聚类分析作为一种数据信息提取方法,为海洋环境生态研究提供新的方法。 相似文献
20.
一种改进的模糊C-均值算法 总被引:1,自引:0,他引:1
提出一种改进的模糊C-均值算法。实现了算法中聚类数c及权指数m两个参数的确定方法。该算法能很好地实现参数快速、有效的确定。比传统FCM算法具有一定的优越性。 相似文献