共查询到20条相似文献,搜索用时 0 毫秒
1.
2.
3.
聚类分析是数据挖掘中的一个重要研究领域,面对大规模的、高维的数据,如何建立有效的聚类算法是目前一个研究热点。现已有多种直接和快速的聚类算法,但是当处理海量数据时,时间效率仍然有待提高。本文应用三角不等式原理,分别对TTSAS算法和k-means算法提出改进,避免其中冗余的距离计算,提高原算法效率。 相似文献
4.
人工神经网络与DNA序列分类问题 总被引:2,自引:0,他引:2
刘于江 《赣南师范学院学报》2004,25(3):52-54
介绍了神经网络的两种简单模型:感知器和线性分类器,并应用感知器模型对DNA序列分类问题进行求解和结果分析,并提出了对感知器模型求解分类问题的一种改进方法。 相似文献
5.
林芳 《福建工程学院学报》2007,5(4):378-381
垃圾邮件给网络及用户造成了极大的危害,严重影响人们的工作、生活和学习.文章分析传统KNN技术在进行邮件分类中存在的问题,提出用聚类技术解决问题;进一步分析一般聚类算法存在的时间性能较低特点,设计改进算法提高算法的时间性能. 相似文献
6.
7.
《荆门职业技术学院学报》2014,(2)
传统的分类算法大多假定用来学习的数据集是平衡的,但实际应用中真正面临的数据集往往是非平衡数据。针对非平衡数据,利用传统的分类方法往往不能获得良好的性能。文章提出了一种新的基于聚类的非平衡分类算法,通过聚类生成多个聚类体,在每个聚类体中选取一定数量的数据作为训练样本,有效地处理了样例数据的不平衡问题,在相关数据集上的实验验证了本方法的有效性。 相似文献
8.
《荆门职业技术学院学报》2014,(2):45-48
传统的分类算法大多假定用来学习的数据集是平衡的,但实际应用中真正面临的数据集往往是非平衡数据。针对非平衡数据,利用传统的分类方法往往不能获得良好的性能。文章提出了一种新的基于聚类的非平衡分类算法,通过聚类生成多个聚类体,在每个聚类体中选取一定数量的数据作为训练样本,有效地处理了样例数据的不平衡问题,在相关数据集上的实验验证了本方法的有效性。 相似文献
9.
运用图论中的一系列思想对生物序列、蛋白质结构和基因芯片数据进行综合分析,将多物种的序列进行聚类,为生物基因的功能研究提供了新的思路.其算法首先根据生物序列的相似度、蛋白质结构的相似度和基因芯片数据的相似度建立一级图,然后根据一级图建立二级图,进而通过二级图的分析来挖掘基因的聚类关系.算法聚类的结果可以对各种基因的功能进行预测,可广泛应用于后基因组计划的基因和蛋白质研究. 相似文献
10.
张婷 《贵阳学院学报(自然科学版)》2021,16(2):25-29
随着网上购物热潮的到来,企业拥有的客户数据激增.挖掘并分析出隐藏在客户数据中的信息,实现客户群进行划分,对提高企业盈利有显著作用.鉴于此,研究从移动策略、观察半径、概率转换函数等三个方面进行蚁群聚类算法的优化,并以蚁群聚类优化算法实现客户数据的聚类分析.研究结果显示,与标准蚁群聚类算法相比,蚁群聚类优化算法的平均错误个... 相似文献
11.
12.
13.
K-means聚类算法研究 总被引:2,自引:0,他引:2
华婷婷 《黄山高等专科学校学报》2013,(5):17-19
聚类分析是模式识别中一个重要研究领域,是一种将数据划分或分组处理的重要手段和方法.K-means算法是聚类算法中主要算法之一,文章介绍了K-means聚类算法的实现方法,并对其优点和缺点进行了详细的分析. 相似文献
14.
15.
16.
杨洁 《柳州职业技术学院学报》2013,13(3):32-36
针对RBF网络易于陷入局部最小值和网络训练时间过长的问题,引入免疫多克隆遗传算子对RBF网络的权值进行优化。仿真结果表明,采用优化后的网络模型具有更高的分类效率和准确率。 相似文献
17.
张莉 《成都教育学院学报》2009,23(4):98-100
针对网络学习者及其对案例访问的模糊性提出采用模糊聚类的方法对学习者和案例进行聚类分析。在算法中,以各学习者对案例的访问次数、时间、学习效率等刻画学习者对案例的关注程度建立模糊相似矩阵,再由平方法求出模糊等价矩阵,然后进行聚类分析。通过具体实例阐述算法的计算过程,证明算法实现的可行性和有效性。 相似文献
18.
近年来,数据挖掘技术的研究备受国内外关注,其主要原因是信息技术发展产生了大量分散的数据,迫切需要将这些数据转换成有用的信息和知识.此前的研究,主要集中于分类算法及应用方面的研究,但某些特殊领域,如生物信息学研究等,需要通过聚类方法解决一些实际问题.本文从横向深入分析了数据挖掘技术中聚类算法的发展,对层次法、划分法、模糊法,以及量子聚类、核聚类,基于密度和网格等10种聚类算法的原理、过程和特点等都进行了比较详细的分析论述. 相似文献
19.