首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
搜索引擎是目前最主要的WWW信息检索的工具,然而,用户对当前搜索引擎的检索效果并不满意.论文给出了基于文档文本内容和文档间超链信息的混合相似度计算方法,并给出了基于混合相似度的模糊(软)聚类算法HTSC.对HTSC算法进行了理论分析,并对其中的核心算法进行了初步的实验验证.该算法可对搜索引擎返回的结果进行模糊聚类,以方便用户从中找到真正需要的信息.  相似文献   

2.
针对核模糊C-均值聚类算法中隶属度的计算特点,提出了一种改进的核模糊C-均值算法。改进后的算法是,在更新对象类的隶属度之前先判断对象是否可能属于该类。如果对象可能属于该类,则为其分配一个大于0的隶属度,否则直接将其隶属度置为0。针对不同测试数据集的实验结果表明,改进后的核模糊C 均值算法提高了聚类效果,是一种可行有效的算法。  相似文献   

3.
针对传统的模糊聚类算法(FCM)的不足,提出了具体的改进和提高方法,通过修改聚类目标函数来提高算法处理噪音点的能力和体现样本空间各维度对聚类效果的价值。最后通过实验比较证明了算法的有效性。  相似文献   

4.
根据(V)cso-new对(V)cso有效性指标的改进思想,对分离度进行了新的定义,并提出了一种新的模糊聚类有效性指标,理论证明和实验分析说明了该有效性指标的可靠性.  相似文献   

5.
聚类分析是一种有效的入侵检测方法.可以从网络数据中区分正常流量和异常流量.本文提出一种模糊聚类分析方法,利用数据之间的相似度进行聚类,试验证明,该方法可以有效地检测网络入侵.  相似文献   

6.
论文提出了一种基于蚁群动态模糊聚类算法的计算机图像分割方法,有效地利用蚁群算法的聚类分析能力,克服了FCM算法对初始化的敏感,动态地确定了聚类数目和中心。然后利用蚁群聚类算法得到的模型进行修改,再进行模糊聚类弥补蚁群算法的不足。最后将该算法应用到计算机图像分割技术。对比实验表明,该算法实验表明该算法速度快、划分特性好,可以准确地分割出目标。  相似文献   

7.
基于层次的模糊K均值聚类算法研究   总被引:1,自引:0,他引:1  
通过对K均值聚类算法的研究,本文提出了一种基于层次聚类与模糊聚类思想的K均值聚类算法。算法首先使用层次方法对数据进行初始聚类,然后用得到的聚类数作为模糊K均值聚类中的K值,对聚类进行修正。最后通过实验,验证了该算法不需要人为假设聚类算法中的K值,而且引入了模糊隶属关系使类别的划分更接近于事实,从而证明了该算法的有效性。  相似文献   

8.
本文将模糊C均值聚类和自适应神经模糊网络结合起来.模糊C均值聚类用于对输入变量空间进行划分,生成初始的模糊规则库,自适应模糊神经网络(ANFIS)选用最小二乘法和BP算法.与普通的模糊神经网络相比,这种模糊神经网络收敛速度快,建模精度高。  相似文献   

9.
提出了一种基于郭涛算法的聚类算法,在WEKA平台上通过使用Iris数据集和Glass数据集对基于郭涛算法的聚类算法和K-means算法进行对比实验,验证了基于郭涛算法的聚类算法的有效性。  相似文献   

10.
K 均值算法(K-Means)是聚类算法中最受欢迎且最健壮的一种算法,然而在实际应用中,存在真实数据集划分的类数无法提前确定及初始聚类中心点随机选择易使聚类结果陷入局部最优解的问题。因此提出一种基于最大距离中位数及误差平方和(SSE)的自适应改进算法。该算法根据计算获取初始聚类中心点,并通过 SSE 变化趋势决定终止聚类或继续簇的分裂,从而自动确定划分的类簇个数。采用 UCI 的 4 种数据集进行实验。结果表明,改进后的算法相比传统聚类算法在不增加迭代次数的情况下,聚类准确率分别提高了17.133%、22.416%、1.545%、0.238%,且聚类结果更加稳定。  相似文献   

11.
提出使用文本相似度算法与DBSCAN聚类算法相结合的方法对文本进行聚类,实现对文本的管理。首先对文本进行特征提取和分词操作,在分词过程中会产生大量的特征词汇,而有些特征词汇对文本特征的表达并无实际意义。因此,在文本特征提取过程中根据特征词汇对文本特征表达的贡献度进行取舍,以提高文本聚类的效率和准确性。利用TF IDF方法对特征词汇进行加权,并且对文本进行相似度计算,将相似度低于阈值的文本作为孤立点进行处理。利用DBSCAN算法对文本进行聚类,将相似的文本聚为一类。  相似文献   

12.
13.
相对于抑制式模糊C-均值聚类算法,半抑制式模糊C-均值聚类算法引入抑制门限,在保持收敛速度变化不大的前提下改善了聚类的效果。然而,该算法也存在参数选择较多的问题。针对该问题,我们引入面向隶属度修正的模糊聚类参数选择方法,提出了改进的半抑制式模糊C-均值聚类算法。实验表明,该算法具有较好的可操作性,在具有较快收敛速度的同时,也维持了较好的收敛效果。  相似文献   

14.
随着网络的普及和信息量的急剧增加,从海量数据中提取有用的数据信息已迫在眉睫。本文提出了一种基于密度偏差抽样的聚类算法,实验表明,随着信息量、数据维数的增加,该算法聚类的正确率以及对数据的处理速度都要较传统的聚类算法有所提高。  相似文献   

15.
针对模糊C-均值聚类算法(FCM)存在易受初始聚类中心影响和容易陷入局部最优的问题,提出了一种将灰狼优化算法(GWO)和模糊C-均值相结合的新聚类算法(GWO-FCM)。该算法利用GWO算法强大的全局寻优能力对FCM算法的聚类中心进行优化,模拟灰狼优秀的搜寻猎物行为找到一组最佳聚类中心来提高FCM的聚类效果。通过UCI数据集的仿真结果和算法比较验证了该算法的有效性。  相似文献   

16.
K-Means算法是聚类方法中常用的一种划分方法。随着数据量的增加,K-Means算法的局限性日益突出。基于网格划分的思想,提出了一种基于网格的K-Means聚类算法,该算法使用了网格技术在一定程度上去除了孤立点和噪声数据,减少了原始K-Means算法将大的聚类分开的可能。实验表明,该算法能处理任意形状和大小的聚类,对孤立点和噪声数据也能很好地识别,并且在去除孤立点和噪声数据方面可以达到较好的精度。  相似文献   

17.
人脸识别技术是图像处理方面的重要技术。通过对人脸数据进行标准化处理,利用主成分分析和半监督模糊聚类算法对人脸数据库进行聚类分析。实验结果表明,半监督模糊聚类利用主成分降维得到的22个特征进行聚类,对于已知类别属性的人脸,聚类结果与这些属性的一致率达100%,而对于其他数据,一致率也达到99%以上。  相似文献   

18.
客户是企业的重要资源和宝贵财富,是企业赖以生存和发展的基础。了解客户的需求,提升客户的满意度,成为众多企业关注的焦点。以某宾馆客户满意度分析为例,使用模糊C—均值聚类算法对客户满意度进行分析发现,客户最关心的是地理位置、服务态度、客房设施和员工素质等因素;较为关注前台服务、环境绿化、安全设施、客房服务、停车设施等因素;不太关注娱乐设施、周边环境、餐厅服务等因素;不关注会议设施和商务服务等因素。  相似文献   

19.
一种改进的k-means聚类算法   总被引:2,自引:0,他引:2  
针对k-means算法事先必须获知聚类数目以及难以确定初始中心的缺点,提出了一种改进的k-means聚类算法.首先引入轮廓系数的概念,通过计算不同K值下簇集中各对象的轮廓系数确定事先未知分类信息的数据集中所包含的最优聚类数Kopt;然后通过凝聚层次聚类的方法获得数据集的分布,确定初始聚类中心;最后利用传统的k-means方法完成聚类.理论分析表明,所提出的算法具有适度的计算复杂度.IRIS测试数据集的实验结果表明了该算法能够合理区分不同类型的簇集,且可以有效地识别离群点,聚合后的结果簇集具有较低的熵值.  相似文献   

20.
针对上市公司的基本面情况分析,构建了较为全面的综合评价指标体系. 定义了上市公司股票间"相似程度"的一种度量,基于该度量提出了一种新的层次聚类算法对样本股票进行聚类,然后通过聚类结果来分析投资价值确定投资品种或范围. 最后,选取上证30指数27家上市公司股票进行实证研究,结果表明所提聚类方法对指导证券投资是实用有效的.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号