首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 78 毫秒
1.
本文详细介绍了模糊聚类算法的产生过程以及应用模糊聚类算法进行模糊分析的ASP代码,最后通过一个具体的实例,对模糊聚类算法进行了验证。  相似文献   

2.
耿新青  王正欧 《情报学报》2006,25(3):296-300
提出了一种新的模糊竞争神经网络聚类模型NFCNNC,并将其应用到文本聚类中。NFCNNC将模糊中心聚类(FCC)算法得到的模糊聚类中心向量作为神经网络的权值,通过比较隶属度值得到获胜神经元。网络中仅两个神经元同时调节权值。隶属度值最大的神经元以较大的学习率调整权值,隶属度次大的神经元以较小的学习率调整权值,其他神经元权值不变。按照FCC算法调整模糊聚类中心向量值(即权值)和神经元的隶属度,当网络稳定时,即可确定聚类数。与传统模糊神经网络模型相比,本文的模糊神经网络模型具有结构简单、运行效率高、聚类精度高的优点,同时克服了传统算法需预先指定聚类数的局限性。通过对文本聚类的实验验证,本算法取得了良好的效果。  相似文献   

3.
基于粒子群的模糊C均值文本聚类算法研究   总被引:1,自引:0,他引:1  
利用模糊C均值算法解决文本聚类问题时,随机选取的初始聚类中心和聚类数会导致不同的聚类结果,且容易陷入局部最优。提出利用粒子群优化算法确定模糊C均值的初始聚类中心,并通过向量空间模型和特征提取,再利用模糊C均值进行文档聚类。实验表明,这种基于粒子群的模糊C均值聚类算法迭代次数少,能解决经典模糊C均值算法对初始值敏感和易陷入局部极小的缺点,且聚类速度和效果得到明显提高。  相似文献   

4.
严海兵  崔志明 《情报学报》2007,26(3):361-365
基于关键字匹配的搜索引擎排序网页时仅仅考虑评价网页的重要性,而忽视分类;基于分类目录的搜索引擎很难动态分析Web信息。本文在分析它们不足的前提下,提出利用模糊聚类的方法对搜索引擎的检索结果进行动态分类,依据超链分析算法PageRank和Web文档隶属度相结合进行分类排序,并给出具有调节值的结合公式。实验证明,该算法能够更有效地满足用户的需要,提高检索效率。  相似文献   

5.
基于灰关系分析的模糊聚类   总被引:1,自引:0,他引:1  
灰关系分析(Grey relational analysis, GRA))能够度量参考样本和比较样本间的相似性而广泛应用于聚类算法中,但目前基于GRA的聚类方法对灰关系阈值的设定采用尝试法,难以刻画信息的完全度.为此,本文将灰关系分析所学习的相似性度量嵌入到流行的模糊聚类算法中,从而提出了基于灰关系分析的模糊聚类方法.分析了灰关系性质和核机理论相似性基础之上,由灰色理论中的灰关系衍生出一种新型核--灰关系核,同时,也由核机理论诱导出一种新的灰关系度量,从而构建了灰关系分析和核机理论间的一条联系纽带.UCI数据集上的模拟实验验证了基于灰关系分析的模糊聚类方法和所提灰关系度量的有效性.  相似文献   

6.
利用聚类分析工具可以从海量的、日益增长的基因表达数据中解析出其中可能的编码基因及其生理功能,这是生物信息学中一项很有意义的工作。模糊聚类算法是一种常用的基因表达数据聚类分析工具,可以发现重叠的基因簇,它不强制将每个基因归入某个具体的聚类中,而是计算每个基因对各个类的隶属度。本文分析了基因表达数据的模糊聚类分析方法及其重要应用。  相似文献   

7.
本文针对目前基于聚类算法的入侵检测技术存在符号类型数据处理能力欠缺、误报率较高的问题。提出了一种基于聚类和关联规则修正的入侵检测技术。该方法将关联规则挖掘技术引入到聚类分析机制中.利用针对符号型属性的关联规则挖掘结果对聚类结果进行修正,从而有效降低由于在入侵检测单纯使用聚类分析所导致的误报。文中详细的阐述了改进的具体实现方案,并通过实验验证了该技术的可行性。  相似文献   

8.
基于凝聚式层次聚类算法的标签聚类研究*   总被引:8,自引:1,他引:8  
对标签、标注、大众分类等概念进行界定,指出现有标签标注系统中存在着标签描述信息的精确度不高、标签检索结果相关度低、标签缺乏有效组织等问题,提出采用凝聚式聚类算法对标签聚类,从而实现对标签的重新组织,为用户提供更好的标签导航、浏览机制。最后通过实验对标签聚类方法进行验证。  相似文献   

9.
10.
模糊聚类在数字图书馆中的用途   总被引:2,自引:0,他引:2  
目前,互联网上的信息浩如烟海,面对海量的资料,首要的任务是将它合理的归类。所以,聚类分析是数据挖掘的核心技术,而采用模糊聚类分析的方法处理web信息具有很强的针对性。文章介绍了模糊聚类的一般方法以及在数字图书馆中的应用。  相似文献   

11.
信息检索的模糊聚类分析模型   总被引:8,自引:0,他引:8  
曾玉 《情报学报》2004,23(4):433-436
本文在对信息检索的模糊性进行论证的基础上 ,采用基于模糊等价关系的动态聚类方法对信息检索结果进行聚类分析 ,建立了信息检索的动态聚类分析模型 ,并给出了算例 ,使情报用户可以更加充分合理的利用各种信息资源。  相似文献   

12.
基于带语义差别的模糊Taxonomy的交易数据库关联规则聚类   总被引:1,自引:0,他引:1  
关联规则聚类是大量关联规则的一种有效组织方式,本文针对基于商品分类信息的规则聚类方法存在的不足进行了改进,同时考虑了不同层次间的项目语义差别,以及具有不同隶属度的项目细致语义差别,将商品分类树改进为模糊Taxonomy的有向无环图结构,该结构可以处理一个项目同时属于多个父结点的情况.我们充分考虑了有向无环图的性质,提出了带细致语义差别的模糊Taxonomy结构构建方法和相应的规则距离计算方法,其中,规则距离计算过程中的项集距离计算方法无需计算最佳匹配,因此,具有较小的时间开销.规则距离计算和聚类可视化试验结果表明了该方法的可扩展性和有效性,在规则的聚类计算上取得了较为满意的结果.  相似文献   

13.
在对标准蚁群算法分析研究基础上,结合中文文本数据的特点,对蚁群算法存在的缺点进行改进,提出一种基于改进的蚁群算法的中文文本聚类方法——ACTC。算法中为每只蚂蚁增加两个记忆体,可以解决原算法中的“未指派现象”;模拟信息素,从而使蚂蚁的移动更具目的性,加快聚类速度;引入“边界点”思想,从而不仅可以消除“停滞现象”,而且能避免“噪声”或异常数据对聚类结果的负面影响;引入动态调整相似度阈值概念,从而使聚类结果更具实际意义。实验证明,从熵值与纯度两个评价函数评价结果看,该算法的聚类效果较好,达到算法改进的目的。  相似文献   

14.
模糊理论在信息检索中的应用研究   总被引:11,自引:1,他引:10  
焦玉英  雷春明 《情报学报》2000,19(5):519-524
本文分析了模糊理论对分类、主题标引、检索提问表达及检索效果评价的作用,并对该理论在信息检索应用系统中面临的问题进行了探讨。  相似文献   

15.
基于样本加权的文本聚类算法研究   总被引:3,自引:0,他引:3  
样本加权聚类算法是一种最近才引起人们注意的算法,还存在一些需要解决的问题,例如,聚类对象之间的结构信息对样本加权聚类是否有帮助,如何将结构信息自动转换为样本或对象的权重?针对该问题,本文以学术论文为聚类对象,以K-Means算法为聚类算法基础,利用论文之间的引用关系计算每篇论文的PageRank值,并将其作为权重,提出一种基于样本加权的新的文本聚类算法.实验结果表明,基于论文PageRank值加权的聚类算法能改善文本聚类效果.该算法可推广到网页的聚类中,利用网页的PageRank进行加权聚类,来改善网页的聚类效果.  相似文献   

16.
传统的聚类算法直接用于文本聚类这一应用上,存在的突出问题就是传统的聚类算法只负责将对象进行聚类,不负责对聚类后生成的类簇进行概念描述和解释.标注文本集合聚类后生成的类簇被称为聚类描述问题.聚类描述可以帮助用户迅速确认生成的文档类别与其需求是否相关,它是文本聚类应用中一项重要并富有挑战性的任务.针对文本聚类结果可读性较弱问题,本文提出了一种增强聚类结果的可理解性与可读性的算法,即基于支持向量机的文本聚类结果描述算法.实验结果表明基于支持向量机的聚类描述算法所取得的效果要优于常规的聚类结果描述方法.  相似文献   

17.
自动文本摘要中一个关键的步骤是确定文章的主旨并将反映文章主旨的句子提取出来.在讨论分析k-means, k-medoids等聚类算法的基础上,根据对文本摘要的实际要求以及文档自身的特点,提出一种基于聚类算法的主旨句提取方法.实验结果表明,在提高聚类准确性的基础上,新方法较其他聚类算法能够更加有效地避免遗漏主题的问题,能较全方位地反映全文的主旨,提取出的摘要既覆盖全面又突出重点.  相似文献   

18.
文档聚类分析是组织文档的一种有效方法,在信息处理中被广泛应用于未知话题的自动发现并取得不错的效果。本文提出了一个轻量级聚类算法。该算法利用减小原始文档的索引数,来处理大量小文档,并把它们分组到几千个簇,或者通过更改特定参数,将聚类簇的数量减小到几十个。理论分析和实际应用表明,该算法改善了对高维数据和大量小文档处理效率。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号