首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
董洛兵  马力  焦李成 《情报杂志》2006,25(2):52-54,57
在介绍Small-World基本概念的基础上,利用人类语言中存的Small-World现象,提出了一种基于Small-World的文档关键字提取算法,给出一种相似度聚类算法的描述.  相似文献   

2.
自组织映射算法是一种无导师学习算法。在实际聚类应用中,网络识别率受初始权值、竞争方式、样本参数等诸多因素影响。以竞争方式为切入点,以生物学为指导,引入相似度判断规则构建了神经元“兴奋区”,改进了SOM网络,实验证明了算法的有效性。  相似文献   

3.
文本聚类中文本表示和相似度计算研究综述   总被引:4,自引:0,他引:4  
围绕文本聚类中的文本表示和相似度计算两个基本的问题,对目前学界提出的文本表示方法和相似度计算方法进行了分类和较为全面的综述,将文本表示模型分为向量空间模型、语言模型、后缀树模型、本体等,相似度计算方法分为基于向量空间模型的相似度计算,基于短语的相似度计算方法和基于本体的相似度计算方法。  相似文献   

4.
曾群  程晓 《现代情报》2016,36(11):50-54
互联网时代,个性化推荐系统逐渐被应用到各个不同的领域,随之个性化推荐算法也成为目前研究的热点。然而,传统的推荐算法往往存在着冷启动、数据稀疏等问题。本文在对传统推荐算法研究的基础上,提出了一种基于相似传播和情景聚类的协同过滤推荐算法,根据计算用户间的情景相似度对用户进行聚类,然后根据相似传播原理找出目标用户更多的最近邻居,最后根据预测目标用户对项目的评分进行推荐。借助网上公共数据集在Matlab上实现了该算法并验证了算法的有效性。实验结果表明,本文所提算法的准确性相比传统算法有所提高,同时缓解了传统推荐算法存在的冷启动和数据稀疏性等问题。  相似文献   

5.
利用话题识别技术将Blog文本信息按照所表达的话题进行归类和组织,可以使Blog信息更加有效、准确地为用户使用。文章重点研究话题识别模型中的词频,权重计算以及相似度计算,对聚类算法有简单的实现并通过该实验对聚类算法有了更深层次的认识。  相似文献   

6.
本文提出了利用后缀树模抽的最大相似度优先聚类方法,通过构造文档集的广义后缀树模型抽取短语作为特征项并映射到M维向量空间模型;计算文档间的相似度矩阵,对任意两个文档之间的相似度进行降序排列,优先合并具备最大相似度的文档对形成初始聚类;合并初始聚类得到最终聚类结果。  相似文献   

7.
何建民  张义 《情报科学》2012,(8):1147-1150,1166
网络社区热点话题识别是监测与引导网络舆情的关键问题,本文针对该问题,通过分析热点话题的属性特征和应用离差最大化、类熵距离法,计算出各属性的权重和话题的正熵、负熵及优劣度,并据此对话题进行排序,找出热点话题。最后经实证验证该方法是合理有效的,所得结果可作为政府监控网络舆情的依据。  相似文献   

8.
姜灵敏 《科技管理研究》2005,25(11):217-219
爬山法一般得不到全局最优分类,k-均值法等常规动态聚类方法对初始聚类中心的选择非常敏感且聚类结果依赖样本的输入次序,结合遗传算法的全局搜索能力和爬山算法的局部搜索能力改进常规动态聚类方法,可以有效地解决这些问题,通常可保证能在有限的迭代次数内搜索到全局最优解。  相似文献   

9.
以熵为理论出发点,在定义正协同、负协同、模糊协同和协同度等概念的基础上,提出定量描述项目级、工序级配置组件协同关系矩阵,设计以阶段协同熵加权反映配置组件模糊协同关系、以组件内外协同关系之和度量项目组合配置组件协同度的分析方法,构建基于熵的项目组合配置协同度决策模型,并通过企业实践对模型的可操作性进行验证。  相似文献   

10.
基于LDA模型的文本聚类研究   总被引:1,自引:0,他引:1  
在Web2.0时代,网络文本数据呈现爆炸式增长,传统的文本聚类模型存在数据维数过高,数据稀疏,缺乏语义理解等问题。针对以上问题,本文提出了一种基于LDA模型,通过Gibbs算法估计文本的主题概率分布,利用JS(Jensen-Shannon)距离作为文本的相似性度量,然后采用层次聚类法进行聚类。实验得到较高的聚类纯度(Purity)和Fscore值,表明该方法是有效的。  相似文献   

11.
基于共词分析的学科主题动态跟踪相似算法改进研究   总被引:1,自引:0,他引:1  
针对现有三种基于共词分析的学科主题动态跟踪相似算法都存在不能深入分析主题演化细微关系的缺陷,以Coulter的相似指数为基础对现有相似算法进行改进研究,并对改进相似算法中涉及的相关问题进行了阐释.  相似文献   

12.
基于向量语义相似度的改进K-Means算法   总被引:2,自引:0,他引:2  
李法运  农罗锋 《情报科学》2013,(2):34-37,44
针对传统的K-Means算法的不足,以及其在文本聚类中存在的局限性,提出了一种基于网页向量语义相似度的改进K-Means算法。新算法通过向量语义相似度的计算自动确定初始聚类中心,在聚类过程中,达到语义相似度阈值的网页才使用K-Means算法进行聚类。通过实验证明,新算法很好地克服了传统K-Means算法随机选取聚类中心以及无法处理语义信息的问题,提高了聚类的质量。  相似文献   

13.
基于共词分析的学科主题动态跟踪相似方法是分析和研究学科主题演化的崭新、重要手段,但该法的理论研究和实践应用发展缓慢.对已有的三种相似分析法进行了研究探讨,指出了共同存在的主要问题.同时,又对在基本原理上与相似分析法密切相关的基于共词分析的学科主题动态跟踪图谱方法、基于共引分析的学科主题动态跟踪方法、其他相关演化方法和相似算法进行了综合研究,分析了各自可供相似方法借鉴的内容,为基于共词分析的相似方法的进一步发展提供了重要参考.  相似文献   

14.
李盼池 《情报杂志》2003,22(4):54-55
针对知识发现中的模糊信息查询问题,提出了一种基于反馈网络的模糊概念聚类及模式联想设计方法。首先按照分类要求对所要查询的概念集合进行量化编码,然后对编码后的数据进行规整处理。对于概念聚类采用多层反馈神经网络的FP聚类算法,而概念联想采用白反馈神经网络的椭球学习算法实现。将基于上述算法开发出的信息模糊查询系统应用于图书信息查询,实验结果征明了该方法的有效性。  相似文献   

15.
在传统矢量空间检索模式中,仅仅依赖孤立的关键词来进行文献的标引,而自然语言中充斥着大量的语义关联和多义、歧义问题,这样往往使得文本信息的表示和检索结果难以尽如人意。可见,尽可能丰富地捕捉存在于上下文中的语义关联,对于有效地标引和检索是相当重要的。本文提出了一种利用语义格进行文献的语义表述的方法,对标引词的语义格加权算法做了更为合理的解释和推导,并引入了一种计算词语之间相似度的方法。  相似文献   

16.
基于聚类的词表等级关系自动识别研究   总被引:3,自引:0,他引:3  
杜慧平  何琳 《情报科学》2008,28(11):1680-1684
词汇等级关系的识别是自动构建叙词表的重点和难点之一.基于相似度的词聚类方法,突破了按字面聚集等级关系词汇的传统做法的局限性,能够深入语义,识别出字面上无此特点的等级关系词汇.介绍了该方法并进行测试,试验结果表明该方法具有一定可行性.  相似文献   

17.
王生玉 《科技通报》2021,37(11):57-60
为解决现有网络传输通道入侵检测方法存在的稳定性较差、误检率较高的问题,提出基于多维相似度的网络传输通道恶意入侵检测方法.利用2个数据样本间的差异程度来判断数据的多维相似度,再根据数据间的相邻数目来判断数据是否存在异常,并完成对异常数据的挖掘;在此基础上,依据用户的行为或是对系统的操作情况,结合判断是否存在恶意入侵的现象...  相似文献   

18.
在分析基于搜索引擎的术语相似度算法基础上,设计并实现了基于领域限定网络检索的术语相似度算法,通过将语义上下文和领域上下文引入检索式构造过程,有效提升了特定领域术语相似度计算效果。  相似文献   

19.
本文阐述了一种基于特征词聚类的降维方式,其主要思想就是把词在文本中的出现看成一个事件,先通过搜索算法计算每一个特征词的分布,合并对分类有相似作用的特征词,从而起到了特征降维的作用。最后通过实验测试分析,提出了一种改进的、考虑全局簇信息的相似度计算公式,将其应用到文本分类中,实验表明提高了文本分类的精度。  相似文献   

20.
决策规则是信息系统中知识发现的重要课题,概率粗糙集模型则是重要方法之一。由于确定模型中的参数具有主观性,因此提出了一种结合模糊聚类和包含度决策对象的方法,并应用于网上购物的决策。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号