首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
徐桂臣  叶枫 《情报杂志》2012,31(2):119-123
在信息检索领域,概念的语义相似度计算起着重要的作用。针对现有研究文献中语义相似度计算中的若干问题,本文在语义加权距离算法的基础上讨论了多继承问题和概念属性问题。对于多继承问题,探讨了概念之间通过父概念和子概念进行连接所得到的路径长度相等的情况;对于概念属性问题,本文将对象类型属性和数据类型属性区别对待,提出了数据类型属性的相似度算法。最后,通过计算一个实例中概念节点的相似度,证明了本文算法的有效性。  相似文献   

2.
传统的检错码链路分流算法采用统计分析方法确定加密流量所属的具体应用协议,进行本层链路分流,当在链路层出现未加密数据时,性能不好。提出一种基于语义相似度融合检错码跨层链路分流算法。设计链路建立体系结构与检错码领域本体结构模型,为使分流后的链路特征向量的误差平方和最小,构建特征空间互信息区域语义相似度向量模型,计算语义相似度权值的微调参数,获得链路载波频率,采用检错码编码理论对链路载波频率进行冗余编码,提高语义相似度的融合性能。实现检错码跨层链路分流改进。仿真结果表明,采用该算法,链路建立过程的建立时间最短,有效避免了避免路由冲突,缩短了网络协议识别时间,有效提高检错码的抗干扰能力。  相似文献   

3.
基于语义相似度的信息检索研究   总被引:2,自引:0,他引:2  
如何准确表达用户意图,判定概念实体之间的语义相似度是语义信息检索技术中的一个重要研究方向.综舍考虑实例多重继承关系及属性值的层次关系,提出了一种语义相似度计算方法,并利用继承关系的树状结构特点对语义相似度的计算过程进行了优化.在实例多重继承关系相对复杂的情况下准确率提高更加明显.实验表明本文提出的算法,在本体知识库的多种组成情况下,均能有效地提高相似度的计算准确率.  相似文献   

4.
基于向量语义相似度的改进K-Means算法   总被引:2,自引:0,他引:2  
李法运  农罗锋 《情报科学》2013,(2):34-37,44
针对传统的K-Means算法的不足,以及其在文本聚类中存在的局限性,提出了一种基于网页向量语义相似度的改进K-Means算法。新算法通过向量语义相似度的计算自动确定初始聚类中心,在聚类过程中,达到语义相似度阈值的网页才使用K-Means算法进行聚类。通过实验证明,新算法很好地克服了传统K-Means算法随机选取聚类中心以及无法处理语义信息的问题,提高了聚类的质量。  相似文献   

5.
概念语义相似度计算与参数估计   总被引:1,自引:0,他引:1  
语义相似度计算是信息处理技术中的算模型,对模型中的参数取值进行了详细的讨论.在此基础上,利用<农业叙词表>中的实际数据进行了实证分析,计算结果与常识判断基本一致.其研究目的在于试图从实用的角度出发,为概念语义相似度计算作一些尝试和探索.  相似文献   

6.
针对本体模型的层次结构,综合考虑语义距离、语义重合度、概念深度和概念宽度等多种因素,提出基于本体的概念语义相似度计算方法.实验结果表明该方法合理、有效,可应用于面向语义的信息检索.  相似文献   

7.
领域本体中基于多维特征的语义相似度算法研究   总被引:1,自引:0,他引:1  
在电子商务与现代物流系统的集成中,信息资源之间存在着语义的区别,电子商务本体和物流本体之间概念的映射显得非常重要.概念相似度计算是领域本体映射中的一个"瓶颈问题".提出综合概念的语义距离特征、语义信息特征和概念属性的语义特征来计算概念的语义相似度.本体概念语义特征的结合采用了更符合概念特性的非线性组合方式.将该算法应用于已建立的电子商务本体和物流本体的映射系统中,取得了较好的概念匹配结果.  相似文献   

8.
李慧 《现代情报》2015,35(4):172-177
词语相似度计算方法在信息检索、词义消歧、机器翻译等自然语言处理领域有着广泛的应用。现有的词语相似度算法主要分为基于统计和基于语义资源两类方法,前者是从大规模的语料中统计与词语共现的上下文信息以计算其相似度,而后者利用人工构建的语义词典或语义网络计算相似度。本文比较分析了两类词语相似度算法,重点介绍了基于Web语料库和基于维基百科的算法,并总结了各自的特点和不足之处。最后提出,在信息技术的影响下,基于维基百科和基于混合技术的词语相似度算法以及关联数据驱动的相似性计算具有潜在的发展趋势。  相似文献   

9.
廖开际  杨彬彬 《情报杂志》2012,31(7):182-186
基于词频统计思想的传统文本相似度算法,往往只考虑特征项在文本中的权重,而忽视了特征项之间的语义关系.综合考虑了特征项在文本中的重要程度以及特征项之间的语义关系,提出构建文本特征项的加权语义网模型来计算文本之间的相似度,并在模型构建的过程中,对特征项的选取、权值计算做了适当的改进.最后用实验验证了基于加权语义网的文本相似度算法相较于传统的算法,相似度计算的精确度有了进一步的提高.  相似文献   

10.
词语相似度计算研究   总被引:8,自引:0,他引:8  
词语相似度计算是自然语言处理、智能检索、文档聚类、文档分类、自动应答、词义排歧和机器翻译等很多领域的基础研究课题。本文首先讨论了词语相似度计算的应用背景,然后总结了词语相似度计算的两类策略,包括每类策略的思想、依赖的工具和主要的方法,并对这两类策略进行了简单的比较。  相似文献   

11.
12.
章成敏  鞠海燕 《情报杂志》2005,24(11):101-103,105
综合考虑查询串所包含关键词的词形、语义、语用三个层面的信息计算查询串相似度的计算方法。首先利用字面相似度算法计算查询串在词形上的相似度,然后利用义类词典进行关键词在语义层面上的匹配,得到查询串在语义层面上的相似度,接着以搜索引擎作为语料库来源,将查询串提交给搜索引擎,通过对返回结果中重叠部分的统计分析,计算查询串在语用上的相似度,最后综合这三个相似度,完成相似度的计算。实验结果表明该算法的有效性。  相似文献   

13.
盛秋艳 《情报科学》2012,(8):1238-1241
本体技术作为一种能在语义和知识层次上描述概念体系的有效工具,给词语间相似度计算带来了新的机会。词语相似度的研究,是知识表示以及信息检索领域中的一个重要内容。本文利用本体来组织概念,计算概念之间的语义相似度,将语义相似度分成概念相似度和描述相似度,把概念相似度和描述相似度进行合并,生成最终的语义相似度。依据《中国分类主题词表》建立的计算机领域本体,验证了语义相似度计算方法的有效性。  相似文献   

14.
在传统矢量空间检索模式中,仅仅依赖孤立的关键词来进行文献的标引,而自然语言中充斥着大量的语义关联和多义、歧义问题,这样往往使得文本信息的表示和检索结果难以尽如人意。可见,尽可能丰富地捕捉存在于上下文中的语义关联,对于有效地标引和检索是相当重要的。本文提出了一种利用语义格进行文献的语义表述的方法,对标引词的语义格加权算法做了更为合理的解释和推导,并引入了一种计算词语之间相似度的方法。  相似文献   

15.
策略性管理活动作为管理活动描述的基本单元,更能够体现或折射出组织管理在某时期的工作重心和新的意图.为了实现企业的宏观和谐态诊断,即通过策略管理活动的事实主题和组织战略一致性测度,判断企业是否在做正确的事,提出辅助管理人员抽取事实主题和组织战略特征词的规则,并给出了基于<知网>语义相似度测度事实主题和组织战略一致性的方法.最后运用这种思想构建了企业宏观和谐态诊断平台,并在L所的实际应用中取得了较好的效果.  相似文献   

16.
数据挖掘已成为情报学的研究热点,而传统的数据挖掘过程是在数据仓库的基础上,面向结构化的数据进行分析,这在很大程度上限制了数据挖掘的作用范围和效果。在充分分析数据挖掘和领域本体等相关理论后,提出了一个面向领域本体,应用语义相似度匹配的数据挖掘模型。该模型在理论上解决了用户的目标发现和挖掘对象选择的问题,同时也在数据挖掘算法上引入了本体概念,使得系统能快速识别用户需求,高效的选择相应算法,在很大程度上提高了数据挖掘处理异构、分布式数据的能力。  相似文献   

17.
张瑾 《情报科学》2013,(8):71-76
基于《中图法》的语义本体相似度计算,是结合《中图法》内容和结构体系,利用语义逻辑关系等手段,进行语义相似度计算,而建立的推理规则能较好地体现词语之间的语义关系,提高了词语相似度的计算精度。  相似文献   

18.
针对传统信息检索方法的缺点提出了基于语义目录的个性化检索模型,说明了其原理、工作流程及关键技术。与传统的信息检索方法相比,该模型不仅在查准率和查全率方面都有所提高,还能根据用户需要完成个性化的信息检索。  相似文献   

19.
XML信息检索中结构相似度计算   总被引:2,自引:0,他引:2  
鲁远  万常选 《情报杂志》2007,26(11):109-111
XML信息检索中,检索结果排序时必须同时考虑关键词相似度和结构相似度,就此重点讨论了结构相似度计算问题,提出了一种计算用户查询和检索结果间结构相似度的数学模型。  相似文献   

20.
自组织映射算法是一种无导师学习算法。在实际聚类应用中,网络识别率受初始权值、竞争方式、样本参数等诸多因素影响。以竞争方式为切入点,以生物学为指导,引入相似度判断规则构建了神经元“兴奋区”,改进了SOM网络,实验证明了算法的有效性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号