首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 0 毫秒
1.
针对本体模型的层次结构,综合考虑语义距离、语义重合度、概念深度和概念宽度等多种因素,提出基于本体的概念语义相似度计算方法.实验结果表明该方法合理、有效,可应用于面向语义的信息检索.  相似文献   

2.
概念语义相似度计算与参数估计   总被引:1,自引:0,他引:1  
语义相似度计算是信息处理技术中的算模型,对模型中的参数取值进行了详细的讨论.在此基础上,利用<农业叙词表>中的实际数据进行了实证分析,计算结果与常识判断基本一致.其研究目的在于试图从实用的角度出发,为概念语义相似度计算作一些尝试和探索.  相似文献   

3.
在传统矢量空间检索模式中,仅仅依赖孤立的关键词来进行文献的标引,而自然语言中充斥着大量的语义关联和多义、歧义问题,这样往往使得文本信息的表示和检索结果难以尽如人意。可见,尽可能丰富地捕捉存在于上下文中的语义关联,对于有效地标引和检索是相当重要的。本文提出了一种利用语义格进行文献的语义表述的方法,对标引词的语义格加权算法做了更为合理的解释和推导,并引入了一种计算词语之间相似度的方法。  相似文献   

4.
盛秋艳 《情报科学》2012,(8):1238-1241
本体技术作为一种能在语义和知识层次上描述概念体系的有效工具,给词语间相似度计算带来了新的机会。词语相似度的研究,是知识表示以及信息检索领域中的一个重要内容。本文利用本体来组织概念,计算概念之间的语义相似度,将语义相似度分成概念相似度和描述相似度,把概念相似度和描述相似度进行合并,生成最终的语义相似度。依据《中国分类主题词表》建立的计算机领域本体,验证了语义相似度计算方法的有效性。  相似文献   

5.
梁少星 《现代情报》2015,35(8):151-156
相似度计算方法的优劣直接影响到信息检索与推荐的效果。本文根据本体图模型中属性序列的特点,综合考虑层次关系和属性关系,在分析路径关联相似度、层次相交关联相似度及属性相交关联相似度的影响因素的基础上给出了实例之间综合语义相似度的计算方法。文章最后讨论了该相似度计算方法在解决基于内容的推荐中的过于专门化问题、协同过滤推荐中的稀疏性问题以及检索中查全率和查准率问题中的应用。  相似文献   

6.
廖开际  杨彬彬 《情报杂志》2012,31(7):182-186
基于词频统计思想的传统文本相似度算法,往往只考虑特征项在文本中的权重,而忽视了特征项之间的语义关系.综合考虑了特征项在文本中的重要程度以及特征项之间的语义关系,提出构建文本特征项的加权语义网模型来计算文本之间的相似度,并在模型构建的过程中,对特征项的选取、权值计算做了适当的改进.最后用实验验证了基于加权语义网的文本相似度算法相较于传统的算法,相似度计算的精确度有了进一步的提高.  相似文献   

7.
基于语义相似度的信息检索研究   总被引:2,自引:0,他引:2  
如何准确表达用户意图,判定概念实体之间的语义相似度是语义信息检索技术中的一个重要研究方向.综舍考虑实例多重继承关系及属性值的层次关系,提出了一种语义相似度计算方法,并利用继承关系的树状结构特点对语义相似度的计算过程进行了优化.在实例多重继承关系相对复杂的情况下准确率提高更加明显.实验表明本文提出的算法,在本体知识库的多种组成情况下,均能有效地提高相似度的计算准确率.  相似文献   

8.
徐桂臣  叶枫 《情报杂志》2012,31(2):119-123
在信息检索领域,概念的语义相似度计算起着重要的作用。针对现有研究文献中语义相似度计算中的若干问题,本文在语义加权距离算法的基础上讨论了多继承问题和概念属性问题。对于多继承问题,探讨了概念之间通过父概念和子概念进行连接所得到的路径长度相等的情况;对于概念属性问题,本文将对象类型属性和数据类型属性区别对待,提出了数据类型属性的相似度算法。最后,通过计算一个实例中概念节点的相似度,证明了本文算法的有效性。  相似文献   

9.
文本的向量空间模型是把文本量化为空间里的向量,文本相似度的计算即对向量相似性的计算。本文通过分析传统的基于向量空间模型(VSM)文本相似度计算算法存在的不足,提出一种改进的文本相似度计算算法。改进算法充分考虑到了文本间向量空间模型相似度比较忽略了文本长度的缺点,引入文本长度参数,并在基于互信息的特征词抽取时考虑词频的因素对文本相似度的影响,有效减少了相似度低的文本干扰。实验结果验证了改进算法的有效性和准确性。  相似文献   

10.
基于向量语义相似度的改进K-Means算法   总被引:2,自引:0,他引:2  
李法运  农罗锋 《情报科学》2013,(2):34-37,44
针对传统的K-Means算法的不足,以及其在文本聚类中存在的局限性,提出了一种基于网页向量语义相似度的改进K-Means算法。新算法通过向量语义相似度的计算自动确定初始聚类中心,在聚类过程中,达到语义相似度阈值的网页才使用K-Means算法进行聚类。通过实验证明,新算法很好地克服了传统K-Means算法随机选取聚类中心以及无法处理语义信息的问题,提高了聚类的质量。  相似文献   

11.
现有的相似度计算方法大都依赖于作者间的直接关联,忽略了间接关联.文章提出一种新的基于SimRank的作者相似度计算方法,充分考虑作者关键词二分图网络的整体结构特性,利用图结构相似度算法挖掘出作者间以及词汇间的潜在关联关系.初步实验表明该方法能够有效地识别作者之间的相似度,相比于传统的关键词耦合,该方法可以明显提高作者相似度计算的准确性.  相似文献   

12.
【目的/意义】文本相似度计算是自然语言处理中的一项基础性研究,通过总结和分析文本相似度计算的经 典方法和当前最新的研究成果,完善对文本相似度计算方法的系统化研究,以便于快速学习和掌握文本相似度计 算方法。【方法/内容】对过去20年的文本相似度计算领域的经典文献进行整理,分析不同计算方法的基本思想、优 缺点,总结每种计算方法的侧重点和不同方向上最新的研究进展。【结果/结论】从表面文本相似度计算方法和语义 相似度计算方法两方面进行阐述,形成较为全面的分类体系,其中语义相似度计算方法中的基于语料库的方法是 该领域最为主要的研究方向。  相似文献   

13.
数据挖掘已成为情报学的研究热点,而传统的数据挖掘过程是在数据仓库的基础上,面向结构化的数据进行分析,这在很大程度上限制了数据挖掘的作用范围和效果。在充分分析数据挖掘和领域本体等相关理论后,提出了一个面向领域本体,应用语义相似度匹配的数据挖掘模型。该模型在理论上解决了用户的目标发现和挖掘对象选择的问题,同时也在数据挖掘算法上引入了本体概念,使得系统能快速识别用户需求,高效的选择相应算法,在很大程度上提高了数据挖掘处理异构、分布式数据的能力。  相似文献   

14.
15.
词语相似度计算研究   总被引:8,自引:0,他引:8  
词语相似度计算是自然语言处理、智能检索、文档聚类、文档分类、自动应答、词义排歧和机器翻译等很多领域的基础研究课题。本文首先讨论了词语相似度计算的应用背景,然后总结了词语相似度计算的两类策略,包括每类策略的思想、依赖的工具和主要的方法,并对这两类策略进行了简单的比较。  相似文献   

16.
张瑾 《情报科学》2013,(8):71-76
基于《中图法》的语义本体相似度计算,是结合《中图法》内容和结构体系,利用语义逻辑关系等手段,进行语义相似度计算,而建立的推理规则能较好地体现词语之间的语义关系,提高了词语相似度的计算精度。  相似文献   

17.
程亚男  王宇 《情报科学》2018,36(8):72-76
【目的/意义】目前问答社区答案数量多且篇幅长,对答案进行重新排序和组织可以方便用户高效获取答案 信息。【方法/过程】针对答案文本的特点,提出基于答案相似度对社区答案进行重新组织、排序的方法。该方法定 义答案文本语义云和情感云,利用标签传播算法计算出词典中不存在的词语语义和情感相似度,即云滴值,然后每 个答案形成多片语义云和一片情感云,通过计算答案云间相似度得到答案文本间的相似度。最后,结合答案“赞” 数对答案进行重新排序。【结果/结论】通过实验的人工评价,发现与基于“赞”数排序相比,基于语义情感相似度的 答案排序方法与人工排序相似度更高,更能满足社区用户需求。  相似文献   

18.
章成敏  鞠海燕 《情报杂志》2005,24(11):101-103,105
综合考虑查询串所包含关键词的词形、语义、语用三个层面的信息计算查询串相似度的计算方法。首先利用字面相似度算法计算查询串在词形上的相似度,然后利用义类词典进行关键词在语义层面上的匹配,得到查询串在语义层面上的相似度,接着以搜索引擎作为语料库来源,将查询串提交给搜索引擎,通过对返回结果中重叠部分的统计分析,计算查询串在语用上的相似度,最后综合这三个相似度,完成相似度的计算。实验结果表明该算法的有效性。  相似文献   

19.
文章提出的适用于关联数据资源集相似度计算的综合描述信息模型,分为基本描述、内容描述和外部链接3个模块描述资源集,并根据各信息项的特点挑选字符串相似度、集合相似度、向量空间模型和基于统计和语义的相似度等算法计算资源集相似度,在一定程度上解决了当前关联创建中相关资源集手工配置的问题。  相似文献   

20.
为了帮助教师快速准确地识别程序设计类作业中的抄袭现象,本文研究了一种源程序相似度度量方法,根据学生提交的源程序,基于单词统计程序源代码之间的编辑距离和最长公共子序列的长度,计算程序对之间的相似度,通过设定合理的动态阈值,判断源程序对之间是否存在抄袭。实验结果表明,该方法能够及时有效和准确地识别学生提交的相似源程序。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号