首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
盛秋艳 《情报科学》2012,(8):1238-1241
本体技术作为一种能在语义和知识层次上描述概念体系的有效工具,给词语间相似度计算带来了新的机会。词语相似度的研究,是知识表示以及信息检索领域中的一个重要内容。本文利用本体来组织概念,计算概念之间的语义相似度,将语义相似度分成概念相似度和描述相似度,把概念相似度和描述相似度进行合并,生成最终的语义相似度。依据《中国分类主题词表》建立的计算机领域本体,验证了语义相似度计算方法的有效性。  相似文献   

2.
李慧 《现代情报》2015,35(4):172-177
词语相似度计算方法在信息检索、词义消歧、机器翻译等自然语言处理领域有着广泛的应用。现有的词语相似度算法主要分为基于统计和基于语义资源两类方法,前者是从大规模的语料中统计与词语共现的上下文信息以计算其相似度,而后者利用人工构建的语义词典或语义网络计算相似度。本文比较分析了两类词语相似度算法,重点介绍了基于Web语料库和基于维基百科的算法,并总结了各自的特点和不足之处。最后提出,在信息技术的影响下,基于维基百科和基于混合技术的词语相似度算法以及关联数据驱动的相似性计算具有潜在的发展趋势。  相似文献   

3.
针对向量空间模型中语义缺失问题,将语义词典(知网)应用到文本分类的过程中以提高文本分类的准确度。对于中文文本中的一词多义现象,提出改进的词汇语义相似度计算方法,通过词义排歧选取义项进行词语的相似度计算,将相似度大于阈值的词语进行聚类,对文本特征向量进行降维,给出基于语义的文本分类算法,并对该算法进行实验分析。结果表明,该算法可有效提高中文文本分类效果。  相似文献   

4.
介绍了当前国内外有关词汇语义相似度算法的研究现状,分析并对比了几种具有代表性的计算方法,并将几种常用的词汇语义相似度算法应用于FAQ中,分别采用准确率、召回率、F值以及MRR、MAP5个指标进行评价,根据相似问句的检索效果判断各词语相似度算法的优劣。  相似文献   

5.
本文对《汉语主题词表》(工程技术版)概念与英文超级科技词表概念的映射进行研究,建立优化的汉对英有序映射模式,并采用基于谷歌距离的语义相似度算法进行实验,计算英文词之间的语义距离,导入原有汉英映射信息。通过实验分析,获得了按相似度排序的汉英映射模式,实现了多个英文词汇与汉词的对应并由高到低排列出来。该方法获得的排序结果基本满足要求,部分词语需要人工修正。  相似文献   

6.
分析了词向量在自然语言处理中的作用。使用已经训练好的词向量进行了简单类比推理、词语间离和句子相似度分析。给出一种结合词向量和传统语义解析两者优点的句子相似度计算WCos公式,通过传统语义分析将程度词单独提取处理,使用权值修改对照表进行权值设置,然后对余弦相似度公式进行修正。该方法在句子相似度分析方面明显优于单纯依赖于词向量的句子相似度分析方法。  相似文献   

7.
目前,国内外许多学者借助语义词典Word Net进行标签间语义关系挖掘方面研究,并取得了一定的进展,但却很少有专门针对中文语义词典与标签结合的研究。文章通过选取豆瓣读书上的标签数据,充分分析并利用中文语义词典《同义词词林》的分类体系和编码特点,利用一种基于《同义词词林》的词汇语义相似度计算系统Word Similar计算标签数据的语义相似度,进而挖掘标签间的语义关系,该方法得到的结果与我们思维中的词汇语义关系基本一致,有比较高的准确性。  相似文献   

8.
程亚男  王宇 《情报科学》2018,36(8):72-76
【目的/意义】目前问答社区答案数量多且篇幅长,对答案进行重新排序和组织可以方便用户高效获取答案 信息。【方法/过程】针对答案文本的特点,提出基于答案相似度对社区答案进行重新组织、排序的方法。该方法定 义答案文本语义云和情感云,利用标签传播算法计算出词典中不存在的词语语义和情感相似度,即云滴值,然后每 个答案形成多片语义云和一片情感云,通过计算答案云间相似度得到答案文本间的相似度。最后,结合答案“赞” 数对答案进行重新排序。【结果/结论】通过实验的人工评价,发现与基于“赞”数排序相比,基于语义情感相似度的 答案排序方法与人工排序相似度更高,更能满足社区用户需求。  相似文献   

9.
本文利用统计翻译模型计算单词之间的语义相似度,并将此语义信息嵌入至核函数,实现了一个基于语义核函数的问句检索系统,利用语义核函数计算问句之间的语义相似度。通过在真实问答对数据上进行的实验,表明基于语义核函数的问句检索模型的效果优于传统的相似度计算模型,可以提高问句语义匹配准确率,具有一定的实用性。  相似文献   

10.
基于本体匹配的语义对等网信息检索   总被引:2,自引:0,他引:2  
提出了一种基于语义相似、本体匹配的对等网信息检索方法.定义语义节点,在节点中通过计算语义相似度,在网络中进行语义匹配来部分替换传统的字符串相似度计算.仿真模拟结果表明,该方法能够有效提高信息检索效率.  相似文献   

11.
本文提出了一种基于WordNet的概念格间语义相似度计算方法,该方法利用WordNet中各词汇之间的结构关系,参考其各词汇间的距离、密度、深度来计算各概念间的语义相似度来反映概念间的语义关系,然后根据概念与其他的概念格中的语义相似度来计算两个概念格间的语义相似度,为以后的研究做准备。但是这种方法尚不完善,需进一步进行扩展与改进。  相似文献   

12.
基于语义相似度的信息检索研究   总被引:2,自引:0,他引:2  
如何准确表达用户意图,判定概念实体之间的语义相似度是语义信息检索技术中的一个重要研究方向.综舍考虑实例多重继承关系及属性值的层次关系,提出了一种语义相似度计算方法,并利用继承关系的树状结构特点对语义相似度的计算过程进行了优化.在实例多重继承关系相对复杂的情况下准确率提高更加明显.实验表明本文提出的算法,在本体知识库的多种组成情况下,均能有效地提高相似度的计算准确率.  相似文献   

13.
章成敏  鞠海燕 《情报杂志》2005,24(11):101-103,105
综合考虑查询串所包含关键词的词形、语义、语用三个层面的信息计算查询串相似度的计算方法。首先利用字面相似度算法计算查询串在词形上的相似度,然后利用义类词典进行关键词在语义层面上的匹配,得到查询串在语义层面上的相似度,接着以搜索引擎作为语料库来源,将查询串提交给搜索引擎,通过对返回结果中重叠部分的统计分析,计算查询串在语用上的相似度,最后综合这三个相似度,完成相似度的计算。实验结果表明该算法的有效性。  相似文献   

14.
词语相似度计算研究   总被引:8,自引:0,他引:8  
词语相似度计算是自然语言处理、智能检索、文档聚类、文档分类、自动应答、词义排歧和机器翻译等很多领域的基础研究课题。本文首先讨论了词语相似度计算的应用背景,然后总结了词语相似度计算的两类策略,包括每类策略的思想、依赖的工具和主要的方法,并对这两类策略进行了简单的比较。  相似文献   

15.
廖开际  杨彬彬 《情报杂志》2012,31(7):182-186
基于词频统计思想的传统文本相似度算法,往往只考虑特征项在文本中的权重,而忽视了特征项之间的语义关系.综合考虑了特征项在文本中的重要程度以及特征项之间的语义关系,提出构建文本特征项的加权语义网模型来计算文本之间的相似度,并在模型构建的过程中,对特征项的选取、权值计算做了适当的改进.最后用实验验证了基于加权语义网的文本相似度算法相较于传统的算法,相似度计算的精确度有了进一步的提高.  相似文献   

16.
【目的/意义】文本相似度计算是自然语言处理中的一项基础性研究,通过总结和分析文本相似度计算的经 典方法和当前最新的研究成果,完善对文本相似度计算方法的系统化研究,以便于快速学习和掌握文本相似度计 算方法。【方法/内容】对过去20年的文本相似度计算领域的经典文献进行整理,分析不同计算方法的基本思想、优 缺点,总结每种计算方法的侧重点和不同方向上最新的研究进展。【结果/结论】从表面文本相似度计算方法和语义 相似度计算方法两方面进行阐述,形成较为全面的分类体系,其中语义相似度计算方法中的基于语料库的方法是 该领域最为主要的研究方向。  相似文献   

17.
徐桂臣  叶枫 《情报杂志》2012,31(2):119-123
在信息检索领域,概念的语义相似度计算起着重要的作用。针对现有研究文献中语义相似度计算中的若干问题,本文在语义加权距离算法的基础上讨论了多继承问题和概念属性问题。对于多继承问题,探讨了概念之间通过父概念和子概念进行连接所得到的路径长度相等的情况;对于概念属性问题,本文将对象类型属性和数据类型属性区别对待,提出了数据类型属性的相似度算法。最后,通过计算一个实例中概念节点的相似度,证明了本文算法的有效性。  相似文献   

18.
基于语义向量空间模型的文档检索系统研究   总被引:1,自引:0,他引:1  
针对向量空间模型中因义相似度,建立了语义向量空间模型,并设计了基于语义向量空间模型的文档检索系统,重点研究了其中语义相似度计算和查询扩展两个核心技术,并通过实例验证了该检索系统的有效性.  相似文献   

19.
针对本体映射中概念相似度计算中存在的一些不足之处,提出了一种改进的方法.通过WordNet计算两个概念名称和属性相似性,过滤出最相关的概念,减少概念相似度的计算;然后通过计算两个不同本体中的实例相似度和语义邻居相似度来完成本体映射.实验证明该方法效果良好.  相似文献   

20.
概念语义相似度计算与参数估计   总被引:1,自引:0,他引:1  
语义相似度计算是信息处理技术中的算模型,对模型中的参数取值进行了详细的讨论.在此基础上,利用<农业叙词表>中的实际数据进行了实证分析,计算结果与常识判断基本一致.其研究目的在于试图从实用的角度出发,为概念语义相似度计算作一些尝试和探索.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号