共查询到20条相似文献,搜索用时 547 毫秒
1.
传统的Web文本分类方法将文本中关键词的相似度作为分类的依据,丢失了很多重要的语义信息,导致分类结果不够准确且计算量大。基于此,文章提出了一种基于语义相似度的Web文本分类方法,利用领域本体将用关键词表示的文本特征向量表示为与之匹配的语义概念特征向量集,定义Web文本相似度的计算公式,设计并实现基于语义相似度的KNN算法。实验结果表明,该方法从语义概念层次上表示和处理Web文本,降低了文本特征空间维度,减少了计算量,提高了分类精确度。 相似文献
2.
文本分类是网络主题舆情分析中的关键技术,传统Web文本分类将文本关键词的相似度作为分类依据,丢失许多重要的语义信息,导致分类结果不够准确且计算量大.本文提出一种基于语义相似度的Web文本分类方法,利用特定的领域本体将用关键词表示的文本特征向量表示为与之匹配的语义概念特征向量,给出Web文本相似度的计算公式并实现基于语义相似度的KNN算法.结果表明,该方法从语义概念层次上表示和处理Web文本,降低了文本特征空间维度,减少计算量并提高了分类精确度. 相似文献
3.
在对当前术语语义相似度集成相关研究进行分析的基础上,针对典型集成方法存在的不足,构建了基于多种测度的术语相似度集成计算模型.首先对集成计算模型的设计思路进行论述;其次提出了在模型中应用的相似度网络初始化算法、术语语词相似度改进算法、术语语境模板相似度改进算法以及基于搜索引擎的术语相似度改进算法,并实现了该集成计算模型;最后对该模型中所使用的各种相似度测度计算性能指标以及完全计算SVM集成和条件计算SVM集成性能指标进行对比评测.实验证明,该计算模型的F1综合性能达到0.8797,并能缩短32%的计算时间,有效提升了术语相似度综合计算性能. 相似文献
4.
传统的专家识别系统大多采用一组带权重的关键词来表征专家的专长,然而这种基于关键词的专长描述不足以概括专家的研究主题。提出基于领域本体概念的专长表示方法,通过构建相应的领域本体来描述领域核心概念和概念间关系,利用谷歌距离来计算关键词到本体概念的语义相似度,完成关键词到概念的映射,从而得到基于本体概念的专长表示。 相似文献
5.
随着各种本体构建方法和诸多实验本体的相继涌现,以跨本体通信、跨本体协同为目的的本体对应相关研究在近年来受到国际学术界的普遍关注.为了最大限度复用现有本体,解决本体对应中跨本体映射的核心问题,在对当前本体映射中概念相似度的计算方法进行梳理和总结的基础上,提出了以"基于概念格的对象-属性相似度(object-attribute similarity based on concept lattice,OASBCL)"法计算跨本体映射中概念的相似度.通过对该方法在跨本体映射中的应用举例,阐明了方法的有效性.并在此基础上从概念格与本体互补、相似度要素指标、映射性质三个方面对该方法进行了讨论.以尝试探索一种能够支持异构本体间跨本体映射的形式化的概念相似度计算方法. 相似文献
6.
基于本体的语义相似度计算方法研究综述* 总被引:5,自引:0,他引:5
孙海霞钱庆成颖 《现代图书情报技术》2010,26(1):51-56
在对基于本体的词语语义相似度进行界定的基础上,对基于本体的语义相似度研究进行综述,分别阐述基于距离的语义相似度计算、基于内容的语义相似度计算、基于属性的语义相似度计算和混合式语义相似度计算等算法模型,最后从宏观层面指出今后本领域的研究方向。 相似文献
7.
术语的抽取是领域本体构建的基础工作,决定了本体构建的质量.获取的术语除了要求有准确的短语识别率,还要求有较高的术语领域度.本文试图研究一种不依赖于背景语料的术语领域度筛选方法.本文的主要工作集中在两个方面:一是通过统计和规则相结合的方法从领域语料中抽取候选术语(短语),二是提出了通过候选术语的分布度、活跃度以及主题度进行计算的多策略术语抽取方法,并通过实验进行了验证和分析.实验结果表明,在小规模航空航天领域语料库上进行验证性实验后发现,在不大量增加计算时间复杂度的情况下,能够有效提高领域术语抽取的质量,获得令人较满意的结果. 相似文献
8.
通过对馆藏资源本体相关定义和特点进行分析,在传统语义相似度计算方法的基础之上,提出了一种综合的基于馆藏资源本体模型的语义相似度算法。并构建了竞争情报资源本体,对该算法进行了实例分析。该算法为馆藏资源本体的语义相似度计算提供了一种有效的量化途径。 相似文献
9.
本文回顾了档案术语学的发展概况及国内外研究进展,以及近年来在信息管理领域受到广泛关注的“本体(ontology)”理论,通过查阅国内外一些具有代表性的辞典、档案学著作的方法对比分析了以“Record”为纽带联结起来的“Document”和“Archive(s)”两词的词义以及其词源演变,并对两词的语义相似度及其在整个档案学常用术语体系中的语义、语用等进行了简单的梳理与辨析,借用复杂网络理论,探讨了档案学术语体系的网络特征以及在档案术语学研究中引入定量分析方法的可能性. 相似文献
10.
由于时间、地点、目的、知识以及构造者的不同,导致即使对同一问题,本体的构造也会有很大的差异,这样就造成本体间很难共享和重用.而本体映射是解决本体异构、在不同本体间建立语义关联的一种有效的方法.针对目前本体映射方法中概念相似度计算所存在的问题,本文提出一种综合映射方法,即先通过分类将大本体划分为若干小型的本体树,再对小本体树分别从概念名称、实例及结构分别计算概念相似度并综合,这样大大简化了相似度计算的复杂度,也提高了准确性、全面性.最后以国防工业本体和中文飞机本体为例做了实验并对算法做了分析. 相似文献
11.
12.
以清晰表达知识内涵、促进本体语义共享为目的,以医学文献知识为研究案例,文章基于UMLS语义网络顶级本体语义关系构筑了领域本体属性关系,并通过医学文献知识本体的构建,阐述了依托顶级本体的语义关系构筑领域本体语义的方法,探讨了基于顶级本体语义的领域本体通用构建途径,实现了医学文献本体的语义关系系统化,为领域本体的建模提供了思路。 相似文献
13.
14.
指出学科知识建模是一项巨大的工程,通过本体建模,能够构建严密的学科知识组织体系。探讨学科本体的研究现状,分析学科本体建模的特点,提出一种本体建模的新方法,并且利用该方法构建训诂学本体模型,该方法强调领域专家在学科本体建模过程中的重要作用,通过传统知识组织模型与本体模型之间的转化提高本体建模的效率。 相似文献
15.
领域本体的构建方法研究 总被引:2,自引:0,他引:2
领域本体构建是一项复杂的系统工程。从国内外本体和领域本体研究出发,比较分析了典型的领域本体构建方法,提出循环式领域本体构建法,并使用该方法构建软件缺陷领域本体。 相似文献
16.
17.
18.
语义网中重量级本体的设计 总被引:1,自引:0,他引:1
通过对本体论中顶层本体、领域本体和任务本体的分析,结合语义网的应用实际,提出语义中重量级本体设计的基本概念、基本要求和基本关系;认为角色概念有丰富的语义描述能力,是重量级本体区别于轻量级本体的重要特征,并试图通过对角色概念的剖析,说明角色概念对语义约束的描述特征。 相似文献
19.