首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 62 毫秒
1.
针对本体模型的层次结构,综合考虑语义距离、语义重合度、概念深度和概念宽度等多种因素,提出基于本体的概念语义相似度计算方法.实验结果表明该方法合理、有效,可应用于面向语义的信息检索.  相似文献   

2.
在传统矢量空间检索模式中,仅仅依赖孤立的关键词来进行文献的标引,而自然语言中充斥着大量的语义关联和多义、歧义问题,这样往往使得文本信息的表示和检索结果难以尽如人意。可见,尽可能丰富地捕捉存在于上下文中的语义关联,对于有效地标引和检索是相当重要的。本文提出了一种利用语义格进行文献的语义表述的方法,对标引词的语义格加权算法做了更为合理的解释和推导,并引入了一种计算词语之间相似度的方法。  相似文献   

3.
科技文献抄袭现象伴随着科学技术的发展时有发生,这严重损害了文献原作者,也对科技文献的严肃性提出了挑战。本文利用分词技术提取文献特征向量,并结合动态规划算法对文献的相似度给出具体评价,针对不同抄袭的现象,发现其中存在的规律,具体问题具体分析。最后给出实际实验结果,为文献评审提供参考。  相似文献   

4.
词语相似度计算研究   总被引:8,自引:0,他引:8  
词语相似度计算是自然语言处理、智能检索、文档聚类、文档分类、自动应答、词义排歧和机器翻译等很多领域的基础研究课题。本文首先讨论了词语相似度计算的应用背景,然后总结了词语相似度计算的两类策略,包括每类策略的思想、依赖的工具和主要的方法,并对这两类策略进行了简单的比较。  相似文献   

5.
XML信息检索中结构相似度计算   总被引:2,自引:0,他引:2  
鲁远  万常选 《情报杂志》2007,26(11):109-111
XML信息检索中,检索结果排序时必须同时考虑关键词相似度和结构相似度,就此重点讨论了结构相似度计算问题,提出了一种计算用户查询和检索结果间结构相似度的数学模型。  相似文献   

6.
概念语义相似度计算与参数估计   总被引:1,自引:0,他引:1  
语义相似度计算是信息处理技术中的算模型,对模型中的参数取值进行了详细的讨论.在此基础上,利用<农业叙词表>中的实际数据进行了实证分析,计算结果与常识判断基本一致.其研究目的在于试图从实用的角度出发,为概念语义相似度计算作一些尝试和探索.  相似文献   

7.
廖开际  杨彬彬 《情报杂志》2012,31(7):182-186
基于词频统计思想的传统文本相似度算法,往往只考虑特征项在文本中的权重,而忽视了特征项之间的语义关系.综合考虑了特征项在文本中的重要程度以及特征项之间的语义关系,提出构建文本特征项的加权语义网模型来计算文本之间的相似度,并在模型构建的过程中,对特征项的选取、权值计算做了适当的改进.最后用实验验证了基于加权语义网的文本相似度算法相较于传统的算法,相似度计算的精确度有了进一步的提高.  相似文献   

8.
针对短语文本的分类、聚类、信息查询问题,提出了一种新的中文短语文本相似度计算方法。用该方法计算出的文本相似度及一个比较文本与多个被比较文本所得相似度变化趋势是合理的,因此可以满足短语文本分类/聚类和信息查询的需要。  相似文献   

9.
姜华 《情报科学》2008,28(11):1685-1688,1698
基于本体基础提出相似度和相关度分析,以充分挖掘领域本体所提供的背景知识,通过语义推理将描述的隐含语义显式化,提供计算机被描述资源的可理解语义.设计了实现该方法的Web信息检索模型,实验表明该方法能提高查准率和查全率.  相似文献   

10.
盛秋艳 《情报科学》2012,(8):1238-1241
本体技术作为一种能在语义和知识层次上描述概念体系的有效工具,给词语间相似度计算带来了新的机会。词语相似度的研究,是知识表示以及信息检索领域中的一个重要内容。本文利用本体来组织概念,计算概念之间的语义相似度,将语义相似度分成概念相似度和描述相似度,把概念相似度和描述相似度进行合并,生成最终的语义相似度。依据《中国分类主题词表》建立的计算机领域本体,验证了语义相似度计算方法的有效性。  相似文献   

11.
热带季风区多云多雨的天气条件一直是多光谱遥感探测地表信息的难点之一。本文针对东南亚地区多雨多云的复杂天气条件以及水稻种植灵活的特点,利用MODIS时间序列数据,提出一种基于动态时间弯曲(DTW)距离的相似性判别的土地覆盖分类方法,对泰国东北部地区单、双季稻种植面积进行了遥感提取研究。针对研究区雨季遥感影像像元受到云覆盖影响严重,使用替换法去云,结合S-G滤波方法对计算得到的MODIS09A1数据的NDVI时序数据去噪,再采用DTW距离相似性方法逐像元比较与标准NDVI时间序列的时序相似性,将不同类型所得NDVI相似性值作为模糊分类隶属度参考值对泰国东北部地区单季稻、双季稻进行分类提取面积。最后结合野外采样数据、Google Earth高清遥感影像进行精度验证。结果表明,该方法能够用于针对东南亚多雨多云区水稻种植面积大范围监测。  相似文献   

12.
文章从内涵和外延两个角度研究了科技文献相似性度量问题,首先从科技文献内涵的角度在文献特征词字符匹配基础上采用泛化方法将待推荐文献关键词与当前文献关键词及其父/子关键词进行匹配;然后从外延角度结合科技文献项目的特点将文献共引因素引入文献相似性度量;最后根据关键词泛化相似度和共引关联度定义混合相似度(HS)对候选科技文献进行排序推荐,理论分析和实验数据表明,该算法能够在一定程度上避免遗漏“特征词字符不同,但语义相似”科技文献的问题.  相似文献   

13.
丁秀琴 《科技通报》2015,(4):199-201
采用传统算法进行混合型数据库查询,由于文档与查询的匹配过于严格,存在对检索词的重要程度无法区分的问题,造成无法进行检索结果的排序的缺陷。为此,提出了一种基于改进均值聚类算法的混合型数据库查询优化方法。建立混合型数据库查询执行计划代价模型,精准的定义了数据库查询执行代价。将改进均值聚类算法与粒子群算法有效的相融合,将粒子群中的粒子划分为多个子群,更新所有的粒子,通过粒子间的相互信息融汇,搜寻到数据库查询最优解。实验仿真证明,基于改进均值聚类算法的混合型数据库查询优化方法精确度高,效率高。  相似文献   

14.
基于中文的GIS查询界面的初步研究   总被引:8,自引:0,他引:8  
提出基于中文的GIS查询,以统计建模,模式匹配技术为核心,建立这种查询所需的词库,规则库,知识库,语言转换器,综合模糊识别技术,使GIS查询变得更为简单,最后以实例证明基于中文的GIS查询的方便性。  相似文献   

15.
【目的/意义】微博舆情监管是政府推进网络社会治理所面临的难题。对微博舆情进行研究有助于深入了 解微博舆情传播规律,为政府监管微博舆情提供建议。【方法/过程】首先通过分析微博舆情的社交网络结构特点, 对BA无标度网络进行改进。随后将模糊观点与Deffuant-Weisbuch模型融合,提出一种基于改进模糊相似度的舆 情演化规则。最后通过仿真实验分析微博舆情演化特征。【结果/结论】研究发现,模糊观点的类型对舆情演化的周 期与规模有影响。用户对于热门发现微博的关注度对舆情传播有影响。  相似文献   

16.
数字图像在压缩和融合等处理中会产生退化效应,当前对图像退化中质量评价指标如均方误差(MSE),峰值信噪比(PSNR)等不能有效反映图像在退化过程中传递性能,而只是单纯计算图像之间灰度值差异,对图像质量评价不准。提出一种利用Gabor传递函数相似性测度为评价指标的图像质量评价算法,采用图像的亮度、对比度和结构相似度为场景结构基准特征,设计Gabor传递函数。通过双正交滤波器得到Gabor传递函数相似性测度,该指标能有效反映图像退化演变过程中的传递性能,合理评价参考图像和失真图像质量。仿真实验表明,利用Gabor传递函数相似性测度指标评价图像质量,能准确反映图像失真等级,在几乎所有失真类型上都能有较满意的结果,评价结果比较稳定。  相似文献   

17.
基于关键词的文档层次查询   总被引:1,自引:0,他引:1  
文档查询是科学工作中的重要环节.从实现机理采看,文档查询是一种核心就是构建查询语句即设计查询界面及向数据库查询语句转化.提出了一种面向文档查询的查询树概念,将每个叶结点对应于一条SQL语句,而分支结点则表示子结点之间的并交差集合运算关系和其他运算关系,便于表达复杂文档查询要求.设计了查询树向SQL语句转化算法,将整个查询树合并为一条SQL语句,充分发挥DBMS 查询优化功能.  相似文献   

18.
一种大规模中文搜索日志的层次聚类方法   总被引:1,自引:0,他引:1  
孙锐  金澎 《科技通报》2012,28(8):83-85
提出一种层次聚类算法,旨在对搜索引擎的查询日志数据进行聚类分析。算法基于搜狗实验室公开的查询日志数据,通过3次划分完成查询文本聚类,每一次划分实现不同程度的降维。相似度参数可根据不同的聚类需求调整,算法可扩展性强。实验结果为查询推荐、相关性排序等提供了有力的依据。  相似文献   

19.
投资者情绪准确测度较为困难,因为其固有的动态复杂性和变化性。本研究通过对情绪测度理论方法进行系统分析,结合中国证券市场具体情境,基于卡尔曼滤波方法过滤掉市场噪声,选取封闭式基金折价率、新股上市首日收益率、新股发行数量、新增开户数四个指标,并通过滚动合成投资者情绪指数进而验证其有效性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号