首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 23 毫秒
1.
时态信息检索是近年来的研究热点,很多解决方案是在检索模型中考虑时间相关性。提出一种支持隐式时间查询的文档排名方法,使用考虑内容相关性排名结果的前k个文档分析查询的时间意图,然后使用排名模型计算各个文档时间相关性得分。实验结果表明,在排名模型中引入时间因素有利于提升检索性能。  相似文献   

2.
为解决信息检索应用实践中存在用户表达查询请求不够准确、文档与查询词不匹配以及查询优化等影响检索性能的问题,提出一种基于深度学习的概念语义空间查询扩展方法。利用深度学习算法为各个原查询词构建概念树,并使用WordNet将这些概念树向上溯源,建立完整的概念语义空间。以共现信息为特征参数对扩展源进行筛选,同时引入平均互信息及观察窗口得到相关度算法,通过共现信息衡量单词之间的关联度。在TREC数据集上的实验表明:与传统伪相关反馈算法的扩展质量相比,该扩展算法有所改进。  相似文献   

3.
为了满足基于Web的XML数据信息的近似搜索、数据挖掘、信息分类以及数据交换的需求,分析了XML文档相似性度量方法一集合度量方法、线性度量方法和代价度量方法。提出基于权重代价的机器学习的XML文档相似性度量算法。实验表明该算法扩展了XML文档查询范围,提高了文档的查全率和查准率。  相似文献   

4.
分析了现有搜索引擎重排序方法的不足,并在此基础上提出了基于文档间距离的重排序算法。利用相关性函数,表示出文档间的相关性与文档间距离的关系,通过计算得到文档之间距离的大小顺序,进而得到文档的相关性大小顺序,然后根据文档所属主题概率,最终得到文档的排序。实验表明,该算法大大提高了用户的检索速度与质量,优化了搜索引擎的性能。  相似文献   

5.
针对传统检索模型局限于语法层次上关键词匹配的特点,以领域本体为知识组织方式,提出了一种基于领域本体的语义检索模型,同时给出了该模型中的查询语义扩展算法和相似度计算算法。  相似文献   

6.
针对URMS的特点,在其查询组件中设计了一种基于流的XML查询算法.详细地介绍了由查询表达式构造查询自动机的步骤;实现了一个基于流的XML文档查询系统的原型.通过实验表明,提出的方法能够适应XML流的查询,在内存利用率上优于传统的基于内存的XML查询算法.  相似文献   

7.
为改善WCMA算法简单根据时间间隔和平均值计算GAP因子的不足,提出一种基于天气相似度的太阳能收集功率预测方法D-WSMA。根据参考天和参考时刻对预测值的影响程度不同,采取相似度刻画数据间关系,动态调整参考天和参考时刻的权重以及历史参考时刻的加权平均值,从而得到可变化的DGAP因子。同时,根据数据波动性特征,改进原有算法中的固定权重α,得到动态变化权重因子dα。实验结果表明,D-WSMA预测精度相对WCMA算法提高了14.04%、28.30%、4.76%、12.58%,平均提高了15%。因此,D-WSMA预测方案具有良好性能,适合更加多样化的天气条件。  相似文献   

8.
《滁州学院学报》2022,(2):24-27
针对社交网络好友推荐算法的精确度问题,提出了一种基于改进蚁群算法的社交网络好友推荐算法,通过综合考虑用户属性和交互信息,计算用户间的相似度,来进行链路预测,建立社交网络二维图。在此基础上,采用改进蚁群算法,相似性值高的用户被推荐的可能性增大。仿真实验表明,该算法准确率和召回率性能较好。  相似文献   

9.
用于改善web搜索的结构化数据抽取技术   总被引:1,自引:0,他引:1  
为了提高web文本搜索质量,提出了基于语义结构化数据的查询扩展方法.通过分析属性的语义特征(文档频率特征和辨识能力特征)将属性分为概念属性、背景属性和无用属性3类,并且提出了衡量属性语义相关度的标准.设计了trie-bitmap和pair pointer table数据结构来实现发掘属性语义特征和检测属性语义相关度的有效算法.通过使用合适的属性和它们的语义关系,可以为查询关键字生成扩展词并将它们嵌入到具有插值参数的向量空间模型中.实验使用IMDB电影数据库和真实文本数据集来比较所提方法和原始向量空间模型的性能.实验结果证明所提出的查询扩展方法可以有效地提高文本搜索性能,同时属性语义特征和属性语义相关度都具有良好的分类能力.  相似文献   

10.
基于向量空间模型的多关键字检索技术   总被引:1,自引:0,他引:1  
根据HTML文档不同标签域的分布特征和对文档内容的代表能力不同,本文提出了一种改进的向量模型;针对Web信息检索的特点,给出了一种多关键字查询向量的构建方法。最后通过文档向量与查询向量之间的相关度对检索结果进行优化,提高查准率。  相似文献   

11.
搜索引擎是目前最主要的WWW信息检索的工具,然而,用户对当前搜索引擎的检索效果并不满意.论文给出了基于文档文本内容和文档间超链信息的混合相似度计算方法,并给出了基于混合相似度的模糊(软)聚类算法HTSC.对HTSC算法进行了理论分析,并对其中的核心算法进行了初步的实验验证.该算法可对搜索引擎返回的结果进行模糊聚类,以方便用户从中找到真正需要的信息.  相似文献   

12.
一种基于超级链接结构的WWW模糊聚类算法   总被引:2,自引:0,他引:2  
搜索引擎是目前最主要的WWW信息检索的工具,然而,用户对当前搜索引擎的检索效果并不满意。论文给出了基于文档文本内容和文档间超链信息的混合相似度计算方法,并给出了基于混合相似度的模糊(软)矣类算法HTSC。对HTSC算法进行了理论分析,并对其中的核心算法进行了初步的实验验证。该算法可对搜索引擎返回的结果进行模糊聚类,以方便用户从中找到真正需要的信息。  相似文献   

13.
查询与结果排序是文献检索系统的两个重要指标,直接影响着用户对文献资源的利用率。针对目前文献检索排序策略上存在的不足,从用户检索文献的需求出发,在Skyline算法的基础上提出一种基于Skyline关联度的多目标优化文献检索排序方法,将文献之间的关联程度作为查询算法的主要条件进行检索和排序,从而将有价值的资源挖掘出来。最后,基于CNKI数据库平台对相关文献进行检索,并应用所设计模型对检索结果进行重新排序。结果表明,该方法可有效优化排序结果,将关联度较高的文献信息挖掘出来,满足用户对期望资源的检索要求,提高了文献的利用率,具有一定的参考价值。  相似文献   

14.
为降低经济指标众多及外部因素给经济预测准确度带来的影响,有效提高区域经济预测性能,借助元学习算法的小样本分析优势,提高随机森林算法的适用性,实现区域经济预测。根据区域经济统计数据选取多个数据样本,构建随机森林算法的经济预测模型,通过多个弱分类器投票获得经济预测结果;考虑弱分类器权重数量较少,借助元学习算法对权重进行优化;采用优化的随机森林算法模型完成区域经济预测,并选取中等城市和区不同数量规模的经济样本进行多个经济指标预测仿真。结果表明,经过元学习优化后,随机森林算法在区域生产总值、进口额增长率和居民消费价格指数等方面的预测误差率均有大幅下降,元学习对随机森林算法的优化效果显著。  相似文献   

15.
基于混合遗传算法的关系型数据库多连接查询优化   总被引:1,自引:0,他引:1  
倪小剑 《鄂州大学学报》2005,12(6):16-18,28
该文分析了关系型数据库的查询优化问题,针对多连接查询提出将遗传算法和爬山法结合,从而构造了关系型数据库多连接查询优化问题的混合遗传算法,并进行了实验计算。结果表明,用混合遗传算法解决多连接查询优化问题,可以发挥遗传算法和爬山法的不同优势,从而得到较满意的查询优化性能。  相似文献   

16.
数据库访问的效率是决定应用系统执行效率的关键因素之一.索引的设计应建立在对各种查询的分析和预测上.通过在Microsoft SQL Server 2008上对四种索引方案的测试,提出了利用索引优化数据查询的方法.在实际应用时,要根据系统的实际情况,权衡修改性能和检索性能的需求,选用合理的索引策略.  相似文献   

17.
在自动文本分类中,TF IDF算法是最为常用的特征权重计算方法。该算法运用广泛,但是存在不足:只考虑了特征词的频率和包含特征词的文档数量,没有考虑到特征词在类内和类间对权重的影响。对特征词权重计算方法进行了改进。为了解决特征词在类内均匀分布以及在类间的比重问题,提出了修正函数TF DFI DFO。实验比较发现,新的特征词权重算法能够更加精确地反映出特征词的分布情况,该算法与传统的TF IDF算法相比,在召回率、查准率和宏平均值上都有较大的提升。  相似文献   

18.
逆向Skyline查询能够应用到诸如决策支持、用户偏好支持以及市场行为分析等方面.由于参考对象q的存在,在执行逆向Skyline查询的过程中数据空间被划分成许多分区.然而,存在的算法都没有考虑这个问题的影响,直接使用原始数据集建立索引结构.本文提出了一种新的逆向Skyline查询方法CRSQ,它考虑了这个问题.CRSQ首先根据查询对象q对数据进行聚类,然后建立R-tree索引,最后利用高效修剪策略修剪索引搜索空间.实验结果表明CRSQ算法是有效的,它相对于没有聚类技术的算法获得了50 %以上的性能提高.  相似文献   

19.
互联网中沉淀了大量可分析利用的数据,如何有效地利用这些海量数据,为不同行业产品制造方提供对新产品的分析,已成为时下的热点。反向Top-k查询技术是一种常用的数据分析及处理技术,并且已经在很多领域得到了应用。研究了已有的基于反向Top-k的查询算法Skyband based算法和Branch and bound算法,针对很多实际应用领域偏好权重向量会出现改变的情况,提出了一种适用于进行“二次计算”的交互式算法,通过实验将交互式算法跟效率高的Branch and bound算法对比得出,当用户修改部分偏好权重向量之后,利用交互式算法可以比Branch and bound算法更加高效率地计算出结果。  相似文献   

20.
图像检索系统根据用户的反馈信息自适应的调整查询策略,使系统查询的结果进尽可能的与用户实际需求相吻合。本文描述了一个基于修改特征权重的图像检索反馈算法,基本思想是基于图像集合的标准方差来对图像的特征向量进行权重修改。基于此算法,设计和实现了一个基于内容的图像检索反馈系统。实验证明,此系统比传统的检索系统有优势,精度更高。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号