首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 16 毫秒
1.
针对目前常用的信息检索算法普遍存在查询性能不高的问题。本文提出了一种基于AWAR算法的信息检索扩展查询模型,该模型首先采用传统向量空间模型算法对检索目标进行初检,然后利用最小完全加权置信度阈值生成完全加权关联规则,最后根据规则提取扩展词,得到查询结果。实验表明,基于AWAR算法的信息检索扩展查询模型的检索性能比传统向量空间模型算法和基于局部上下文分析的查询扩展的检索算法要高。  相似文献   

2.
提出一种信息检索中基于频繁项集的查询优化算法.实验结果表明,该算法有效,其扩展词能提高和改善信息检索性能.  相似文献   

3.
梁珊  邱明涛  马静 《情报科学》2017,35(7):44-49
【目的/意义】考虑到使用LDA模型进行主题抽取时,抽取到的特征词是无序的,破坏了原有的主谓宾结 构,导致抽取效果不准确,可读性差的缺陷,构造了WO词序模型,并将LDA模型与WO模型结合,提出了基于 LDA-WO混合模型的微博主题有序特征抽取算法。【方法/过程】使用LDA模型进行主题建模,获得无序特征词, 然后通过WO模型对特征词进行排序,将特征词与原语料进行对比,构造特征词-语料位置矩阵,通过对特征词的 位置排序,构造特征词词序权值矩阵,最终获得有序的特征词,完成对话题特征的有序抽取。【结果/结论】本文以真 实新浪微博数据为实验对象,实验结果表明基于LDA-WO模型的特征词提取方法进行特征抽取,抽取到的特征词 可读性更强,可弥补传统LDA模型在话题可解释性上的不足。  相似文献   

4.
在Web信息检索中,为了明确用户的查询需求,很多搜索引擎和全文数据库提供了相关词提示功能。本文简要介绍了Web信息检索中相关词提示的获取技术,并对相关词提示效果进行实际调查分析。从关键词库中随机抽取若干关键词,在选定的搜索引擎和全文数据库上进行信息检索,获取抽样关键词的相关提示词。通过关键词检索、人工打分和数据统计,进行查询扩展分析、查询式专指度分析和查准率分析,给出相关词提示在改善检索效果和用户满意度方面的综合评价。  相似文献   

5.
针对传统的信息检索方法采用基于关键词匹配的模式,导致查询效率低下的问题,利用同义词对查询术语进行扩展,提出了一种用于信息检索的贝叶斯网络模型扩展,并引入词共现的方法挖掘术语之间的相关关系。实验结果袁明,新模型能够有效地提高检索效率。  相似文献   

6.
关联规则挖掘在网络信息检索中的应用   总被引:3,自引:1,他引:2  
针对目前网络信息检索效率不高的问题,提出了一种基于关联库的查询扩展方法。此方法通过将文档用向量空间模型表示,然后,抽取文档中的特征语词/概念,再利用关联规则挖掘技术揭示文档中语词/概念之间的相关性和层次关系,从而构建关联库。通过关联库对用户的查询需求进行扩展以达到提高查全率和查准率的目的。  相似文献   

7.
当前超文本查询算法存在查询关键词和超文本用词不匹配的问题,导致查询精度低,效率低下。为此,提出一种新的基于关联规则的大型关系数据库超文本查询算法,对权重计算过程、关联规则算法和信息检索模型进行分析。利用起始查询结果的前几篇超文本对关联规则进行挖掘,选取包含起始查询项的关联规则建立规则数据库,挑选出和查询词相关度最高的几个词作为扩展词,和起始查询结合成新的查询后重新查询,通过K-means聚类算法对新的查询结果进行聚类解析,求出各篇超文本的最后相关度,按照降序顺序对相关度进行排列,输出查询结果。实验结果表明,所提算法精度和效率高。  相似文献   

8.
通过对文本数据库的优化索引提高信息检索功能,传统的数据库索引方法采用单层文本特征聚类方法,聚类特征不一致时,存在非法聚类和非法结果输出的安全问题。提出一种基于虚拟数据加速分布重组的数据库索引技术,首先构建虚拟数据加速分布重组模型,改进数据库的分布模型,提高对文本数据的索引能力,把需要的文档集经过预处理后,构建文本数据库,算出各个候选扩展词的权重后,需要根据各个词与原查询词的相关度,构成数据库文本扩展词集合,采用相关规则挖掘的规则词作为扩展,得到了虚拟数据的加速分布系统状态函数,构建规则库,从中提取与原查询相关的扩展词,进而实现查询扩展,实现数据库索引算法改进。仿真结果表明,该算法进行文本数据库索引的收敛性好,检索精度和有效连接数较高,执行时间短,展示了其优越性。  相似文献   

9.
信息检索加权理论与技术:基于VSM模型的分析   总被引:1,自引:0,他引:1  
分析了信息检索加权技术的理论基础,探讨了局部统计分布特性和全局分布特性在词加权技术中的应用以及不对称分布对加权性能的影响,结合词加权技术的基本原理提出了词加权形式化描述与计算模型,并运用该模型对基于向量空间模型的加权技术及其优化策略进行了分析.针对加权技术需解决的关键问题描述文献内容和区分文献,提出计算文献权重应同时利用特征词局部分布和全局分布信息,并消除文献长度和语义信息缺乏等不对称分布问题的影响.  相似文献   

10.
王芳  万常选 《情报杂志》2008,27(1):121-123
分词技术是影响信息检索查准率和查全率的一个重要方面,也是信息检索技术的关键问题和难点之一.针对信息检索中,某些单词整体组合更有意义、更能体现用户查询意图的情况,给出完整词概念,提出了完整词查询识别的基本方法及其改进方法,最后还给出了三种进行预识别完整词的方法,并讨论了它们各自的优缺点.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号