首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 156 毫秒
1.
信息检索系统中的相关反馈技术   总被引:2,自引:0,他引:2  
本文论述了布尔模型、向量空间模型以及概率模型中所采用的相关反馈技术,其中主要集中于检索词权值调整以及查询扩展等两项技术。作者还讨论了相关反馈技术对检索性能影响的评估方法,并提出了相关反馈在实际应用中需要解决的问题。  相似文献   

2.
本文讨论了选择合适检索词的重要性以及常用的选择检索词的途径,指出为了向用户提供一个良好的检索环境,联机扩展功能应是联机检索系统的重要组成部分。文中以同济情报检索网络系统(TJIRNS)为例,论述了典型环境中联机扩展功能及其实现过程。  相似文献   

3.
MEDLINE(PubMed)和CJFD数据库检索方式比较研究   总被引:2,自引:0,他引:2  
数据库检索词的规范与检索策略的选择是数据库建设中值得关注的问题。本文以Medline(PubMed)和CJFD为例进行实证检索研究,显示的结果差异证实了上述判断。  相似文献   

4.
通过模糊集合检索模型的规范描述,本文首先定义了检索系统中检索效率和系统效率之间的函数关系,并应用该函数关系对比分析模糊集合检索系统和标准布尔检索系统的性能,指出模糊集合检索系统所面临的"囚徒困境":检索效率的提升引起了系统效率的下降.之后针对"囚徒困境",从词词关联矩阵方面来改进模糊集合检索策略,寻求到解决"囚徒困境"的思路和技术手段.最后借助SQL语言演示词词关联矩阵的两种构造策略,建立数学模型分析词词关联矩阵构造的最优时机,并确立该思路为一种新的系统开发模式.根据时机来合理选择词词关联矩阵构造策略有助于改善现有模糊集合检索算法的执行效率,实现检索效率和系统效率的双赢.  相似文献   

5.
检索词的选择和使用直接影响文献检索的查全率和查准率,笔者通过分析几个检索实例的检索过程,探讨了如何在中国生物医学文献数据库中选择和使用检索词,从而找出最佳检索策略,获得最佳检索效果。  相似文献   

6.
作根据自己从事献检索课教学和献检索服务工作的实践。介绍了献数据库的检索特点。重点就数据库检索中检索策略制定的技术性问题如检索词的选择、检索式的编写等做了详细介绍。  相似文献   

7.
简论标引用词和检索用词的差别   总被引:1,自引:0,他引:1  
马张华 《大学图书馆学报》1997,15(4):60,62-59,61
根据标引词和检索词的不同要求和特点,概要分析了两者在检索系统中的差别,并简要讨论了在标引和检索的不同阶段对词汇使用规律进行研究和探索应包括的基本内容及这一研究的意义  相似文献   

8.
网络信息检索的失误分析及扩检与缩检措施的选择   总被引:4,自引:0,他引:4  
将从检索系统或工具的选择,检索词的选择,以及检索提问表达式的调整与优化等方面分析网络信息检索失误的原因,并结合检索实例归纳了可以采取的扩检与缩检措施。  相似文献   

9.
张进 《图书馆学刊》2013,(12):42-44,90
以农业类科技查新为例,从检索资源、检索词与检索式3个方面探讨科技查新的信息检索策略。在检索资源方面,提出专业性原则与文献类型原则的选择标准,形成资源类型、学科属性与文献类型相结合的资源选择方法;在检索词方面,探讨检索词确定的一般过程与辅助工具的应用,并阐释农业查新项目的特点对检索词分析的影响;在检索式方面,探讨检索式构造的一般过程,形成常用农业科技查新检索系统的检索式构造技巧,并构造检索式通式。  相似文献   

10.
中文截词检索对主题词词汇控制的影响   总被引:2,自引:0,他引:2  
对汉语词组性主题词的结构特征和同义词、准同义词的词形特点进行了归类分析,指出截词检索技术的应用可以适度提高词汇的先组度,放宽对字面部分一致的一类同义词、准同义词的控制,而不影响检索效率,适用面向普通用户的情报检索系统  相似文献   

11.
In this paper, we propose a new term dependence model for information retrieval, which is based on a theoretical framework using Markov random fields. We assume two types of dependencies of terms given in a query: (i) long-range dependencies that may appear for instance within a passage or a sentence in a target document, and (ii) short-range dependencies that may appear for instance within a compound word in a target document. Based on this assumption, our two-stage term dependence model captures both long-range and short-range term dependencies differently, when more than one compound word appear in a query. We also investigate how query structuring with term dependence can improve the performance of query expansion using a relevance model. The relevance model is constructed using the retrieval results of the structured query with term dependence to expand the query. We show that our term dependence model works well, particularly when using query structuring with compound words, through experiments using a 100-gigabyte test collection of web documents mostly written in Japanese. We also show that the performance of the relevance model can be significantly improved by using the structured query with our term dependence model.
Koji EguchiEmail:
  相似文献   

12.
基于伪相关反馈的跨语言查询扩展   总被引:3,自引:2,他引:1  
相关反馈是一种重要的查询重构技术,本文分析了两类相关反馈技术,一是按用户是否参与可分为伪相关反馈和交互式相关反馈,二是按作用于查询的方式可分为查询扩展与检索词重新加权.在此基础上,本文重点探讨了将相关反馈技术应用于跨语言信息检索,提出了翻译前查询扩展、翻译后查询扩展、翻译前与翻译后相结合的查询扩展三种方法.最后,本文通过伪相关反馈实验对这三种方法进行了比较,实验结果显示,三种跨语言查询扩展方法都能够有效地提高检索结果的精度,其中翻译后查询扩展方法相对更优越.此外,查询式的长度对不同跨语言查询扩展方法产生着不同程度的影响.  相似文献   

13.
针对海量英文文献信息自动化处理问题,构建了一个基于英文超级科技词表的文献主题概念自动标引系统,采用词典与规则方法相结合的术语提取机制,实现了英文文献术语提取、规范概念映射以及优选概念标引等功能,取得了较好的标引效果。  相似文献   

14.
自动术语识别是知识抽取和文本挖掘等信息技术中的关键步骤。研究现有自动术语识别的主要思路,明确其中的关键问题,研究已有的相关项目和系统的术语识别方法,并分析现有的一些术语资源。借此丰富基于术语识别的文本挖掘理论和方法,为进一步构建相关试验系统提供良好借鉴。  相似文献   

15.
杨雅娜  刘胜奇 《情报工程》2015,1(5):025-031
提出 ATValue(Advanced TValue and Fieldhood Integration) 术语抽取法。为提高术语抽取质量,在 TValue 五属性的基础上,提出领域度。通过相关性分析获得六属性组合值 AValue,最后识别AValue 高于术语可信度的词串来选择候选术语。能源行业的实验结果表明:ATValue 术语抽取法的F值约比 TValue 术语抽取法高出 2 个百分点,原因在于 ATValue 的领域度测算了词串中各种单词对领域的贡献。  相似文献   

16.
The application of relevance feedback techniques has been shown to improve retrieval performance for a number of information retrieval tasks. This paper explores incremental relevance feedback for ad hoc Japanese text retrieval; examining, separately and in combination, the utility of term reweighting and query expansion using a probabilistic retrieval model. Retrieval performance is evaluated in terms of standard precision-recall measures, and also using number-to-view graphs. Experimental results, on the standard BMIR-J2 Japanese language retrieval collection, show that both term reweighting and query expansion improve retrieval performance. This is reflected in improvements in both precision and recall, but also a reduction in the average number of documents which must be viewed to find a selected number of relevant items. In particular, using a simple simulation of user searching, incremental application of relevance information is shown to lead to progressively improved retrieval performance and an overall reduction in the number of documents that a user must view to find relevant ones.  相似文献   

17.
个性化信息检索中的相关反馈技术研究   总被引:3,自引:0,他引:3  
简要介绍了相关反馈的研究现状及基本思想,在深入分析相关反馈的实现策略和在不同系统中设计的差别后,提出了相关反馈技术和个性化信息检索结合的模型,最后讨论引入数据融合的思想来进一步改善反馈效果。  相似文献   

18.
汉语科技词系统是科技词汇知识深层次组织与应用服务工具的集成体系。文章首先概述了词系统的内涵,然后总结了三年来在词汇自动获取、词空间构建和词聚类以及词系统的复杂网络分析评价上所取得的技术突破,并展望了科技词系统下一步的重点研发方向。  相似文献   

19.
用词上下文向量来表达文本集内一个词语与其他词语之间的上下文关系,并在词上下文向量的基础上生成分类器中所有类别的类别特征向量,以及待分类文本的特征向量,最后由分类器给出待分类文本的所属类别。实验显示,在类别特征向量和文本向量中融入词语上下文关系有助于改善文本分类效果。  相似文献   

20.
特征词抽取和相关性融合的伪相关反馈查询扩展   总被引:2,自引:0,他引:2  
针对现有信息检索系统中存在的词不匹配问题,提出一种基于特征词抽取和相关性融合的伪相关反馈查询扩展算法以及新的扩展词权重计算方法。该算法从前列n篇初检局部文档中抽取与原查询相关的特征词,根据特征词在初检文档集中出现的频度以及与原查询的相关度,将特征词确定为最终的扩展词实现查询扩展。实验结果表明,该方法有效,并能提高和改善信息检索性能。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号