首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 60 毫秒
1.
中文全文检索技术的研究及实现   总被引:9,自引:0,他引:9  
李梅  王庆林 《情报学报》2003,22(1):10-17
本文设计了一个中文全文检索系统 ,在单汉字全文数据库的基础之上进行了全文检索的算法研究 ,提出了针对特定检索策略的计算公式。同时还对检索结果集的排序问题进行了讨论 ,并采用用户反馈信息量 ,使最后检出的结果在应用中不断得到优化  相似文献   

2.
浅谈全文检索技术   总被引:1,自引:0,他引:1  
一、全文检索技术及其特点 "全文检索(Full-Text Retrieval)是指以全文本信息作为检索对象,建立全文数据库,除了具有布尔逻辑检索功能外,还具有文本检索功能,并允许用户以自然语言检索,直接获得原文中的有关章节和段名."①  相似文献   

3.
本文指出全文检索的实质是"关键词检索 计算机辅助文本浏览".详细分析了全文检索适应的和不适应的检索范围,说明它有较大局限性.对索引的一般原理和两大类型索引的功能作了说明,并与全文检索的功能作了比较,指出全文检索不可能取代各种索引的功能.最后指出全文数据库的两种理想模式.  相似文献   

4.
现代信息化数字化的档案资料规模越来越大,如果继续使用现有的结构化的模糊查询语言,会降低查询效率。基于Lucene架构的全文检索技术,为大规模的档案资料查询和管理提供了高速而又准确的方法。  相似文献   

5.
全文检索系统中动态索引技术的研究与实现   总被引:6,自引:1,他引:5  
分析了传统全文检索系统中静态索引技术的实现,讨论了静态索引技术的优缺点;然后提出来一种动态索引技术,阐述了动态索引技术的原理,并在两个数据库开发平台上给出了动态索引技术的实现。  相似文献   

6.
全文检索在数字图书馆中的发展与应用   总被引:6,自引:0,他引:6  
简要介绍了全文检索的特点、功能及应用,论述了网络时代全文检索的发展趋势和在数字图书馆中的应用问题。  相似文献   

7.
基于混合索引的中文全文检索系统研究   总被引:1,自引:0,他引:1  
在中文全文检索系统中引入了混合索引,建立了混合索引之Hash索引,给出了Hash索引在内存中的存储结构,并给出了这种索引下的检索算法。这种索引既能保证索引的全面性,又能提高系统检索效率。通过实际构建系统,探讨了基于混合索引的中文全文检索系统的实现。  相似文献   

8.
针对词典类软件的特点, 用四种不同技术实现支持全文检索的词典类软件, 包括单机版、企业版和网络版。分析各种技术的实现方法、技术特点和测试结果, 最终作以评价。  相似文献   

9.
浅析基于超文本的全文检索技术   总被引:1,自引:0,他引:1  
本文重点探讨了全文检索的概念及其实现方式,以及超文本的概念和结构组成,在此基础上提出一个超文本全文检索系统参考模型。  相似文献   

10.
SQL Server 2000全文检索服务的实现与使用   总被引:1,自引:0,他引:1  
论文首先介绍了全文检索的主要方法及其发展现状.接着给出一个使用SQL Server 2000实现全文检索服务的实例,并用ASP调用ADO控件,在Web平台上实现了全文的布尔检索和加权检索.最后对SQL Server2000的全文检索服务进行了简单分析.  相似文献   

11.
潜在语义标引(LSI)的提出,使信息检索由传统的基于关键词的检索开始进入基于概念的语义检索阶段,有效提高了信息检索系统的性能。本文在回顾我国潜在语义标引技术的研究成果基础上,分析、总结了我国现有潜在语义标引研究的不足,指出了我国潜在语义标引的进一步研究方向。  相似文献   

12.
社会标注在网络中的应用越来越广泛,它为信息资源的标引、组织、检索提供了一种全新的模式。国外学者对社会标注的信息标引功能和标引方式、社会标注系统在信息检索中的功用及基于社会标注的信息检索技术等方面进行了研究,取得了一系列成果,但还存在不足之处。该领域的研究趋势在于规范化社会标注的表达,去除标签噪声及垃圾,使标签序化、层级化等。  相似文献   

13.
Intelligent Indexing and Semantic Retrieval of Multimodal Documents   总被引:2,自引:0,他引:2  
Finding useful information from large multimodal document collections such as the WWW without encountering numerous false positives poses a challenge to multimedia information retrieval systems (MMIR). This research addresses the problem of finding pictures. The fact that images do not appear in isolation, but rather with accompanying, collateral text is exploited. Taken independently, existing techniques for picture retrieval using (i) text-based and (ii) image-based methods have several limitations. This research presents a general model for multimodal information retrieval that addresses the following issues: (i) users' information need, (ii) expressing information need through composite, multimodal queries, and (iii) determining the most appropriate weighted combination of indexing techniques in order to best satisfy information need. A machine learning approach is proposed for the latter. The focus is on improving precision and recall in a MMIR system by optimally combining text and image similarity. Experiments are presented which demonstrate the utility of individual indexing systems in improving overall average precision.  相似文献   

14.
刘秋宏  李淑芝 《情报学报》2003,22(4):434-438
国外族性化学结构标引及检索方法的研究始于20世纪50年代,目前已基本成熟,其中最有代表性的是STN和Questel*Orbit两大国际联机检索系统中的REGISTRY、MARPAT和MMS族性化学结构数据库.我国在该领域的研究始于20世纪80年代,现正在进行之中.研究国外族性化学结构标引及检索方法对加速我国化学结构数据库的建设具有现实意义.本文将我国正在使用和正在研究中的化学结构标引及检索系统与国外两大系统进行对比,从中找出差距,对我国族性化学结构标引及检索系统提出了改进建议.  相似文献   

15.
索引性能是衡量搜索引擎优劣的一个重要指标。文章通过实验的方法,用TREC-4和WT10g数据集合分别对12种主流开源搜索引擎做了两组索引测试,记录了它们在索引不同大小数据集合时的时间开销和资源消耗情况,并根据实验数据对这些搜索引擎的索引性能进行了比较和评估。  相似文献   

16.
网络环境信息标引的测评与比较研究   总被引:1,自引:1,他引:0  
网络环境下,文献信息具有数量多、增长快、新词层出不穷等特点。标引是对信息资源进行组织的有效手段和重要环节,标引的质量和效率直接影响信息组织的质量和速度。对受控标引、自由标引和自动标引三种标引方式进行了相符度、专指度、标引深度及通用词数的测试对比.得出自由标引优于受控标引,自动标引优于自由标引及受控标引的结论。  相似文献   

17.
中文自动标引是图书馆学情报学界多年研究的问题并取得了一定成果,其在信息检索数据库研究领域不可或缺。随着全文检索和中文搜索引擎的盛行,中文信息处理有多个学科涉及。中文自动标引、全文检索和中文搜索引擎是什么关系有必要加以明确,以确定其在中文信息处理领域的地位。经探讨认为,全文检索利用了中文自动标引的各种方式,搜索引擎利用了全文检索,因此搜索引擎利用了中文自动标引。中文自动标引、全文检索及中文搜索引擎三者关系是中文自动标引被利用和在技术发展方面相互促进的关系。  相似文献   

18.
论自动标引的实际应用   总被引:2,自引:0,他引:2  
探讨电子环境下自动标引的特点、标引观念的转变以及影响自动标引的因素等问题。  相似文献   

19.
文章根据期刊论文自身的特点和应用需求,分析期刊论文元素标引的意义,设计期刊论文元素标引规范的制定流程,并深入分析和研究标引规范的内容结构、元素构成及互操作框架,在此基础上提出了期刊论文的核心元数据、文档结构、深度内容三个方面的标引元素,同时指出了下一阶段研究工作的主要方向。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号