首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 46 毫秒
1.
基于混合索引的中文全文检索系统研究   总被引:1,自引:0,他引:1  
在中文全文检索系统中引入了混合索引,建立了混合索引之Hash索引,给出了Hash索引在内存中的存储结构,并给出了这种索引下的检索算法。这种索引既能保证索引的全面性,又能提高系统检索效率。通过实际构建系统,探讨了基于混合索引的中文全文检索系统的实现。  相似文献   

2.
全文检索系统中动态索引技术的研究与实现   总被引:6,自引:1,他引:5  
分析了传统全文检索系统中静态索引技术的实现,讨论了静态索引技术的优缺点;然后提出来一种动态索引技术,阐述了动态索引技术的原理,并在两个数据库开发平台上给出了动态索引技术的实现。  相似文献   

3.
浅谈全文检索技术   总被引:1,自引:0,他引:1  
一、全文检索技术及其特点 "全文检索(Full-Text Retrieval)是指以全文本信息作为检索对象,建立全文数据库,除了具有布尔逻辑检索功能外,还具有文本检索功能,并允许用户以自然语言检索,直接获得原文中的有关章节和段名."①  相似文献   

4.
现代信息化数字化的档案资料规模越来越大,如果继续使用现有的结构化的模糊查询语言,会降低查询效率。基于Lucene架构的全文检索技术,为大规模的档案资料查询和管理提供了高速而又准确的方法。  相似文献   

5.
主要探讨目前一种较新的PAT数组全文索引技术,尝试将PAT数组索引结构应用于中文文本,并针对其索引创建效率的不足提出了改进算法,理论分析与实验结果证明改进提高了效率。  相似文献   

6.
基于词索引的中文全文检索关键技术及其发展方向   总被引:2,自引:0,他引:2       下载免费PDF全文
基于词索引的中文全文检索的研究是一个涉及到多个领域的综合性课题。汉语自动分词的精度和速度、词索引数据库的结构、词汇控制技术、检索匹配机制等是影响中文全文检索效果的关键因素。目前基于词索引的中文全文检索技术还在分词技术、网络信息标引的准确率、查全率、查准率以及查询方式上存在局限。未来的中文全文检索将最终在语义、语用、语境层次上实现智能化的信息检索。  相似文献   

7.
汉字全文检索系统的关键技术与实现   总被引:14,自引:1,他引:13  
全文检索作为一种发展迅速的情报检索技术, 在近年来已得到广泛的关注并走向市场。本文在对中西文全文检索系统进行分析比较的基础上, 做出了新的尝试, 提出了一种新的索引建立方式, 并在此基础上实现了支持模糊提问的全文检索。同时独立设计了自己的数据结构和算法, 以及利用V isual C+ + 在W indows 环境下加以实现。最后, 对目前汉字全文检索中仍存在的一些问题进行了探讨。  相似文献   

8.
中文全文检索技术的研究及实现   总被引:9,自引:0,他引:9  
李梅  王庆林 《情报学报》2003,22(1):10-17
本文设计了一个中文全文检索系统 ,在单汉字全文数据库的基础之上进行了全文检索的算法研究 ,提出了针对特定检索策略的计算公式。同时还对检索结果集的排序问题进行了讨论 ,并采用用户反馈信息量 ,使最后检出的结果在应用中不断得到优化  相似文献   

9.
本文分析了<申报>的学术价值和数字化的必要性,介绍了Lucene检索系统的优势和结构,针对<申报>的全文检索需求,提出了基于Lucene的全文检索方案并介绍了实现改方案的关键技术.  相似文献   

10.
用JAVA+XML实现网站全文检索   总被引:2,自引:0,他引:2  
介绍了用JAVA和XML实现网站站内全文检索的实现过程,即用java编写索引工具,对WEB文档进行索引,索引结果写入XML文档;用Servlet和JDOM实现读取和查询XML文档,并在客户返回查询结果。  相似文献   

11.
全文检索算法设计及全文检索系统概述   总被引:10,自引:1,他引:9  
该文首先介绍了全文检索在我国的研究历程,然后阐释了三种全文检索算法,比较了彼此的优缺点,最后对国内的全文检索系统做了一个概要的介绍。  相似文献   

12.
提出了汉字全文检索系统的新的数据结构、建库和检索的算法,完成了程序设计、用于对中国化学文献数据库标题和文摘的检索,测定了索引建立时间、空间消耗和检索的响应时间,计算了每篇文献的长度在不同范围时的高频字数和索引空间消耗,讨论了索引膨胀比与文献长度的关系  相似文献   

13.
介绍基于模式自动机的全文检索系统的工作原理、体系结构,并给出基于模式自动机的全文索引数据库的核心数据结构和相关的生成算法、检索算法和模式自学习算法。  相似文献   

14.
基于WWW的全文检索系统的研究   总被引:1,自引:0,他引:1  
分析了基于WWW的全文检索系统的特点、实现的过程和主要的技术,并利用ASP和ADO技术给出了一个具体的实现方案。  相似文献   

15.
文本信息检索技术进展和性能评价框架   总被引:6,自引:0,他引:6  
本文介绍TREC 评价信息检索系统的动向及其在推动研制新型检索系统中所起的作用, 并介绍新型检索系统的模式和特征及国外商品化全文文本检索系统性能评测指标。文中探讨了文本信息检索的性质评价标准问题, 并提出一个中文文本信息检索的系统评价框架。  相似文献   

16.
基于XML的全文检索原型系统的设计与实现*   总被引:1,自引:0,他引:1  
针对当前单位网站搜索引擎存在的索引速度慢、更新不及时、检索效率低等问题,在深入分析和研究Lucene和XML等技术在建立搜索引擎方面优越性能的基础上,构建一个基于XML的全文检索原型系统。该系统以XML作为通用数据接口,以Lucene作为实现平台,能够实现快速及时索引和提高检索效率的目的。  相似文献   

17.
Lucene全文检索的应用及检索效率测试研究   总被引:1,自引:0,他引:1  
使用Lucene设计一个全文检索系统,系统由三大功能模块组成:索引模块、检索模块和存储模块.第二部分着重分析PDF数据转换,XML文档设计,索引的分词、建立及效率等技术难点,并对中文分词分析器、索引文件膨胀率、索引影响因子及检索系统并对检索响应时间进行测试.应关注XML数据库的安全性.  相似文献   

18.
中文全文检索系统H——QWJS的设计与实现   总被引:1,自引:0,他引:1  
叙述通用中文全文检索系统H-QWJS的总体设计思想,给出该软件系统的主要特点、功能模块、数据库组织。最后简要叙述系统的运行环境。  相似文献   

19.
论文对如何从网上免费获取医学中英文全文的方法与技巧进行了研究与介绍.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号