共查询到19条相似文献,搜索用时 46 毫秒
1.
基于混合索引的中文全文检索系统研究 总被引:1,自引:0,他引:1
在中文全文检索系统中引入了混合索引,建立了混合索引之Hash索引,给出了Hash索引在内存中的存储结构,并给出了这种索引下的检索算法。这种索引既能保证索引的全面性,又能提高系统检索效率。通过实际构建系统,探讨了基于混合索引的中文全文检索系统的实现。 相似文献
2.
全文检索系统中动态索引技术的研究与实现 总被引:6,自引:1,他引:5
分析了传统全文检索系统中静态索引技术的实现,讨论了静态索引技术的优缺点;然后提出来一种动态索引技术,阐述了动态索引技术的原理,并在两个数据库开发平台上给出了动态索引技术的实现。 相似文献
3.
4.
5.
主要探讨目前一种较新的PAT数组全文索引技术,尝试将PAT数组索引结构应用于中文文本,并针对其索引创建效率的不足提出了改进算法,理论分析与实验结果证明改进提高了效率。 相似文献
6.
7.
汉字全文检索系统的关键技术与实现 总被引:14,自引:1,他引:13
全文检索作为一种发展迅速的情报检索技术, 在近年来已得到广泛的关注并走向市场。本文在对中西文全文检索系统进行分析比较的基础上, 做出了新的尝试, 提出了一种新的索引建立方式, 并在此基础上实现了支持模糊提问的全文检索。同时独立设计了自己的数据结构和算法, 以及利用V isual C+ + 在W indows 环境下加以实现。最后, 对目前汉字全文检索中仍存在的一些问题进行了探讨。 相似文献
8.
中文全文检索技术的研究及实现 总被引:9,自引:0,他引:9
本文设计了一个中文全文检索系统 ,在单汉字全文数据库的基础之上进行了全文检索的算法研究 ,提出了针对特定检索策略的计算公式。同时还对检索结果集的排序问题进行了讨论 ,并采用用户反馈信息量 ,使最后检出的结果在应用中不断得到优化 相似文献
9.
本文分析了<申报>的学术价值和数字化的必要性,介绍了Lucene检索系统的优势和结构,针对<申报>的全文检索需求,提出了基于Lucene的全文检索方案并介绍了实现改方案的关键技术. 相似文献
10.
用JAVA+XML实现网站全文检索 总被引:2,自引:0,他引:2
介绍了用JAVA和XML实现网站站内全文检索的实现过程,即用java编写索引工具,对WEB文档进行索引,索引结果写入XML文档;用Servlet和JDOM实现读取和查询XML文档,并在客户返回查询结果。 相似文献
11.
全文检索算法设计及全文检索系统概述 总被引:10,自引:1,他引:9
钱爱兵 《现代图书情报技术》2003,19(2):42-44
该文首先介绍了全文检索在我国的研究历程,然后阐释了三种全文检索算法,比较了彼此的优缺点,最后对国内的全文检索系统做了一个概要的介绍。 相似文献
12.
13.
吴绍根 《现代图书情报技术》2006,1(7):25-28
介绍基于模式自动机的全文检索系统的工作原理、体系结构,并给出基于模式自动机的全文索引数据库的核心数据结构和相关的生成算法、检索算法和模式自学习算法。 相似文献
14.
15.
文本信息检索技术进展和性能评价框架 总被引:6,自引:0,他引:6
曾民族 《现代图书情报技术》1997,13(3):14-18
本文介绍TREC 评价信息检索系统的动向及其在推动研制新型检索系统中所起的作用, 并介绍新型检索系统的模式和特征及国外商品化全文文本检索系统性能评测指标。文中探讨了文本信息检索的性质评价标准问题, 并提出一个中文文本信息检索的系统评价框架。 相似文献
16.
基于XML的全文检索原型系统的设计与实现* 总被引:1,自引:0,他引:1
针对当前单位网站搜索引擎存在的索引速度慢、更新不及时、检索效率低等问题,在深入分析和研究Lucene和XML等技术在建立搜索引擎方面优越性能的基础上,构建一个基于XML的全文检索原型系统。该系统以XML作为通用数据接口,以Lucene作为实现平台,能够实现快速及时索引和提高检索效率的目的。 相似文献
17.
Lucene全文检索的应用及检索效率测试研究 总被引:1,自引:0,他引:1
使用Lucene设计一个全文检索系统,系统由三大功能模块组成:索引模块、检索模块和存储模块.第二部分着重分析PDF数据转换,XML文档设计,索引的分词、建立及效率等技术难点,并对中文分词分析器、索引文件膨胀率、索引影响因子及检索系统并对检索响应时间进行测试.应关注XML数据库的安全性. 相似文献
18.
19.