首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
面向大规模语料库的全文检索系统研究   总被引:1,自引:0,他引:1  
随着语料库规模的不断扩大和基于语料库的应用研究逐步拓展,对语料库的全文检索成为语料库系统中不可缺少的重要的组成部分。文章对面向大规模语料库的全文检索系统的索引模式、检索算法、检索表达式的构建、自动分词、系统组成等进行了研究,并基于大规模语料库的语言文字信息处理和应用研究的需要,开发了中文信息处理系统——“CIPP”。目前该系统具有全文检索、自动分词、语言统计等功能,在千万字数量级的语料库中,其全文平均检索时间小于1秒。  相似文献   

2.
全文检索算法设计及全文检索系统概述   总被引:10,自引:1,他引:9  
该文首先介绍了全文检索在我国的研究历程,然后阐释了三种全文检索算法,比较了彼此的优缺点,最后对国内的全文检索系统做了一个概要的介绍。  相似文献   

3.
基于混合索引的中文全文检索系统研究   总被引:1,自引:0,他引:1  
在中文全文检索系统中引入了混合索引,建立了混合索引之Hash索引,给出了Hash索引在内存中的存储结构,并给出了这种索引下的检索算法。这种索引既能保证索引的全面性,又能提高系统检索效率。通过实际构建系统,探讨了基于混合索引的中文全文检索系统的实现。  相似文献   

4.
本文指出全文检索的实质是"关键词检索 计算机辅助文本浏览".详细分析了全文检索适应的和不适应的检索范围,说明它有较大局限性.对索引的一般原理和两大类型索引的功能作了说明,并与全文检索的功能作了比较,指出全文检索不可能取代各种索引的功能.最后指出全文数据库的两种理想模式.  相似文献   

5.
中文全文检索技术的研究及实现   总被引:9,自引:0,他引:9  
李梅  王庆林 《情报学报》2003,22(1):10-17
本文设计了一个中文全文检索系统 ,在单汉字全文数据库的基础之上进行了全文检索的算法研究 ,提出了针对特定检索策略的计算公式。同时还对检索结果集的排序问题进行了讨论 ,并采用用户反馈信息量 ,使最后检出的结果在应用中不断得到优化  相似文献   

6.
提出了汉字全文检索系统的新的数据结构、建库和检索的算法,完成了程序设计、用于对中国化学文献数据库标题和文摘的检索,测定了索引建立时间、空间消耗和检索的响应时间,计算了每篇文献的长度在不同范围时的高频字数和索引空间消耗,讨论了索引膨胀比与文献长度的关系  相似文献   

7.
基于用户行为的全文检索系统个性化研究   总被引:1,自引:0,他引:1  
总结国内有关检索系统个性化研究的现状并进行分析,针对全文检索系统个性化服务方面存在的不足提出了基于用户行为全文检索系统模型,阐释了模型中的三个关键问题,包括相关反馈行为评价体系的制定、用户显式隐式行为的获取、用户兴趣建模和基于行为的相关度算法优化,最后列举了基于用户行为的全文检索系统可提供的四项个性化服务内容,包括个性化用户界面、优化检索策略、个性化检索结果、个性化推荐.  相似文献   

8.
针对当前自建特色数据库检索系统存在的检索效率低、检索途径单一等问题,提出基于开源全文检索引擎Sphinx对特色数据库进行全文检索的方法,详细介绍系统实现的关键技术。通过对比测试,该系统能够提高检索速度和检索质量,满足用户的检索需求。  相似文献   

9.
郑森 《河北科技图苑》2003,16(3):9-10,58
根据开发广州人物数据库的实践,论述了TRS全文检索系统的中文处理技术、Internet连接功能、词表检索功能、二次开发功能在广州人物数据库中的应用。  相似文献   

10.
宋代文献资料全文检索系统的设计与实现   总被引:1,自引:1,他引:0  
介绍了宋代文献资料全文检索系统的逻辑设计与实现技术,以及全文本检索与专题处理的有关概念,给出该系统的各功能模块及其特点。  相似文献   

11.
彭哲 《图书情报工作》2008,52(6):110-110
全文检索系统由三大功能模块组成:索引模块、检索模块和存储模块。本文着重分析系统组成和XML数据库的设计、建立倒排索引文件、中文分词等技术难点。同时在此基础之上建立基于Lucene/XML的期刊文献全文检索系统。  相似文献   

12.
汉字全文检索系统的关键技术与实现   总被引:14,自引:1,他引:13  
全文检索作为一种发展迅速的情报检索技术, 在近年来已得到广泛的关注并走向市场。本文在对中西文全文检索系统进行分析比较的基础上, 做出了新的尝试, 提出了一种新的索引建立方式, 并在此基础上实现了支持模糊提问的全文检索。同时独立设计了自己的数据结构和算法, 以及利用V isual C+ + 在W indows 环境下加以实现。最后, 对目前汉字全文检索中仍存在的一些问题进行了探讨。  相似文献   

13.
于英香 《浙江档案》2001,(12):29-30
所谓档案全文检索系统,是指可通过计算机直接检索到档案全文,而且可将档案全文中的任意符号作为广义检索词进行全文检索运算及逻辑运算的系统.本文从技术、经济、环境三个方面对组建全文档案检索系统进行可行性分析.  相似文献   

14.
全文检索系统测评的探讨   总被引:7,自引:0,他引:7  
本文分析了当前国内外较成功的全文检索系统,阐述了全文检索系统测评的基本含义,归纳了全文检索系统的处理功能、应用环境、网络连接、性能指标和旁证材料等几个方面的具体认证规范,以便确定系统的总体结构合理性、系统安全性和稳定性、平台通用性、数据共享性、操作简便性、用户界面友好性。  相似文献   

15.
基于Lucene的Web站点站内全文检索系统的设计与实现   总被引:1,自引:0,他引:1  
曹强 《图书情报工作》2007,51(9):124-126,144
设计一个基于开源检索工具包Lucene的Web站点站内全文检索系统,详述系统的设计思路与体系架构,并对中英文分词和添加文档索引等关键技术给出具体代码和实现步骤;最后对该系统进行简单的性能测试并与通用搜索引擎的检索结果进行查全率和查准率方面的比较。  相似文献   

16.
网络环境下的全文检索系统   总被引:9,自引:0,他引:9  
孙国泉 《图书馆》1997,(3):23-24,30
网络环境中的全文检索是情报检索领域研究的热点之一。本文首先论述了网络环境和全文检索系统的一般原理,然后重点讨论了网络环境下全文检索系统的构造及其技术难点和发展趋势  相似文献   

17.
针对质量管理信息系统对全文检索功能的需求,在分析了数据库检索和使用搜索引擎检索两种方式后,选择开源搜索引擎DotLucene实现质量管理信息系统全文检索功能,详细介绍了实现索引增量更新的方法、索引建立过程、查询WebService的实现。  相似文献   

18.
三种中文学术期刊全文检索系统的比较研究   总被引:6,自引:0,他引:6  
介绍并比较了维普中文科技期刊数据库、中国期刊网全文数据库以及万方数字化期刊子系统三种中文学术期刊全文检索系统的收录范围、全文浏览器和检索功能的异同点,并给出了检索结果的查全率和查准率以及数据更新频率的一个比较表。  相似文献   

19.
一个基于Web的期刊全文检索系统的设计与实现   总被引:6,自引:0,他引:6  
首先简要介绍了全文检索系统的基本概念,介绍了一个期刊全文检索系统的设计及实现过程,并对它数据流进行了表述。  相似文献   

20.
介绍基于模式自动机的全文检索系统的工作原理、体系结构,并给出基于模式自动机的全文索引数据库的核心数据结构和相关的生成算法、检索算法和模式自学习算法。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号