首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 0 毫秒
1.
满鹏 《现代情报》2009,29(7):138-140
本文主要在介绍全文检索的概念和原理的基础上,论述了全文检索的几种主要技术,并给出了逆向最大分词法的具体实现。  相似文献   

2.
对全文检索倒排表技术作了较细致的研究。对全文检索的基本原理和技术进行了深入的探讨。对中文分词方法作了重点研究和总结,并对词典分词法中的最大匹配法加以改进,使用C++设计了一个程序,真正实现了最大匹配法。  相似文献   

3.
中文全文检索系统主题词标引   总被引:1,自引:0,他引:1  
吴春玉 《情报科学》2004,22(6):720-722,727
本文介绍了在中文全文检索系统中实现主题词标引的思路及具体实现过程、各种词表的构造及更新方法和措施,基于主题词标引的优化检索功能等。  相似文献   

4.
靖培栋  宋雯斐 《情报科学》2006,24(6):884-887
本文探讨了在基于关键词索引的中文全文检索系统中实现各种截词检索的方法,建立了关键词索引的Hash索引,这种方法即能节省内存又提高检索效率。  相似文献   

5.
中文全文检索系统中实现主题词标引思路   总被引:4,自引:0,他引:4  
吴春玉 《情报杂志》2005,24(1):115-116,119
介绍了在中文全文检索系统中实现主题词标引的思路及具体实现过程、各种词表的构造及更新方法和措施、基于主题词标引的优化检索功能等。  相似文献   

6.
为解决在检索某些词时发生漏检或错检,以及查全率和查准率不高的问题,研究字索引技术在中文Web文档检索中的应用。着重讨论字索引组织结构和检索方法,并引入了字节对齐的索引压缩方法,最后描述了一个中文Web文档全文检索系统的结构和实现。测试表明,该系统在响应时间和查准率方面性能均比较好,具有一定的实用性。  相似文献   

7.
全文检索搜索引擎中文信息处理技术研究   总被引:2,自引:0,他引:2  
唐培丽  胡明  解飞  刘钢 《情报科学》2006,24(6):895-899,909
本文深入分析了全文检索中文搜索引擎的关键技术,提出了一种适用于全文检索搜索引擎的中文分词方案,既提高了分词的准确性,又能识别文中的未登录词。针对向量空间信息检索模型,本文设计了一个综合考虑中文词在Web文本中的位置、长度以及频率等重要因素的词条权重计算函数,并且用量化的方法表示出其重要性,能够较准确地反映出词条在Web文档中的重要程度。最后对分词算法进行了测试,测试表明该方法能够提高分词准确度满足实用的要求。  相似文献   

8.
基于Lucene的电子政务全文检索系统的设计与实现   总被引:1,自引:0,他引:1  
文章分析了目前基于Doulino平台开发的电子政务系统的全文检索系统存在着检索内容丢失、系统响应慢以及不能针对文档中嵌入的各种格式的附件作索引和内客查找等不足之处,提出基于Java Lucene开源框架, 并与其它优秀开源组件进行整合,在Domino6.5平台下实现了一个功能齐全、性能优异的全文检索系统, 取得了良好的效果, 并在实践中获得了应用.  相似文献   

9.
向禹  吴世明 《现代情报》2014,34(6):75-78
通过建设双层PDF全文数据库、创建索引和全文检索等实现过程来阐述相关技术的研究和运用。以建设全文数据库为基础,研究结构化信息与非结构化数据的合并管理,对目录数据和全文数据的同步索引,基于Lucene技术,实现档案管理系统的一站式智能化档案全文检索,提升档案查全率。  相似文献   

10.
自然语言处理技术在中文全文检索中的应用   总被引:1,自引:0,他引:1  
自然语言处理技术是中文全文检索的基础.首先介绍了全文检索技术及自然语言处理技术,接着详细地阐述了自然语言处理技术在中文全文检索中的应用,并对目前基于自然语言处理技术的中文全文检索技术的局限性进行了分析,探讨了中文全文检索技术的未来发展方向.  相似文献   

11.
如何在海量的非结构文档内容中准确、快捷找到自己所需要的信息,是信息检索技术的研究重点。全文检索是现代信息检索技术一个非常重要的分支,是解决非结构化数据检索需求的重要技术手段。以已发布的各类通信业务管理规范的全文检索需求为切入点,设计并实现了适用于国家级气象信息化业务管理的非结构化文档全文检索系统。该系统基于Java技术,并采用Lucene技术框架,对业务规范信息进行了分析和重新数据组织,确保良好的检索时效与准确率。系统应用后能快速应对业务变化,在已有的大量的规定、规范、标准和公文函件中迅速、准确、全面地查找有关资料信息,帮助用户准确把握气象信息化发展脉络。  相似文献   

12.
全文检索研究   总被引:11,自引:0,他引:11  
A new algorithm for automatic segmentation of Chinese word with the stop word list and post-controlled thesaurus, that has absorbed the ideas from the single-Chinese character method and the thesaurus method, is given. Based on this algorithm, a new full text retrieval mode is built.  相似文献   

13.
在在线监测系统中,使用嵌入式数据库SQLite对系统的批量数据进行管理和维护.可以提高程序运行效率。使程序具有更好的可读性。本文介绍了汽轮机振动监测系统的设计以及嵌入式数据库管理系统的选取.并详细讲述了嵌入式数据库的:具体实施。  相似文献   

14.
通过对全文检索原理及相关技术的说明,分析了Oracle Text技术体系,最后通过范例说明如何使用Oracle Text管理器和SQL* PLUS两种方式建立全文检索.  相似文献   

15.
该文以某公司的全文检索项目为背景,介绍了基于多数据源的全文检索设计方案,能够实现对多个信息系统进行统一检索的功能,并继承原系统的权限,极大地方便了用户的使用,提高了检索的效率。  相似文献   

16.
王武霞 《今日科苑》2006,(9):118-118
互连网上信息浩瀚无限,各种搜索引擎是人们获得信息常用的工具,但是它的可用性和易用性还有待进步提高。为了更有效的获得用自然语言提问的问题的答案,本文提出了运用中文分词技术在获取的搜索网页的基础上进行全文检索和进行问题答案匹配,获得对应的答案列表的一种实现方法  相似文献   

17.
论文首先介绍了全文检索的概念和发展现状,对SQL Server关系数据库的全文检索机制作了重点分析.然后结合简单示例,详细阐述了如何利用SQL Server 2005数据库创建全文目录、生成全文索引和进行全文查询.最后在C#开发环境中实现了Word文档信息的全文检索.  相似文献   

18.
Lucene是一个用Java写的全文搜索引擎工具包,支持多用户访问,访问索引速度快,可以跨平台使用。分析了Lucene的索引原理,根据Lucene的系统结构详细分析了Lutene分析器、索引包、文档等结构,并给出实现代码示例。  相似文献   

19.
设计了全文检索系统,系统由三大功能模块组成:索引模块、检索模块和存储模块.分析PDF数据转换、XML文档设计、索引的分词等技术难点,并对中文分词分析器、索引文件膨胀率、索引影响因子进行测试,在此基础上设计全文检索系统并对检索响应时间进行测试.在结论中指出应关注XML数据库的安全性.  相似文献   

20.
陶跃军  司加全 《情报杂志》2001,20(B06):60-61
结合哈尔滨工程大学图书馆安装、运行维普中文数据库(单机版、Web版)的实践,介绍了中文期刊数据库利用光盘镜像服务器在网上的实现方法,由此探索了高校图书馆数据库网上检索的一些规律。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号