共查询到20条相似文献,搜索用时 0 毫秒
1.
本文主要在介绍全文检索的概念和原理的基础上,论述了全文检索的几种主要技术,并给出了逆向最大分词法的具体实现。 相似文献
2.
对全文检索倒排表技术作了较细致的研究。对全文检索的基本原理和技术进行了深入的探讨。对中文分词方法作了重点研究和总结,并对词典分词法中的最大匹配法加以改进,使用C++设计了一个程序,真正实现了最大匹配法。 相似文献
3.
中文全文检索系统主题词标引 总被引:1,自引:0,他引:1
本文介绍了在中文全文检索系统中实现主题词标引的思路及具体实现过程、各种词表的构造及更新方法和措施,基于主题词标引的优化检索功能等。 相似文献
4.
本文探讨了在基于关键词索引的中文全文检索系统中实现各种截词检索的方法,建立了关键词索引的Hash索引,这种方法即能节省内存又提高检索效率。 相似文献
5.
中文全文检索系统中实现主题词标引思路 总被引:4,自引:0,他引:4
介绍了在中文全文检索系统中实现主题词标引的思路及具体实现过程、各种词表的构造及更新方法和措施、基于主题词标引的优化检索功能等。 相似文献
6.
为解决在检索某些词时发生漏检或错检,以及查全率和查准率不高的问题,研究字索引技术在中文Web文档检索中的应用。着重讨论字索引组织结构和检索方法,并引入了字节对齐的索引压缩方法,最后描述了一个中文Web文档全文检索系统的结构和实现。测试表明,该系统在响应时间和查准率方面性能均比较好,具有一定的实用性。 相似文献
7.
8.
9.
通过建设双层PDF全文数据库、创建索引和全文检索等实现过程来阐述相关技术的研究和运用。以建设全文数据库为基础,研究结构化信息与非结构化数据的合并管理,对目录数据和全文数据的同步索引,基于Lucene技术,实现档案管理系统的一站式智能化档案全文检索,提升档案查全率。 相似文献
10.
自然语言处理技术在中文全文检索中的应用 总被引:1,自引:0,他引:1
自然语言处理技术是中文全文检索的基础.首先介绍了全文检索技术及自然语言处理技术,接着详细地阐述了自然语言处理技术在中文全文检索中的应用,并对目前基于自然语言处理技术的中文全文检索技术的局限性进行了分析,探讨了中文全文检索技术的未来发展方向. 相似文献
11.
如何在海量的非结构文档内容中准确、快捷找到自己所需要的信息,是信息检索技术的研究重点。全文检索是现代信息检索技术一个非常重要的分支,是解决非结构化数据检索需求的重要技术手段。以已发布的各类通信业务管理规范的全文检索需求为切入点,设计并实现了适用于国家级气象信息化业务管理的非结构化文档全文检索系统。该系统基于Java技术,并采用Lucene技术框架,对业务规范信息进行了分析和重新数据组织,确保良好的检索时效与准确率。系统应用后能快速应对业务变化,在已有的大量的规定、规范、标准和公文函件中迅速、准确、全面地查找有关资料信息,帮助用户准确把握气象信息化发展脉络。 相似文献
12.
全文检索研究 总被引:11,自引:0,他引:11
A new algorithm for automatic segmentation of Chinese word with the stop word list and post-controlled thesaurus, that has absorbed the ideas from the single-Chinese character method and the thesaurus method, is given. Based on this algorithm, a new full text retrieval mode is built. 相似文献
13.
14.
通过对全文检索原理及相关技术的说明,分析了Oracle Text技术体系,最后通过范例说明如何使用Oracle Text管理器和SQL* PLUS两种方式建立全文检索. 相似文献
15.
该文以某公司的全文检索项目为背景,介绍了基于多数据源的全文检索设计方案,能够实现对多个信息系统进行统一检索的功能,并继承原系统的权限,极大地方便了用户的使用,提高了检索的效率。 相似文献
16.
互连网上信息浩瀚无限,各种搜索引擎是人们获得信息常用的工具,但是它的可用性和易用性还有待进步提高。为了更有效的获得用自然语言提问的问题的答案,本文提出了运用中文分词技术在获取的搜索网页的基础上进行全文检索和进行问题答案匹配,获得对应的答案列表的一种实现方法 相似文献
17.
18.
Lucene是一个用Java写的全文搜索引擎工具包,支持多用户访问,访问索引速度快,可以跨平台使用。分析了Lucene的索引原理,根据Lucene的系统结构详细分析了Lutene分析器、索引包、文档等结构,并给出实现代码示例。 相似文献
19.
设计了全文检索系统,系统由三大功能模块组成:索引模块、检索模块和存储模块.分析PDF数据转换、XML文档设计、索引的分词等技术难点,并对中文分词分析器、索引文件膨胀率、索引影响因子进行测试,在此基础上设计全文检索系统并对检索响应时间进行测试.在结论中指出应关注XML数据库的安全性. 相似文献
20.
结合哈尔滨工程大学图书馆安装、运行维普中文数据库(单机版、Web版)的实践,介绍了中文期刊数据库利用光盘镜像服务器在网上的实现方法,由此探索了高校图书馆数据库网上检索的一些规律。 相似文献