首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 0 毫秒
1.
基于Lucene的信息检索的研究与应用   总被引:6,自引:0,他引:6  
快速有效地索引企业累积的大量的信息资源,是提供高质量检索服务的基础。Lucene是一个用Java写的全文索引引擎工具包,访问索引时间快,支持多用户访问,可以跨平台使用。本文研究了Lucene和中文切分词技术,分析了Lucene的索引原理,实现了一个基于kene并支持中英文文档检索的应用实例。  相似文献   

2.
Lucene是一个用Java写的全文搜索引擎工具包,支持多用户访问,访问索引速度快,可以跨平台使用。分析了Lucene的索引原理,根据Lucene的系统结构详细分析了Lutene分析器、索引包、文档等结构,并给出实现代码示例。  相似文献   

3.
Lucene是一个用Java写的全文搜索引擎工具包,支持多用户访问,访问索引速度快,可以跨平台使用。分析了Lucene的索引原理,根据Lucene的系统结构详细分析了Lucene分析器、索引包、文档等结构,并给出实现代码示例。  相似文献   

4.
随着甲骨文数字化研究地不断深入,需要处理的甲骨文信息变得越来越多,对甲骨文信息地提取变得非常困难。本课题就是要研究利用基于java的全文检索工具包Luence,建立甲骨文全文检索系统,使之能够在本地硬盘完成对甲骨文的全文检索,完成全文匹配。本文通过对目标文件夹建立索引,输入关键词后,能够检索到包含该关键词的目标文件的详细信息。  相似文献   

5.
本文对目前搜索引擎用到的非常流行的Lucene开发包进行了阐述,介绍了Lucene的特点、采用的技术与开发包结构,重点进行了技术分析,研究了Lucene的系统结构,并对Lucene的数据流以及并发控制进行了说明。  相似文献   

6.
Lucene全文检索系统的实现及其索引性能的提高   总被引:1,自引:0,他引:1  
白晓玲 《情报探索》2010,(1):116-118
分析了索引机制架构和全文检索系统结构,介绍了实现Lucene+JSP+Tomcat的运作流程和核心代码,并探讨了如何提高索引性能。  相似文献   

7.
基于Lucene的全文搜索引擎的设计与实现   总被引:5,自引:0,他引:5  
Lucene是一个用Java写的全文搜索引擎工具包,支持多用户访问,访问索引速度快,可以跨平台使用。分析了Lucene的索引原理,根据Lucene的系统结构详细分析了Lucene分析器、索引包、文档等结构,实现了一个基于Lucene的中文诗词全文搜索应用实例。  相似文献   

8.
如何在海量的非结构文档内容中准确、快捷找到自己所需要的信息,是信息检索技术的研究重点。全文检索是现代信息检索技术一个非常重要的分支,是解决非结构化数据检索需求的重要技术手段。以已发布的各类通信业务管理规范的全文检索需求为切入点,设计并实现了适用于国家级气象信息化业务管理的非结构化文档全文检索系统。该系统基于Java技术,并采用Lucene技术框架,对业务规范信息进行了分析和重新数据组织,确保良好的检索时效与准确率。系统应用后能快速应对业务变化,在已有的大量的规定、规范、标准和公文函件中迅速、准确、全面地查找有关资料信息,帮助用户准确把握气象信息化发展脉络。  相似文献   

9.
针对当今的学位论文重复率高的现状,文章提出了基于Lucene全文检索在学位论文查重中的重要应用。文章采用的技术主要包括Lucene框架技术,分词技术和搜索查询,并结合多种数据挖掘算法实现论文查重的检测系统,文章主要介绍论文查重的原理、方法和在系统实现过程中用到的核心技术,在技术整合的过程中呈现出该系统的优质性。  相似文献   

10.
基于Lucene的索引系统的设计与实现   总被引:4,自引:0,他引:4  
索引系统是搜索引擎的数据大本营,在搜索引擎发展早期,能够索引的网页数量代表了整个行业的技术发展水平。Lucene全文检索技术是信息检索领域广泛使用的基本技术,它是一个优秀的开源全文本搜索技术框架,本文详细分析了索引系统相关技术和Lucene的索引系统结构。  相似文献   

11.
王泽贤 《现代情报》2014,34(4):132-136
针对基于Lucene实现中文书目搜索系统的项目中,如何选择最合适的Lucene中文分析器进行了研究。通过大量实验,对Lucene自带的3个分析器及开发活跃度较高的两个第三方中文分析器,从分词效果,建立索引的时间和空间,检索的时间、检全率和平均检准率等方面进行了分析比较。综合实验分析结果,指出ik分析器总体性能最优,为最佳选择。  相似文献   

12.
本文简要介绍了信息检索以及信息检索模型的概念,研究分析和对比了三种经典信息检索模型,其中重点放在概率检索模型上,并给出了一种具体实现。  相似文献   

13.
陶荣  陈燕 《大众科技》2010,(2):19-21
随着因特网的迅猛发展,搜索引擎提供导航服务己经成为互联网上非常重要的网络服务。利用Lucene开源全文本搜索技术框架建立全文检索系统,设计实现了索引器、检索器、中文分析器等模块,完成了一个基于Lucene的搜索引擎的应用,改进后的基于Lucene的全文检索系统能更好地支持中文及更准确地提供给用户所需要的信息。  相似文献   

14.
专题搜索引擎也称垂直搜索引擎,主要用来满足特定领域的用户需求。Heritrix是开源的网络爬虫,Heritrix的WebUI启动方式并不易用于广大用户。本文改变了往常对Heritrix用法,摒弃了Heritrix的WebUI启动方式,对Heritrix源码进行修改,将Lucene整合到Heritrix中,构建成一个完整的搜索引擎,并通过监听器监听搜索引擎状态,使搜索引擎能够进行自动爬取和数据更新。同时,本文添加了网页过滤模块以及对查询结果排序算法进行了改进,提高了搜索引擎的易用性和查询的准确率。  相似文献   

15.
针对ArcGIS在进行地图多图层搜索时速度慢的问题,利用Lucene全文检索的高效性,提出了一种结合Lucene和数据库技术的地图搜索方式,同时为提高空间最临近点查找效率,设计了基于网格模型的查找算法,在此基础上形成智能地图搜索引擎,并在交通地图服务项目的智能搜索功能中得到实现,证明了该搜索引擎的可行性和优越性.  相似文献   

16.
垂直搜索是针对某一个行业的专业搜索引擎;Lucene是Java编写的全文索引引擎工具包,可以跨平台使用;Heritri。是一个功能强大的开源Web网络爬虫。本文主要探讨Lucene和Heritrix在构建垂直搜索引擎中的应用。  相似文献   

17.
在网络教学平台加入定制的Lucene全文搜索引擎,实现了针对各种类型教育资源的全文索引/检索功能。通过在网络教学平台上的应用测试,证明了在网络教学平台上构建一个全文检索引擎是成功的,可以对网络教学平台站内网页中各种教学资源进行全文检索。  相似文献   

18.
电子商务技术扩散系统和扩散过程模型研究   总被引:1,自引:0,他引:1  
首先对电子商务技术扩散的涵义进行了研究,对电子商务技术扩散的概念进行了界定,然后对电子商务技术扩散系统的构成要素进行了分析。在以上分析的基础上,以创新扩散理论为基础建立了电子商务技术扩散的过程模型,并且对其扩散过程进行了深入分析。  相似文献   

19.
向禹  吴世明 《现代情报》2014,34(6):75-78
通过建设双层PDF全文数据库、创建索引和全文检索等实现过程来阐述相关技术的研究和运用。以建设全文数据库为基础,研究结构化信息与非结构化数据的合并管理,对目录数据和全文数据的同步索引,基于Lucene技术,实现档案管理系统的一站式智能化档案全文检索,提升档案查全率。  相似文献   

20.
调查分析高校图书馆网站的发展现状,发现高校图书馆网站普遍存在信息不易搜索和利用的问题,指出应该使用全文搜索技术对高校图书馆网站的信息资源进行联合检索.以开源软件Heritrix、Lucene和Htmlparser等为基础,构建一个简单的具有基本功能的高校图书馆搜索引擎,以期为后续的研究打下基础.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号