首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
本文对关键字检索技术和Lucene进行了研究和使用。针对文档库,在使用Lucene引擎及其工具包的基础上,设计了一套简单并且行之有效的近义词关键字检索模型。分析了Lucene自带评分算法,并在原有的基础上提出了改进的相关度排序算法。比较了Lucene自带中文分词器和第三方中文分词器的分词效果,设计了定制化的近义词分词器和近义词词典,实现了近义词查询,提高了Lucene关键字检索的性能。  相似文献   

2.
基于Lucene的索引系统的设计与实现   总被引:2,自引:0,他引:2  
索引系统是搜索引擎的数据大本营,在搜索引擎发展早期,能够索引的网页数量代表了整个行业的技术发展水平。Lucene全文检索技术是信息检索领域广泛使用的基本技术,它是一个优秀的开源全文本搜索技术框架,本文详细分析了索引系统相关技术和Lucene的索引系统结构。  相似文献   

3.
王泽贤 《现代情报》2014,34(4):132-136
针对基于Lucene实现中文书目搜索系统的项目中,如何选择最合适的Lucene中文分析器进行了研究。通过大量实验,对Lucene自带的3个分析器及开发活跃度较高的两个第三方中文分析器,从分词效果,建立索引的时间和空间,检索的时间、检全率和平均检准率等方面进行了分析比较。综合实验分析结果,指出ik分析器总体性能最优,为最佳选择。  相似文献   

4.
基于Lucene的全文搜索引擎的设计与实现   总被引:5,自引:0,他引:5  
Lucene是一个用Java写的全文搜索引擎工具包,支持多用户访问,访问索引速度快,可以跨平台使用。分析了Lucene的索引原理,根据Lucene的系统结构详细分析了Lucene分析器、索引包、文档等结构,实现了一个基于Lucene的中文诗词全文搜索应用实例。  相似文献   

5.
陶荣  陈燕 《大众科技》2010,(2):19-21
随着因特网的迅猛发展,搜索引擎提供导航服务己经成为互联网上非常重要的网络服务。利用Lucene开源全文本搜索技术框架建立全文检索系统,设计实现了索引器、检索器、中文分析器等模块,完成了一个基于Lucene的搜索引擎的应用,改进后的基于Lucene的全文检索系统能更好地支持中文及更准确地提供给用户所需要的信息。  相似文献   

6.
Lucene是一个用Java写的全文搜索引擎工具包,支持多用户访问,访问索引速度快,可以跨平台使用。分析了Lucene的索引原理,根据Lucene的系统结构详细分析了Lucene分析器、索引包、文档等结构,并给出实现代码示例。  相似文献   

7.
针对ArcGIS在进行地图多图层搜索时速度慢的问题,利用Lucene全文检索的高效性,提出了一种结合Lucene和数据库技术的地图搜索方式,同时为提高空间最临近点查找效率,设计了基于网格模型的查找算法,在此基础上形成智能地图搜索引擎,并在交通地图服务项目的智能搜索功能中得到实现,证明了该搜索引擎的可行性和优越性.  相似文献   

8.
基于Lucene的信息检索的研究与应用   总被引:6,自引:0,他引:6  
快速有效地索引企业累积的大量的信息资源,是提供高质量检索服务的基础。Lucene是一个用Java写的全文索引引擎工具包,访问索引时间快,支持多用户访问,可以跨平台使用。本文研究了Lucene和中文切分词技术,分析了Lucene的索引原理,实现了一个基于kene并支持中英文文档检索的应用实例。  相似文献   

9.
通过对Lucene.Net的深入研究和探索,围绕实现CMS站内搜索功能的目标,探讨了Lucene索引创建、维护和检索功能的实现。  相似文献   

10.
针对当今的学位论文重复率高的现状,文章提出了基于Lucene全文检索在学位论文查重中的重要应用。文章采用的技术主要包括Lucene框架技术,分词技术和搜索查询,并结合多种数据挖掘算法实现论文查重的检测系统,文章主要介绍论文查重的原理、方法和在系统实现过程中用到的核心技术,在技术整合的过程中呈现出该系统的优质性。  相似文献   

11.
本文首先简要介绍了 lucene 桌面搜索引擎技术现状,根据桌面搜索的的不足,提出了一种基于 Lucene 的中文搜索引擎设计方案.使用了中文的分词技术的正向最大般配算法解决 lucene 对中文分词存在不足  相似文献   

12.
Lucene是一个用Java写的全文搜索引擎工具包,支持多用户访问,访问索引速度快,可以跨平台使用。分析了Lucene的索引原理,根据Lucene的系统结构详细分析了Lutene分析器、索引包、文档等结构,并给出实现代码示例。  相似文献   

13.
随着Internet/Intranet的发展,基于企业专网的远程视频监控系统近几年发展迅速。本文设计的系统采用微软提供的VFW开发包对视频进行采集,使用MPEG4编解码器Xvid0.9.1对视频流进行编解码。本文重点讨论设计中的多线程实现技术。  相似文献   

14.
讨论了应用Lucene建立站点内信息全文检索系统需要注意的若干关键技术,概要介绍了Lucene全文索引工具包的索引结构与功能特点,进而从实际开发的角度,给出了简单实例,旨在为电子商务系统开发人员提供参考。  相似文献   

15.
通过对J2ME特点的讨论,提出了在J2ME下开发窗口界面程序的通用开发包实现方法,分析了窗口界面开发包中类的组织结构以及应提供的API,并给出了实现窗口类及其派生窗口类的关键代码。  相似文献   

16.
首先简要介绍了目前网络安全存在的安全隐患,讲述了网络数据包捕获的原理,并研究了数据包捕获在Unix和Windows环境下的常用技术,着重讲述了套接字技术和第三方捕获开发包枝术.  相似文献   

17.
为检索医院的药物信息,本文设计了一种基于Lucene的搜索引擎来收集信息的方法,通过在广州、珠海、武汉三家医院对所需信息进行查询,实现了对药物使用信息的索引、全文检索、高级查询、分词、相关性评分、排序等.引擎搜索结果与手工检索一致.本研究证明:医院内部的医药情报是可以用Lucene搜索引擎来获取的;关于医院药物供应是否充足等问题可依据搜索出的数据情报来回答.  相似文献   

18.
微软公司的DirectShow开发包为开发高质量的多媒体软件提供了一个开放的平台。本文介绍了DVD的基本架构,以及DirectShow技术,并讨论了在VC 6.0开发环境下,使用DirectShow的COM技术实现了DVD播放的方法。  相似文献   

19.
调查分析高校图书馆网站的发展现状,发现高校图书馆网站普遍存在信息不易搜索和利用的问题,指出应该使用全文搜索技术对高校图书馆网站的信息资源进行联合检索.以开源软件Heritrix、Lucene和Htmlparser等为基础,构建一个简单的具有基本功能的高校图书馆搜索引擎,以期为后续的研究打下基础.  相似文献   

20.
首先介绍了基于Internet的搜索引擎的系统结构以及主流搜索引擎的工作原理,在对高性能的爬虫工具包Heritrix和可扩展的Java全文索引工具包Lucene进行系统分析的基础上,设计了整个搜索引擎的构架,并使用Java语言初步实现了"SoEdu"搜索引擎。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号