首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
基于Lucene的全文搜索引擎的设计与实现   总被引:5,自引:0,他引:5  
Lucene是一个用Java写的全文搜索引擎工具包,支持多用户访问,访问索引速度快,可以跨平台使用。分析了Lucene的索引原理,根据Lucene的系统结构详细分析了Lucene分析器、索引包、文档等结构,实现了一个基于Lucene的中文诗词全文搜索应用实例。  相似文献   

2.
Lucene是一个用Java写的全文搜索引擎工具包,支持多用户访问,访问索引速度快,可以跨平台使用。分析了Lucene的索引原理,根据Lucene的系统结构详细分析了Lucene分析器、索引包、文档等结构,并给出实现代码示例。  相似文献   

3.
基于Lucene的索引系统的设计与实现   总被引:2,自引:0,他引:2  
索引系统是搜索引擎的数据大本营,在搜索引擎发展早期,能够索引的网页数量代表了整个行业的技术发展水平。Lucene全文检索技术是信息检索领域广泛使用的基本技术,它是一个优秀的开源全文本搜索技术框架,本文详细分析了索引系统相关技术和Lucene的索引系统结构。  相似文献   

4.
专题搜索引擎也称垂直搜索引擎,主要用来满足特定领域的用户需求。Heritrix是开源的网络爬虫,Heritrix的WebUI启动方式并不易用于广大用户。本文改变了往常对Heritrix用法,摒弃了Heritrix的WebUI启动方式,对Heritrix源码进行修改,将Lucene整合到Heritrix中,构建成一个完整的搜索引擎,并通过监听器监听搜索引擎状态,使搜索引擎能够进行自动爬取和数据更新。同时,本文添加了网页过滤模块以及对查询结果排序算法进行了改进,提高了搜索引擎的易用性和查询的准确率。  相似文献   

5.
Lucene是一个用Java写的全文搜索引擎工具包,支持多用户访问,访问索引速度快,可以跨平台使用。分析了Lucene的索引原理,根据Lucene的系统结构详细分析了Lutene分析器、索引包、文档等结构,并给出实现代码示例。  相似文献   

6.
陶荣  陈燕 《大众科技》2010,(2):19-21
随着因特网的迅猛发展,搜索引擎提供导航服务己经成为互联网上非常重要的网络服务。利用Lucene开源全文本搜索技术框架建立全文检索系统,设计实现了索引器、检索器、中文分析器等模块,完成了一个基于Lucene的搜索引擎的应用,改进后的基于Lucene的全文检索系统能更好地支持中文及更准确地提供给用户所需要的信息。  相似文献   

7.
似杰 《科技风》2013,(6):95
本文介绍了购物的垂直搜索引擎的设计与应用,通过四个步骤来实现的设计和应用。我们捕获商品数据由淘宝开放API,开放的源代码的全文搜索引擎Lucene和指数商品数据的工具包。然后,我们建立的网站包括搜索框和数据显示页。我们还引进了新功能的大宗商品价格趋势分析。  相似文献   

8.
本文对目前搜索引擎用到的非常流行的Lucene开发包进行了阐述,介绍了Lucene的特点、采用的技术与开发包结构,重点进行了技术分析,研究了Lucene的系统结构,并对Lucene的数据流以及并发控制进行了说明。  相似文献   

9.
垂直搜索引擎是针对某一个行业的专业搜索引擎,是搜索引擎的细分和延伸。通过垂直搜索引擎能够从互联网上自动搜集信息,并为用户提供信息服务。建设一个中文垂直搜索引擎大致需要以下技术:信息采集技术、网页信息抽取技术、中文分词技术、索引技术。  相似文献   

10.
林文清 《情报杂志》2007,26(9):120-121
垂直搜索引擎在获取信息方面有着综合搜索引擎无法比拟的优势,在B2B领域中垂直搜索引擎开始成为搜索引擎发展的一个新趋势。研究了B2B垂直搜索引擎在信息获取技术中与其他搜索引擎的区别,探索了垂直搜索引擎在信息获取技术中应用的价值,并对B2B垂直搜索引擎在信息技术中的应用进行了展望。  相似文献   

11.
首先介绍了基于Internet的搜索引擎的系统结构以及主流搜索引擎的工作原理,在对高性能的爬虫工具包Heritrix和可扩展的Java全文索引工具包Lucene进行系统分析的基础上,设计了整个搜索引擎的构架,并使用Java语言初步实现了"SoEdu"搜索引擎。  相似文献   

12.
针对ArcGIS在进行地图多图层搜索时速度慢的问题,利用Lucene全文检索的高效性,提出了一种结合Lucene和数据库技术的地图搜索方式,同时为提高空间最临近点查找效率,设计了基于网格模型的查找算法,在此基础上形成智能地图搜索引擎,并在交通地图服务项目的智能搜索功能中得到实现,证明了该搜索引擎的可行性和优越性.  相似文献   

13.
在网络教学平台加入定制的Lucene全文搜索引擎,实现了针对各种类型教育资源的全文索引/检索功能。通过在网络教学平台上的应用测试,证明了在网络教学平台上构建一个全文检索引擎是成功的,可以对网络教学平台站内网页中各种教学资源进行全文检索。  相似文献   

14.
本文首先简要介绍了 lucene 桌面搜索引擎技术现状,根据桌面搜索的的不足,提出了一种基于 Lucene 的中文搜索引擎设计方案.使用了中文的分词技术的正向最大般配算法解决 lucene 对中文分词存在不足  相似文献   

15.
垂直搜索引擎辨析   总被引:9,自引:2,他引:9  
陈新颜 《现代情报》2004,24(9):133-134
分析了垂直搜索引擎与垂直网站、垂直搜索引擎与综合搜索引擎、垂直搜索引擎与网络学科资源导航之间的区别与联系,并对国内的两种垂直搜索引擎做了介绍。  相似文献   

16.
无锡地区拥有丰富的美食资源,目前国内外的通用搜索引擎所提供的信息量过大,查询不准确,智能化程度低。该研究为无锡广大美食爱好者提供了一个智能的查询平台。无锡美食智能搜索引擎的查询结果更精确、智能,是检索更加方便快捷的垂直搜索引擎。本文从无锡美食搜索引擎的设计流程入手,主要介绍了垂直搜索引擎各模块的功能、原理,包括爬虫的快速抓取、精确解析、高效存储等。  相似文献   

17.
为检索医院的药物信息,本文设计了一种基于Lucene的搜索引擎来收集信息的方法,通过在广州、珠海、武汉三家医院对所需信息进行查询,实现了对药物使用信息的索引、全文检索、高级查询、分词、相关性评分、排序等.引擎搜索结果与手工检索一致.本研究证明:医院内部的医药情报是可以用Lucene搜索引擎来获取的;关于医院药物供应是否充足等问题可依据搜索出的数据情报来回答.  相似文献   

18.
调查分析高校图书馆网站的发展现状,发现高校图书馆网站普遍存在信息不易搜索和利用的问题,指出应该使用全文搜索技术对高校图书馆网站的信息资源进行联合检索.以开源软件Heritrix、Lucene和Htmlparser等为基础,构建一个简单的具有基本功能的高校图书馆搜索引擎,以期为后续的研究打下基础.  相似文献   

19.
垂直搜索引擎系统的设计与实现   总被引:1,自引:0,他引:1  
面对日益专业和个性化的信息检索需求,通用搜索引擎存在的问题暴露无遗。垂直搜索技术作为搜索引擎发展的一个主要方向,正在受到越来越多的关注。在给出一个垂直搜索引擎总体结构的基础上,详细分析了所涉及的关键技术:网页抓取、中文分词、文本分类等。并将分词和分类算法加入到Nutch中,实现了系统原型。实验证明,该系统主题相关度达到94%以上。  相似文献   

20.
分析了搜索引擎原理及分类,阐述了垂直搜索引擎原理及功能模块设计,以提高垂直搜索引擎对特定领域信息检索的深度和完整度。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号