共查询到20条相似文献,搜索用时 31 毫秒
1.
2.
Lucene是一个用Java写的全文搜索引擎工具包,支持多用户访问,访问索引速度快,可以跨平台使用。分析了Lucene的索引原理,根据Lucene的系统结构详细分析了Lucene分析器、索引包、文档等结构,并给出实现代码示例。 相似文献
3.
4.
专题搜索引擎也称垂直搜索引擎,主要用来满足特定领域的用户需求。Heritrix是开源的网络爬虫,Heritrix的WebUI启动方式并不易用于广大用户。本文改变了往常对Heritrix用法,摒弃了Heritrix的WebUI启动方式,对Heritrix源码进行修改,将Lucene整合到Heritrix中,构建成一个完整的搜索引擎,并通过监听器监听搜索引擎状态,使搜索引擎能够进行自动爬取和数据更新。同时,本文添加了网页过滤模块以及对查询结果排序算法进行了改进,提高了搜索引擎的易用性和查询的准确率。 相似文献
5.
Lucene是一个用Java写的全文搜索引擎工具包,支持多用户访问,访问索引速度快,可以跨平台使用。分析了Lucene的索引原理,根据Lucene的系统结构详细分析了Lutene分析器、索引包、文档等结构,并给出实现代码示例。 相似文献
6.
随着因特网的迅猛发展,搜索引擎提供导航服务己经成为互联网上非常重要的网络服务。利用Lucene开源全文本搜索技术框架建立全文检索系统,设计实现了索引器、检索器、中文分析器等模块,完成了一个基于Lucene的搜索引擎的应用,改进后的基于Lucene的全文检索系统能更好地支持中文及更准确地提供给用户所需要的信息。 相似文献
7.
本文介绍了购物的垂直搜索引擎的设计与应用,通过四个步骤来实现的设计和应用。我们捕获商品数据由淘宝开放API,开放的源代码的全文搜索引擎Lucene和指数商品数据的工具包。然后,我们建立的网站包括搜索框和数据显示页。我们还引进了新功能的大宗商品价格趋势分析。 相似文献
8.
本文对目前搜索引擎用到的非常流行的Lucene开发包进行了阐述,介绍了Lucene的特点、采用的技术与开发包结构,重点进行了技术分析,研究了Lucene的系统结构,并对Lucene的数据流以及并发控制进行了说明。 相似文献
9.
垂直搜索引擎是针对某一个行业的专业搜索引擎,是搜索引擎的细分和延伸。通过垂直搜索引擎能够从互联网上自动搜集信息,并为用户提供信息服务。建设一个中文垂直搜索引擎大致需要以下技术:信息采集技术、网页信息抽取技术、中文分词技术、索引技术。 相似文献
10.
垂直搜索引擎在获取信息方面有着综合搜索引擎无法比拟的优势,在B2B领域中垂直搜索引擎开始成为搜索引擎发展的一个新趋势。研究了B2B垂直搜索引擎在信息获取技术中与其他搜索引擎的区别,探索了垂直搜索引擎在信息获取技术中应用的价值,并对B2B垂直搜索引擎在信息技术中的应用进行了展望。 相似文献
11.
首先介绍了基于Internet的搜索引擎的系统结构以及主流搜索引擎的工作原理,在对高性能的爬虫工具包Heritrix和可扩展的Java全文索引工具包Lucene进行系统分析的基础上,设计了整个搜索引擎的构架,并使用Java语言初步实现了"SoEdu"搜索引擎。 相似文献
12.
13.
在网络教学平台加入定制的Lucene全文搜索引擎,实现了针对各种类型教育资源的全文索引/检索功能。通过在网络教学平台上的应用测试,证明了在网络教学平台上构建一个全文检索引擎是成功的,可以对网络教学平台站内网页中各种教学资源进行全文检索。 相似文献
14.
15.
16.
17.
18.
调查分析高校图书馆网站的发展现状,发现高校图书馆网站普遍存在信息不易搜索和利用的问题,指出应该使用全文搜索技术对高校图书馆网站的信息资源进行联合检索.以开源软件Heritrix、Lucene和Htmlparser等为基础,构建一个简单的具有基本功能的高校图书馆搜索引擎,以期为后续的研究打下基础. 相似文献
19.
垂直搜索引擎系统的设计与实现 总被引:1,自引:0,他引:1
面对日益专业和个性化的信息检索需求,通用搜索引擎存在的问题暴露无遗。垂直搜索技术作为搜索引擎发展的一个主要方向,正在受到越来越多的关注。在给出一个垂直搜索引擎总体结构的基础上,详细分析了所涉及的关键技术:网页抓取、中文分词、文本分类等。并将分词和分类算法加入到Nutch中,实现了系统原型。实验证明,该系统主题相关度达到94%以上。 相似文献
20.