首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 0 毫秒
1.
垂直搜索是针对某一个行业的专业搜索引擎;Lucene是Java编写的全文索引引擎工具包,可以跨平台使用;Heritri。是一个功能强大的开源Web网络爬虫。本文主要探讨Lucene和Heritrix在构建垂直搜索引擎中的应用。  相似文献   

2.
垂直搜索引擎系统的设计与实现   总被引:1,自引:0,他引:1  
面对日益专业和个性化的信息检索需求,通用搜索引擎存在的问题暴露无遗。垂直搜索技术作为搜索引擎发展的一个主要方向,正在受到越来越多的关注。在给出一个垂直搜索引擎总体结构的基础上,详细分析了所涉及的关键技术:网页抓取、中文分词、文本分类等。并将分词和分类算法加入到Nutch中,实现了系统原型。实验证明,该系统主题相关度达到94%以上。  相似文献   

3.
综合搜索引擎与垂直搜索引擎的比较研究   总被引:20,自引:0,他引:20  
刘畅 《情报科学》2007,25(1):97-102
搜索引擎是目前互联网信息服务的主要工具,它的竞争也日趋激烈,搜索引擎的信息服务也逐渐引起重视。本文从信息服务的角度出发,通过对综合搜索引擎与垂直搜索引擎在信息服务各个要素方面的比较,找出它们之间的竞争与合作的关系,为当前的搜索引擎发展做出初步的分析。  相似文献   

4.
垂直搜索引擎系统的研究与实现   总被引:1,自引:1,他引:1  
给出了垂直搜索引擎的体系结构,然后分别设计了垂直搜索引擎的三大核心模块:主题词库、网络机器人和中文分词。在主题词库模块中设计了一个分层的主题词库系统,该词库将颗粒大的主题词置于词库高层,而将颗粒小的主题词置于词库低层,既考虑了主题搜索的广度,也考虑了主题搜索的精度。而在网络机器人设计过程中则综合运用了多线程及基于VSM的主题相关度判断算法进行主题网页爬行,在中文分词设计中则采用最大正向匹配算法完成中文分词。实验表明,多线程是提高网络机器人爬行速度的关键。此外,搜索引擎的准确率达到了63%。  相似文献   

5.
无锡地区拥有丰富的美食资源,目前国内外的通用搜索引擎所提供的信息量过大,查询不准确,智能化程度低。该研究为无锡广大美食爱好者提供了一个智能的查询平台。无锡美食智能搜索引擎的查询结果更精确、智能,是检索更加方便快捷的垂直搜索引擎。本文从无锡美食搜索引擎的设计流程入手,主要介绍了垂直搜索引擎各模块的功能、原理,包括爬虫的快速抓取、精确解析、高效存储等。  相似文献   

6.
垂直搜索引擎的现状与发展探究   总被引:9,自引:0,他引:9  
本文首先介绍了垂直搜索引擎的概况和特点,对其与综合搜索引擎的关系以及国内外垂直搜索引擎的现状做了总结,最后论述了它的发展方向。  相似文献   

7.
基于主题爬虫的个性化搜索引擎技术,借鉴Web个性化推荐服务思路,改善了以搜索引擎为代表的Web信息检索系统服务方式,有效地解决了Internet上"资源过载"和"信息迷失"的问题,相对满足了用户的需求。概述了网络爬虫和个性化搜索引擎,并对基于主题爬虫的个性化搜索引擎技术进行了介绍研究。  相似文献   

8.
垂直搜索引擎辨析   总被引:9,自引:2,他引:9  
陈新颜 《现代情报》2004,24(9):133-134
分析了垂直搜索引擎与垂直网站、垂直搜索引擎与综合搜索引擎、垂直搜索引擎与网络学科资源导航之间的区别与联系,并对国内的两种垂直搜索引擎做了介绍。  相似文献   

9.
分析了当前网上搜索引擎的现状及存在的问题,提出了一种结合本体的垂直搜索引擎构建思想,构建了基于本体的垂直搜索引擎模型。  相似文献   

10.
陶荣  陈燕 《大众科技》2010,(2):19-21
随着因特网的迅猛发展,搜索引擎提供导航服务己经成为互联网上非常重要的网络服务。利用Lucene开源全文本搜索技术框架建立全文检索系统,设计实现了索引器、检索器、中文分析器等模块,完成了一个基于Lucene的搜索引擎的应用,改进后的基于Lucene的全文检索系统能更好地支持中文及更准确地提供给用户所需要的信息。  相似文献   

11.
季春  姜琴  吴铮悦 《情报探索》2012,(10):91-93
系统总结了垂直搜索引擎的关键技术及国内外应用现状,预测了未来的发展趋势.  相似文献   

12.
本文介绍了网络爬虫的基本架构、工作原理,设计了网络视频爬虫网络视频爬虫的基本架构、详细讨论了如何有效的避免重复遍历网页和如何快速的更新网站新内容的两个关键问题和网络视频爬虫下载视频和抓取网页的工作方式。  相似文献   

13.
本文通过垂直搜索引擎的关键算法研究,论述垂直搜索引擎设计与实现时的一些独特的信息识别方法,包括Pagerank和HITS算法。  相似文献   

14.
本文详细介绍了面向计算机教育资源的垂直搜索引擎的体系结构,重点叙述了构成垂直搜索引擎的主题爬虫的爬行策略、主题相关度算法和主题词库的设计策略。实验结果表明:软件系统中Heri-trix的最大响应时间是0.563秒,查询精度和主题相关度判别算法的精度均达到了60%以上,可以面向Web加以应用。  相似文献   

15.
选取网民经常使用的百度、搜狗和搜搜这3大中文搜索引擎,横向比较了它们在新闻、视频和音乐3大垂直领域内的搜索效果,以期能够为网民检索网络资源提供便利。  相似文献   

16.
基于主题的个性化元搜索引擎的设计与实现   总被引:5,自引:0,他引:5  
王敏  杨炳儒 《情报杂志》2005,24(7):57-58
介绍了基于主题的个性化元搜索引擎的设计方法与实现技术,该系统可以让用户根据感兴趣的领域自行定制一个主题树,每个主题可以包括多个搜索策略,然后采用元搜索引擎技术使用户能够得到真正想要的信息。  相似文献   

17.
探讨了基于垂直搜索引擎建立特色数据库数据检索模型,利用Internet中庞大的网络资源建立特色数据库,实现特色数据库数据的自动采集和数据检索的必要途径。  相似文献   

18.
何晓阳  吴治蓉  杨禹道 《情报杂志》2007,26(9):122-123,126
作为面向主题的Web信息服务的实践尝试,介绍了军事医学主题搜索引擎的架构、特点、设计思路以及在各个环节所使用的技术。  相似文献   

19.
钟辉新 《情报杂志》2008,27(1):118-120
针对具体行业运用领域的需求,采用机器学习的方法对Web内容进行分析和挖掘并提供个性化服务是搜索引擎的一个重要发展趋势.从搜索引擎的通过原理出发,针对通用搜索引擎存在问题,构建基于垂直搜索引擎的个性化信息体系结构,结合用户共同兴趣模型与Hopfield Net Spider搜索策略实现用户个性化信息服务.  相似文献   

20.
似杰 《科技风》2013,(6):95
本文介绍了购物的垂直搜索引擎的设计与应用,通过四个步骤来实现的设计和应用。我们捕获商品数据由淘宝开放API,开放的源代码的全文搜索引擎Lucene和指数商品数据的工具包。然后,我们建立的网站包括搜索框和数据显示页。我们还引进了新功能的大宗商品价格趋势分析。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号