首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 62 毫秒
1.
针对传统搜索引擎对频繁更新的新闻和博客网站的搜索实时性较差的现状,提出利用RSS提供的结构化数据,通过Pastry协议,实现索引的分布式存储和传输,同时使用Bloom filter数据结构压缩索引文件,构建一个基于RSS的P2P分布式的新闻博客搜索引擎,从而达到对频繁更新站点的实时性搜索,同时减少存储成本。  相似文献   

2.
受“搜索引擎”流行的影响,目前大家已经习惯把图书情报领域使用的“情报检索系统”称之为“学术搜索引擎”。无论从技术层面上还是应用层面上,尽管二者有很大的共同点,但也有很大差异。传统的集中式的搜索引擎已经无法满足飞速发展的信息爆炸和普及化的海量需求用户,能够提供“云服务”的分布式搜索引擎已经成为必然。文章主要内容包括学术搜索引擎涉及的关键技术、分布式搜索引擎的架构,以及分布式搜索引擎在大数据领域的主要应用价值三个方面,最后给出了分布式搜索引擎RMSCIoud的典型应用介绍。  相似文献   

3.
随着信息社会发展,海量数字信息资源存储的需求变得越来越普遍,使用分布式文件存储是一种有效的解决方案。文章通过分析HDFS本身信息存储交互的特点,给出了使用HDFS的长期保存分布式存储实现方案,为今后使用HDFS及Fedora进行分布式长期保存及管理提供了借鉴参考。  相似文献   

4.
基于XML的智能元搜索引擎研究   总被引:1,自引:0,他引:1  
介绍一种基于XML和Agent技术的智能元搜索引擎系统。该系统采用元搜索引擎的结构,以Agent作为架构系统的基本组件,利用Agent的自治性和协作性来完成用户个性化信息的搜索;利用XML和XSL分别在结构化信息表达方面,在信息显示、转换方面的优点,来实现元搜索引擎的扩展性以及搜索结果的个性化输出。最后探讨XML和XSL在查询请求和搜索结果转换上的应用以及基于XML的Agent通信。  相似文献   

5.
元搜索引擎通常缺乏自身独立的数据库后台,依托它的底层独立搜索引擎的数据库体系为用户提供信息服务,这种信息服务在满足用户复杂化、高级性检索需求上,表现出相当大的局限与不足,其改善手段之一是利用数据挖掘技术,根据元搜索引擎后台依托的数据库构成状况,选择分布式数据挖掘工具,较为科学、合理地建立其分布式数据挖掘系统,可利用CDM系统构建思想,基于先进的移动Agent技术,来提高挖掘系统的工作性能,并将一些关键技术充分地运用于系统中.  相似文献   

6.
对元搜索引擎与独立搜索引擎的基本构成、结构和特点等进行了比较分析 ,并对元搜索引擎的未来与发展趋势作了简要的阐述 ,指出了今后我国对元搜索引擎的主要研究方向。  相似文献   

7.
集成搜索引擎与元搜索引擎比较研究   总被引:6,自引:0,他引:6  
文章对集成搜索引擎与元搜索引擎的概念进行清晰地界定,对两者的功能特点异同进行了比较分析,并列举了一些较为实用的集成搜索引擎与元搜索引擎.  相似文献   

8.
随着互联网上信息数量的急剧增加,如何快速准确地进行信息采集已成为网络资源组织与管理中急待解决的问题。针对该问题,在分析搜索引擎中网络机器人(Robot)的基础上,研究讨论了一种利用搜索引擎Google所提供的API程序和国外新型的网络机器人(WebSphinx)相结合所实现的基于主题网络机器人的搜索引擎,并对其原理及工作机制进行了分析。  相似文献   

9.
中文搜索引擎的比较研究   总被引:5,自引:0,他引:5  
通过对典型中文搜索引擎的比较分析,指出中文搜索引擎目前存在信息量不足、查询方式单一、采用技术落后、多媒体信息量不足、专题性中文搜索引擎较少和数据库更新不及时等问题,提出了中文搜索引擎的元搜索引擎、智能化检索和多媒体检索等发展趋势和发展对策。  相似文献   

10.
中文元搜索引擎成员搜索引擎的选择策略研究   总被引:2,自引:0,他引:2  
针对目前中文元搜索引擎在成员搜索引擎选择方面的不足,作者详细讨论了一种分类分组的选择策略.即在元搜索引擎上增加信息类别选项.系统预先设置合理的信息类别,再在各类别下分别列出适合该类别的搜索引擎组合供用户选择.这些组合剔除了那些没有提供该信息类型搜索的普通搜索引擎,同时向用户推荐几个适合其搜索请求的成员搜索引擎组供其选择,通过这一设置,元搜索引擎既可以满足用户使用偏好又可以避免一些不必要的搜索,从而提高搜索的效率和准确度.  相似文献   

11.
关于搜索引擎与元搜索引擎的讨论   总被引:22,自引:0,他引:22  
首先探讨了搜索引擎的一般原理以及结构, 然后介绍了元搜索引擎的概念及其框架。在最后, 提出了一种将一般搜索引擎和基于OPAC 的图书目录检索系统集成于一体的元搜索引擎的构想, 该构想可以在一定程度上解决异构数据之间的兼容问题。  相似文献   

12.
针对传统的相似度计算方法在海量信息处理过程中暴露出的数据处理规模限制和性能不足等方面的瓶颈问题,以非结构化文档为研究对象,提出一种基于Hadoop分布式环境,结合Hive数据处理平台和PostgreSQL关系型数据库的文档相似度计算方法,并给出关键技术思路、具体实现步骤和实证研究,通过研究证明Hive SQL语言可有效简化分布式数据处理的复杂性,但实时性有待改进。  相似文献   

13.
论文提出建立基于多Agent的搜索引擎系统为用户提供个性化服务,描述了该系统的结构及各功能模块的具体功能,分析了系统模型的工作流程。  相似文献   

14.
许琦  顾新建  胡恒杰 《情报学报》2007,26(4):588-593
通用搜索引擎虽然功能强大,但存在一些缺陷,如索引库更新不及时、响应速度慢等,而且没有对检索结果根据用户的个人需求做过滤处理.针对这些问题,本文主要从用户个性化需求出发对个性化搜索系统进行了研究,阐述了基于全文索引工具包Lucene所研究开发的一种个性化智能搜索引擎系统.首先介绍了系统的结构模型和工作流程,然后对系统各模块的设计做了详细的研究.实验结果表明,在面向用户定制的站点的信息检索服务中,系统的综合性能比通用搜索引擎有所提高.  相似文献   

15.
在回顾搜索引擎评价研究现状的基础上,分析搜索引擎评价指标的基本构成因素。创造性地将熵权理论引入搜索引擎评价领域,建立熵权值模型,并通过科学计算,构建出基于熵权的搜索引擎评价指标体系。  相似文献   

16.
以用户为中心的搜索引擎优化研究   总被引:1,自引:0,他引:1  
本文在介绍搜索引擎优化价值的前提下,分析了搜索引擎优化和以用户为中心的关系,并提出在以用户为中心的原则下,如何进行搜索引擎优化.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号