共查询到19条相似文献,搜索用时 48 毫秒
1.
2.
基于P2P的分布式主题爬虫系统的设计与实现 总被引:1,自引:0,他引:1
本文详细叙述了一个用于信息检索的基于P2P的分布式爬虫系统的设计和实现过程.系统基于锚文本上下文进行主题相关性判定,采用P2P式的分布式结构,充分利用其动态增加新结点的特性来动态地扩展系统的规模,提高系统的整体吞吐能力,以满足现在和将来的用户对日益增长的大数据量检索需求.实验结果表明,可根据用户给定的主题对网页链接上下文进行主题相关性判定以引导爬虫的爬行路径,能够有效地获取相关主题信息. 相似文献
3.
本文提出一种新的面向主题的搜索引擎设计方法。使用改进的k-means算法对结果进行聚类,然后用相关词抽取技术抽取代表每类的词语。试验结果表明该方法是有效的。 相似文献
4.
5.
李春旺 《现代图书情报技术》2007,2(1):49-52
在分析主题搜索引擎体系结构之后,提出基于OSS的系统实现策略,重点讨论主题建模方法、主题相关度算法以及基于相同代码规范、基于Web Service接口规范、基于JNI接口规范的开源系统集成实现技术。 相似文献
6.
7.
本文论述了主题型专业搜索引擎的结构特点,并针对华文教育网络信息资源的搜索进行详细的研究和分析,设计面向该特定主题的搜索引擎,为华文教育专业资源数据库的建设提供一种高效信息采集的技术模式. 相似文献
8.
9.
乔建忠 《现代图书情报技术》2009,(Z1)
提出一种以动态知识库为指导的主题爬虫的设计方法,目的是克服传统的基于本体的主题爬虫的领域局限性和缺乏指导用户功能的不足;通过知识库的不断完善更好地指导爬虫找到相关网页.其中涉及的主要问题:构建动态知识库、计算网页相关度和判断相关链接. 相似文献
10.
11.
如何利用搜索引擎检索网络信息 总被引:23,自引:1,他引:22
王启云 《现代图书情报技术》2001,17(4):40-43
从搜索引擎的工作机理, 评价标准, 分类, 使用方法, 使用技巧等五个方面介绍如何利用搜索引擎检索网络信息。 相似文献
12.
一个基础教育网站搜索引擎的设计与实现 总被引:2,自引:0,他引:2
在研究网站元数据的基础上,介绍一个以基础教育网站为检索对象的搜索引擎系统。结合基础教育网站的特点,分析该系统的关键技术,如主题蜘蛛搜索、网站分类、网站信息提取等,并对系统的整体架构、功能模块进行详细描述。 相似文献
13.
关于搜索引擎与元搜索引擎的讨论 总被引:22,自引:0,他引:22
首先探讨了搜索引擎的一般原理以及结构, 然后介绍了元搜索引擎的概念及其框架。在最后, 提出了一种将一般搜索引擎和基于OPAC 的图书目录检索系统集成于一体的元搜索引擎的构想, 该构想可以在一定程度上解决异构数据之间的兼容问题。 相似文献
14.
跨语言综合搜索引擎设计 总被引:13,自引:1,他引:13
黄国才 《现代图书情报技术》2001,17(4):31-33
分析了当前网络上信息分布的特点, 对目前相关的技术进行评价。在此基础上, 设计了一个解决网络搜索过程中语言障碍的系统——跨语言综合搜索引擎。 相似文献
15.
OAI元数据搜索引擎的设计与实现 总被引:2,自引:0,他引:2
李勇文 《现代图书情报技术》2005,21(2):37-39
数字图书馆的迅猛发展,互操作性问题显得更为迫切。作为低入门级互操作协议的OAI-PMH,能在元数据开放搜寻基础上提供一个互操作框架。本文在对OAI-PMH协议规范、OAI体系结构描述的基础上,阐述了OAI元数据搜索引擎的设计和实现。 相似文献
16.
提出一种从搜索引擎返回结果页面上自动抽取结果记录及后续页面链接信息并生成Wrapper的方法:对于一个有效的结果页面,通过比较其HTML标签树上节点的相似度从而识别出潜在记录块,利用启发式规则从潜在记录块中将结果记录块和后续页面链接分别识别出来,然后利用其在标签树上的位置信息分别构造Wrapper。实验结论及与已有方法的比较表明,该方法简单可行且高效。 相似文献
17.
通过对教育游戏资源类网站特征的分析,提出教育游戏资源智能搜索系统。该系统定义了教育游戏的“元数据结构”,力求把分散在各地的教育游戏教学资源聚合组织起来,并为建设教学资源库提供一种新的思路。 相似文献
18.
19.