共查询到8条相似文献,搜索用时 0 毫秒
1.
2.
基于P2P的分布式主题爬虫系统的设计与实现 总被引:1,自引:0,他引:1
本文详细叙述了一个用于信息检索的基于P2P的分布式爬虫系统的设计和实现过程.系统基于锚文本上下文进行主题相关性判定,采用P2P式的分布式结构,充分利用其动态增加新结点的特性来动态地扩展系统的规模,提高系统的整体吞吐能力,以满足现在和将来的用户对日益增长的大数据量检索需求.实验结果表明,可根据用户给定的主题对网页链接上下文进行主题相关性判定以引导爬虫的爬行路径,能够有效地获取相关主题信息. 相似文献
3.
4.
马世杰 《图书馆工作与研究》2009,(2)
本文对Unicorn系统报表输出的纯文本数据进行数据库的格式和EXCEL格式的转换和输出,并通过报表定位打印设置,可以满足图书馆业务部门的不同格式数据输出需求. 相似文献
5.
图书馆学术资源推荐系统是一种为了解决信息过载、提高搜索效率而提出的基于信息过滤机制的知识服务系统。系统的改进,可以从用户Web日志、搜索习惯、浏览行为、图书馆学术关联数据等多角度进行数据挖掘和数据分析,以构建读者信息需求库及关联数据仓库,采用基于内容过滤推荐和规则过滤推荐相结合的混和推荐技术来实现推荐系统,以提高资源推荐的精度和覆盖率。 相似文献
6.
7.
文章以CNKI为样本来源,运用SATI文献题录信息统计分析软件对政府信息公开与档案相关研究文献分别进行高频关键词提取和词频分析,建立高频关键词共词矩阵;再运用UCINET社会网络分析工具绘制高频关键词的共词网络图.而后依据采集的词频分析和建立的高频词可视化共词网络图得到的分析数据,得出档案信息、档案开放、现行文件、国家档案馆、信息查询、档案工作、档案利用是当前政府信息公开与档案相关研究领域研究的重点与热点,而档案馆、档案、开放、知情权、公开、档案法则可能成为日后研究的方向与趋势. 相似文献