首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 78 毫秒
1.
在总结主题爬行器的"真、假隧道"策略的基础上,提出一种解决"假隧道"问题的KBES算法。通过实验分析KBES算法能在一定程度上提高锚与链接文本在启发策略中预测新链接相关性的效率。  相似文献   

2.
面向动态网页爬行的Crawler架构   总被引:5,自引:0,他引:5  
本文分析了Crawler动态网页爬行功能,提出了面向动态网页爬行的Crawler架构,并对相应模块进行了探讨。  相似文献   

3.
主题爬行是专业搜索引擎的基础,爬行策略与爬行算法是主题爬行技术的核心,通过分析主题爬行的基本原理,对爬行策略与爬行算法进行分类比较,展示爬行策略与爬行算法的研究进展及当前研究热点,为主题爬行技术的进一步研究提供参考。  相似文献   

4.
乔建忠 《图书情报工作》2013,57(14):114-120
针对主题爬行技术中的单一分类算法在面对多主题Web抓取和分类需求时泛化能力不强的局限,设计一种利用多种强分类算法形成的分类器组合,主题爬行器根据当前主题任务在线评估并为分类器排名,从中选择最优分类器分类的策略,并开展在多个主题抓取任务下的分类实验,比较每种分类算法的准确率和组合后的平均分类准确率以及对分类效率等评价指标的综合分析,结果证明该策略对领域局域性有所克服,普适性较强。  相似文献   

5.
乔建忠 《图书情报工作》2011,55(13):108-146
主题爬行技术的应用领域不断扩大,但对主题的界定并无统一的标准。从需求的角度将现有主题爬行技术分为三种基本类型:面向内容的、面向类型的和面向网站的,分别论述它们的关键技术和典型案例。最后提出一种将各需求统一在一个框架内的组合爬行技术简称DDCFC,简要描述其定义和逻辑架构。  相似文献   

6.
介绍一个基于链接分析的可视化分析框架NeSVA。科技信息分析人员运用该框架可以方便地观察科技实体网络的拓扑信息,同时通过对大规模动态链接数据的分析,为网络的动态分析提供基于时间的、合理的且易于理解的评估与解释。  相似文献   

7.
张朋岗 《大观周刊》2012,(49):145-145
本文主要介绍一种基于凌阳十六位单片机精简开发板的简易公交车报站系统,以单片机SPCE061A为控制芯片,外扩SPR4096存储芯片进行语音存储扩展,用键盘对报站系统进行控制,使其完成报站功能,并用LED显示日期年和时间。该公车报站系统结构简单、操作简单、可靠性高,具有很好的实用价值。  相似文献   

8.
提出一种基于内容规则的网页净化算法。包含两部分,先提出一种同层表间的比较迭代算法,通过迭代的方式对于网页中的噪声内容进行层层剥离。为进一步判断网页中锚文本与网页主题的相关性,又提出一种基于修正的编辑距离的计算锚文本的主题相似性的算法,在一定程度上考虑了网页的语义因素。该算法具有更高的准确度,同时具有很低的时间复杂度。实验结果表明,在对海量网页进行净化处理时,算法具有良好的效果。  相似文献   

9.
基于Ontology的面向主题的网络信息采集算法   总被引:3,自引:1,他引:2  
介绍基于内容评价的、基于链接结构评价的和基于巩固学习的三种采集算法的优缺点;介绍一种依据词典构建主题Ontology的方法,该方法有助于提高Ontology的构建速度;最后,在分析传统采集算法的基础上,提出一种新的基于Ontology的面向主题的网页采集算法,并通过试验证明其优越性。  相似文献   

10.
围绕NSTL-IPv6文献信息服务平台的实现,从网络平台、网络服务、应用服务三个方面介绍了相关的IPv6关键技术。  相似文献   

11.
基于Web Services的个性化短信服务系统的设计与实现   总被引:2,自引:0,他引:2  
为了满足用户对信息实效性的需求,图书馆开始使用手机短信为用户提供即时信息服务。文章以上海交通大学图书馆为例,通过用户需求分析,提出了基于Web Services的个性化短信服务系统模型,并详细阐述了该系统的设计方案与实现步骤。  相似文献   

12.
基于页面分析技术的统一检索系统设计与实现   总被引:2,自引:1,他引:1  
基于页面分析技术,在JDK和Tomcat环境中设计一个统一检索系统,该系统利用Java Socket与各资源进行通信,能实现跨库检索,对检索结果进行合并等功能,并具备一定的扩展性和可移植性。  相似文献   

13.
基于Web的数字参考咨询系统设计与实现   总被引:4,自引:0,他引:4  
随着网络快速发展,高校中图书馆传统咨询方式受到强烈冲击,为了快捷方便利用图书馆中各种形式资源,数字参考咨询服务应运而生。本文结合高校教师和学生实际需求,从快捷方便解答用户入手,通过校园网络,利用SQL Server 2000和ASP开发工具开发出数字参考咨询系统,投入运行半年来,运行效果良好。  相似文献   

14.
创建图书馆员个人网页的意义及方法   总被引:4,自引:0,他引:4  
祝力 《图书馆杂志》2001,20(2):10-12
本文分析了作为网上运作技能重要标志的图书馆员个人网页的现状,创建图书馆员个人网页的意义及基本方法等相关问题,提出将学习创建图书馆员个人网页当作网上演练的重要途径,提高图书馆员的网上运作能力,为胜任“网络导航”职责做准备。  相似文献   

15.
基于Web的Z39.50客户端实现   总被引:4,自引:1,他引:3  
Z39.50作为网络信息检索协议,为图书馆支持。Internet服务提供了一种标准,从而在图书馆自动化系统中可以发挥多方面的作用。本文分析了目前Z39.50客户端和服务器的发展现状,详细介绍了基于Web的Z39.50客户端四个主要服务的实现,给出了我们的解决方法。  相似文献   

16.
基于后缀树的中文新闻重复网页识别算法   总被引:1,自引:0,他引:1  
针对识别中文新闻重复网页传统方法的不足,提出以后缀树作为基本数据结构,依据新闻网页的标题性和时间性,构建中文新闻重复网页识别算法。该算法以Ukkonen算法和Matching Statistics算法为基础,并对其具体实现进行优化。实验结果表明,该算法不仅具有有效性,而且对计算字符串相似度也有启发意义。  相似文献   

17.
基于ID3分类算法的深度网络爬虫设计   总被引:1,自引:0,他引:1  
针对目前Web信息挖掘中存在的信息覆盖率较低的问题,对网络爬虫系统进行研究,提出一种针对深度网络的、基于ID3分类算法的Web页面收集方法。对Web页面的特征进行分析、处理和分类,提取包含深度网页的表单,通过自动提交这些表单来进行更深和更广的页面获取,实验表明该方法可以有效减少现有搜索引擎的盲区,改善搜索结果。  相似文献   

18.
从系统的运行环境、系统功能、系统设计与实现等几个方面,探讨了如何用ASP制作Web上的留言本。  相似文献   

19.
吴广印 《情报学报》2007,26(6):851-857
信息资源的共享是图书情报界多年来一直研究的主要课题,但传统的基于TCP/IP或HTTP协议的资源检索与服务系统只是基于功能层面或特定格式层面的数据共享.Web Service技术可以实现数据的真正共享,使用远程分布式数据就像使用本地数据一样,客户端可以利用SOAP服务器提供的应用接口完全按需管理数据. 本文主要内容分为3部分第一部分介绍 Web Service的技术构架及实现原理,第二部分介绍Web Service技术在资源共享服务中的应用构架,第三部分介绍基于Web Service构架的R Service产品实现的关键技术和应用构架.R Service产品的开发涉及SOAP通信协议、数据库服务器、数据库的DCL和DML接口功能的设计与实现.Web Service应用接口的设计应充分考虑SOAP协议的一些特性,才能确保系统高效运行.  相似文献   

20.
《The Reference Librarian》2013,54(91-92):117-138
Summary

The structure of ready reference Web sites in American public and academic libraries reflects answers to consistently encountered design questions. A survey of 100 Web sites shows widespread agreement about naming these resources, using subject categories, and relying on free unlicensed Web sources for content. Opinions are divided about the optimum number of listed sources and the best ways to organize hot links. Guides and explanations rarely are provided for users. Librarians have not built these sites around commercial products, although advanced search features could make the purchase of ready reference tools more appealing. Further study of user behavior would help librarians meet the needs of their clientele.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号