首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
基于超链分析的Web资源自动发现技术   总被引:2,自引:0,他引:2  
传统的Web资源自动发现是基于Web页面内容实现的。本文试图从超链分析的角度探讨Web资源的自动发现技术。超链分析技术起源于社会网络分析和科学引文分析理论,它只分析页面之间的关系,而不关心页面本身的属性。通过试验证明,单纯使用超链,根据用户提供的网页实例,我们能够自动发现与学科资源相关的网站。该技术可以有效的减少网络爬行器的无谓爬行,提高采集效率,减轻网络负担,在学科资源建设中起了重要的作用。  相似文献   

2.
WEB超链分析及应用   总被引:4,自引:0,他引:4  
文章分析了传统的基于文本处理的信息检索算法在处理WEB页面时遇到的问题,指出在处理WEB页面时,应分析页面中超链的意义,给出了超链分析在网络爬行和检索结果排序两个方面的应用及相应的算法。  相似文献   

3.
阅读是人们获取信息的主要方式,是建构自我、认识世界的重要手段.美国作家爱泼斯坦(Joseph Epstein)说:"在某种意义上,我们是被阅读所塑造的."数字时代信息的生产、组织、传播和呈现方式发生了深刻的变化,阅读也随之改变,数字阅读应运而生.数字阅读带给人们的是一种新的信息获取方式,与传统阅读相比,数字阅读具有多媒体性(阅读形式的扩展)、超链性(阅读内容的扩展)和交互性(阅读社交的扩展)等优势特征.  相似文献   

4.
超文本信息环境导航的主要形式及功能特色   总被引:2,自引:0,他引:2  
本文分析了超文本信息环境导航的三种主要形式:通过图形化浏览器导航;通过元认知提示和适应性帮助导航;通过预设浏览路径和自适应超链注解导航。同时,阐述了超文本信息环境导航必须具备的功能特色。  相似文献   

5.
XML及其在虚拟图书馆建设中的应用研究   总被引:5,自引:1,他引:4  
分析了HTML的局限性、XML的优势及其在虚拟图书馆建设中的应用,与HTML相比,XML具有检索速度快、多向超链及语义理解等特点,基于XML建立的虚拟图书馆可实现倒排档自动建立,节省建设费用。  相似文献   

6.
复合型Web信息检索系统   总被引:5,自引:0,他引:5  
向桂林 《情报学报》2003,22(5):545-549
本文首先分析了常见的三种搜索引擎 :基于内容分析的搜索引擎、基于超链分析的搜索引擎、基于反馈分析的搜索引擎的弊端 ,提出了一种能够集三种搜索引擎优点于一身的复合型Web信息检索系统 ,并详细阐述了该系统的实现方法  相似文献   

7.
OPAC与网上书店检索系统比较及启示   总被引:3,自引:0,他引:3  
程卫东 《图书馆论坛》2006,26(4):105-107
通过OPAC与网上书店的检索系统比较,分析了两者之间的相同与不同之处,并结合网络环境下读者对OPAC的要求,提出了对改进OPAC功能的一些看法,包括强化书目记录、增加超链节和改进检索功能等三个方面。  相似文献   

8.
Web数据挖掘对Web数据检索的支持作用   总被引:3,自引:0,他引:3  
唐建国  胡芒谷 《情报学报》2004,23(4):452-455
本文在对Web数据检索和Web数据挖掘的技术特性进行简要介绍的基础上 ,阐述了二者之间的主要区别 ,并着重对Web数据挖掘对Web数据检索构成的支持作用进行了具体分析。这些支持作用体现在 :自动分类 ,揭示知识特征 ,群集处理 ,超链结构挖掘和用户知识模型挖掘。  相似文献   

9.
首先分析了查找相关网页的一些相关算法,然后在标准的HITS算法基础上,提出了基于修正的HITS的查找相关网页算法。最后,通过实验来分析了这些算法的各自特点和不足。对基于超链分析的查找相关网页算法的研究,可以为用户提供一种新的检索和获取的信息的途径。  相似文献   

10.
姜钰 《出版参考》2013,(18):13-14
阅读是人们获取信息的主要方式,是建构自我、认识世界的重要手段。美国作家爱泼斯坦(Joseph Epstein)说:"在某种意义上,我们是被阅读所塑造的。"数字时代信息的生产、组织、传播和呈现方式发生了深刻的变化,阅读也随之改变,数字阅读应运而生。数字阅读带给人们的是一种新的信息获取方式,与传统阅读相比,数字阅读具有多媒体性(阅读形式的扩展)、超链性(阅读内容的扩展)和交互性(阅读  相似文献   

11.
搜索引擎已经成为人们获取信息的一个重要手段,对搜索引擎技术的研究也日益增多,如何能有效弥补现有技术的缺陷,更合理地满足用户需求变化越来越重要。本文从信息时效性方面提出对现有“超链分析”技术改进的必要性,并结合现有的过分优化网站行为和结果输出方式进一步提出了改进策略。  相似文献   

12.
Web信息检索技术最新进展   总被引:18,自引:1,他引:17  
Web 信息检索是一个集人工智能、数据挖掘、自然语言处理、数据库技术、计算机网络等于一体的综合技术。尽管搜索引擎的出现在一定程度上缓解了用户对信息需求难以满足的矛盾, 但是它还没有达到令人满意的程度。本文对Web 信息检索技术作了一个比较全面的论述, 尤其从超链分析的角度, 对网络链接的重要性做了深入探讨并指出了它的发展方向, 对这方面的理论研究和实际开发具有一定的参考价值。  相似文献   

13.
严海兵  崔志明 《情报学报》2007,26(3):361-365
基于关键字匹配的搜索引擎排序网页时仅仅考虑评价网页的重要性,而忽视分类;基于分类目录的搜索引擎很难动态分析Web信息。本文在分析它们不足的前提下,提出利用模糊聚类的方法对搜索引擎的检索结果进行动态分类,依据超链分析算法PageRank和Web文档隶属度相结合进行分类排序,并给出具有调节值的结合公式。实验证明,该算法能够更有效地满足用户的需要,提高检索效率。  相似文献   

14.
Web使用挖掘下的Web页面层次分类技术研究   总被引:1,自引:0,他引:1  
Web使用挖掘研究用户访问行为所体现的行为特征,Web站点结构分析对于Web使用挖掘具有重要意义.本文讨论如何结合Web站点内页面间的超链结构和关键页面分析技术实现对Web站点的链接结构分析,得到清晰的站点拓扑结构和页面层次分类,进而以此为Web页面进行层次编码,和Web用户行为向量的建立方法,为准确表述用户的访问行为提供数据支持;用一种新的方式进一步有效的挖掘用户的行为特征.最后,把它同一些重要的页面分类方法,从算法的计算效率和页面分类的准确率上进行了比较,试验数据的分析表明,该方法在效率和准确率上有一定提高.  相似文献   

15.
因特网上WWW生物医学信息资源查询与检索   总被引:3,自引:1,他引:2  
1WWW的发展概况 1989年3月,欧洲粒子物理实验室(CERN)的科学家 TimBerns Lee首先提出了 WWW(环球网)的概念,并把它作为高能物理学界科学家传输新想法、新成果的工具。90年末,第一个环球网软件在Next Com上实现,该软件能让用户在因特网上查阅、传输超文本文档,并具有编辑超文本功能。1992年CERN公开发表WWW,1994年夏天成为访问因特网资源最流行的手段。我国在1994年正式建立了因特网上的WWW服务器,集中在北京。WWW是一个超文本信息检索工具,通过超链将因特网上的…  相似文献   

16.
试论网络编辑工作的编辑特点   总被引:4,自引:0,他引:4  
目前网络是一种媒介的观点已被业界多数学者所承认。那么网络作为一种媒体,与以往纸介质媒体和广播电视相比,网络编辑工作中的编辑特点是一个值得探讨的问题。一、超链接式编辑特点 网络编辑工作的编辑特点几乎都可以归功于Internet中的超文本/超媒体技术了。超文本/超媒体技术按照人的思维方式(非线性方式)存储、管理、浏览各种信息,它充分利用了信息间的各种关系,将其有机地结合在一起,用户在游览过程中能够按自己的需要,灵活地访问各类信息。超文本超媒体技术的基础是节点和超链。在超文本/超媒体中,各节点中存放有文字、图像…  相似文献   

17.
基于Robot搜索引擎的自动检索技术   总被引:2,自引:0,他引:2  
1.产生背景和功能1993年以前,多数WWW用户采用的查找方法是从一个WWW服务器中的某一个URL开始,沿其中的超链(Hyperlink)连接到其它URL。但由于世界上的WWW服务站点数量非常多,所以由手工进行查找是既费时又费力,需要大量的人力来进行搜集、排序、编成HTML文件并进行维护,该方法速度很慢,并且更新周期长。1994年出现了所谓的Robot或称Spider,它们的功能是自动在Web上按某种策略进行远程数据的搜索与获取,并生成本地索引。由于不需要人的介入,可以自动地在网络中穿梭,速度、覆盖面和及时性大大提高。Robot自…  相似文献   

18.
于升峰  薛刚  宿向军 《情报学报》2001,20(6):648-654
本研究基于Agent搭建的虚拟商务平台主要分为三个功能模块 ,即通用网上购物模块、网上商场模块和Agent系统模块。其中核心部分Agent系统模块作为常驻触发模块。Agent系统运行如下 :(1)接收HTML的线性超链结构信息以及XML信息 ;(2 )经过信息过滤 ,提取XML扩展字典标准信息 ;(3)将有效信息通过决策支持系统的推理机制进行运算处理 ,并与决策知识库中的模式进行匹配和比较 ,计算出初步结果 ;(4)经过结果处理将相应信息传回用户界面。主要涉及的关键技术有开放网络技术 (TCP IP) ,跨平台编程 (JAVA) ,数据仓库分析和数据挖掘技术。模型搭建与测试联合WASHINGTONMASONUNIVERSITYOFUSA共同合作完成  相似文献   

19.
王梅 《中国索引》2005,3(4):40-43
索引系统主要研究信息的表示、存储、组织和访问。索引主要是标引信息资源外表特征和内容特征,建立相关参见,形成相应索引数据库,基于索引词匹配的查询,通过布尔逻辑模型、模糊逻辑模型、向量空间模型或者概率模型来提高查准率。由于索引词匹配技术很难解决一词多义的现象,相关参照很难解决不确定的相关关系,往往会检索大量的无关信息。近年来,为了提高索引的利用率,索引系统利用语义技术、超链技术、语义网检索技术和知识处理技术,促进索引系统向更高层次发展。本文主要以索引语义为主线,讨论索引语义扩展的方法和技术,结合信息资源管理系统的应用,探讨索引语义功能的实现。  相似文献   

20.
搜索引擎中Robot搜索算法的优化   总被引:15,自引:0,他引:15  
目前的搜索引擎越来越暴露出不足之处 ,当用户使用搜索引擎时输入特定关键词之后 ,返回的查询结果往往有数千甚至几百万之多 ,而且其中包含大量的重复信息与垃圾信息 ,用户从中筛选出自己感兴趣的网页仍然需要耗费很长的时间。另外一种情况就是 ,Web上明明存在某些重要网页 ,却没有被搜索引擎的robot发现。本文针对这种现象 ,重点讨论搜索引擎中的搜索策略 ,改善搜索算法 ,使Robot在搜索阶段就能够充分处理与Robot频繁交互的URL列表。根据网页的内容、HTML结构以及其中包含的超链信息计算网页的PageRank ,使URL列表能够根据重要性调整排列顺序。初步的试验结果表明 ,本文的优化算法可以较大程度地改进搜索引擎的整体性能  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号