首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 62 毫秒
1.
基于页面链接挖掘的Web教育信息检索   总被引:2,自引:0,他引:2  
王成云  王乐乐 《情报科学》2004,22(4):475-477,487
教育信息检索是教育信息应用于教育科研与教育教学的关键环节,而Web页面链接挖掘是对Web页面之间的链接结构进行挖掘。本文对Web链接结构挖掘在教育信息检索方面上进行了研究,介绍了Web挖掘的概念、分类,以及HITS与Page—rank等算法,并提出了一种基于样本模式特征提取的信息检索方法。  相似文献   

2.
基于链接结构分析的Web信息检索方法研究   总被引:1,自引:0,他引:1  
宋玲玲  李村合 《现代情报》2007,27(2):133-135,137
随着信息技术的发展,特别是互联网技术的不断普及,网上信息数量成指数级增长。如何准确有效地从海量信息中检索出所需的信息,成为一个重要而迫切的研究课题。文中针对基于链接结构分析的Web信息检索方法进行了分析和研究,提出了一种改进的超链接主题查找算法——SAHITS,经过实验验证,改进后的算法更符合人们的一般期望,能有效地提高信息检索系统的查准率。  相似文献   

3.
Web页面链接动机分析及链接测度研究   总被引:15,自引:0,他引:15  
俞培果  邱均平 《情报科学》2003,21(3):320-323
本文分析了Web网页“链接”与文献“引用”的可比性,通过网页链接分类对链接原因和动机进行了分析,并对网页链接的测度意义和测度应用作了讨论。  相似文献   

4.
Web结构挖掘研究   总被引:13,自引:0,他引:13  
Web上的信息以及用户都在以接近于指数的速度增长 ,到 2 0 0 1年 9月Web服务器已接近 30 0 0万台 ,网络用户数量接近 4亿[1] 。计算机和网络技术的发展 ,为信息传播提供了技术支持 ,使得信息的发布与访问不再受到时间和空间的限制 ,为用户提供了极大的方便。搜索是解决网络信息无序和混乱的一个基本方法 ,同时也使得在因特网下搜索变得十分关键[2 ] 。尽管搜索引擎的出现在一定程度上解决了人们的信息需求 ,但远没有达到令用户满意的程度。如何利用数据挖掘知识 ,进一步提高Web信息搜索的性能是众多学者研究的热点问题。O Etz…  相似文献   

5.
基于Web的信息检索的特点与策略   总被引:2,自引:0,他引:2  
随着因特网广泛普及,加入因特网的站点迅速上升,网上信息的数量和类型也随……  相似文献   

6.
Web信息检索技术中关联规则挖掘算法应用研究   总被引:4,自引:0,他引:4  
针对Web信息检索系统在海量数据下的服务质量和效率问题,讨论了数据挖掘技术在Internet信息检索中的运用,在经典的关联规则算法研究基础上,通过引入多维链表结构,提出了利用事务集合匹配运算和链表操作高效地挖掘关联规则的算法ARMLL用于提高Web信息检索质量。实验结果表明该算法是可行的,有较高的效率。  相似文献   

7.
面向Web的视频信息检索   总被引:2,自引:0,他引:2  
蓝兹贵 《情报杂志》2004,23(9):89-91
在分析了视频信息检索的特征及其相关检索方法的基础上,提出了面向Web的视频信息检索。并就视频信息检索的用户界面,数据库建设和数据转换进行了系统阐述。  相似文献   

8.
Web结构挖掘的PageRank算法改进   总被引:2,自引:1,他引:2  
吴春旭  郭磊 《情报杂志》2005,24(10):55-56,58
分析了Web结构挖掘的PageRank和HITS算法,并介绍了一种对PageRank算法的改进。  相似文献   

9.
在Web数据挖掘的应用与研究中,学者们开拓了许多新的研究领域和方向,如图挖掘、数据流挖掘等等,也掀起了将数据挖掘的思想应用于其它研究领域的新高潮。本文提出了一种基于图论链接分析的结构挖掘算法,用于为交易双方进行客观真实的信用评分。为了验证算法的可行性及精确度,本文以某商业地产网站的订单数据为建模样本进行了模拟实验,并给出了分析和结论。  相似文献   

10.
李招远  丁振国 《情报杂志》2004,23(8):59-60,63
序列是数据挖掘中一个比较困难的问题,对Web访问序列的挖掘有助于提高Web的服务质量。在研究了FreeSpan算法之后,根据Web访问的特点,提出了一个简化的FreeSpan算法。  相似文献   

11.
随着网络的发展,如何提高网页信息搜索的查准率成为研究的热点。通过对基于标记的网页信息搜索技术、基于元搜索的网页信息搜索技术、以及基于爬虫的网页信息搜索技术在查准率方面的研究进行了分析,并对其未来发展趋势进行了讨论。  相似文献   

12.
浅析网络信息挖掘   总被引:1,自引:0,他引:1  
With the further development of the Intemet and e-commerce,using mining technologies to acquire knowledge from Web data is a hot and rapidly growing field. This paper primarily analyzes Intemet information mining from the perspectives such as its research background, basic signification, characteristics, types and trends, expecting to improve Web mining research and its application in China.  相似文献   

13.
随着个性化时代的到来,信息服务机构必须提供个性化服务,才有可能在激烈的竞争中取得胜利.Web数据挖掘技术是实现个性化信息服务的关键技术.在构建基于Web数据挖掘的个性化信息服务的实现模型后,还对建立在Web数据挖掘基础上的个性化信息服务系统运行的基本流程、Web挖掘的数据资源、Web挖掘的技术方法、信息系统的服务内容、系统运行的注意事项等进行了探讨.  相似文献   

14.
在统计分析了中文新闻网页的结构和内容特征的基础上,提出一种比较简单实用的基于正文特征的新闻网页抽取方法.该方法首先将HTML网页表示成基于XML的DOM树形式,利用统计的正文特征和节点信息从树中过滤掉噪音数据节点,最后再选取正文节点.该方法相比传统的基于包装器的抽取方法具有简单、实用的特点.实验结果表明,该抽取方法准确率达到94%以上,具有很好的实用价值.  相似文献   

15.
网络信息服务检索技术发展综述   总被引:1,自引:0,他引:1  
简要阐述了网络信息资源的特点,并从不同方面论述了网络信息检索技术,包括自然语言检索和多媒体检索,以及检索技术的发展方向。  相似文献   

16.
基于Web数据挖掘的个性化信息智能Agent挖掘系统模型   总被引:1,自引:0,他引:1  
张莉 《科技广场》2006,31(8):53-55
个性化智能挖掘是近几年出现的一个崭新的研究方向,它是人工智能与数据挖掘技术在Web或Internet环境下相互融合的产物。大部分个性化信息挖掘都只是建立在纯粹的Web数据挖掘之上,然而面对大部分的智能化技术的出现,面对用户能够快速准确地检索自己最想要的信息的需求,Web数据挖掘要进行相应的扩展,通过将Web数据挖掘技术和智能Agent技术相结合,从而满足用户的需求。本文主要提出两个模型:典型的个性化Web挖掘模型和个性化Agent智能挖掘模型。  相似文献   

17.
设计和实现了一个超链接符合度测试系统.首先通过Crawler技术爬取超链接文本和链接指向内容,然后采用中文分词技术对其分别进行分词,得到相应的词语列表.对链接指向的文本内容,分别依据标题、段首句、段尾句和正文进行分词,最后根据设计的符合度计算模型,计算链接文本和链接指向文本的符合度.经过和人工判断的符合度对比,系统计算的符合度较好,和人工判断的符合度有很好的相关性.  相似文献   

18.
面向学科的网络信息挖掘系统研究   总被引:2,自引:0,他引:2  
杨宝森  来玲 《情报理论与实践》2006,29(2):240-242,245
面向学科的网络信息挖掘是信息检索领域内一个新兴而有实用价值的研究项目。本文分析了面向学科的网络信息挖掘的系统构架,提出了相应的解决方案,其目的是为了解决网络环境下面向学科的科研人员面临的信息过载和资源迷向的问题。  相似文献   

19.
网络信息组织中超文本链接的优化   总被引:7,自引:0,他引:7  
1 超文本的构成超文本是网络信息组织和利用的一种技术。它按照非线性方式存储、管理、浏览各种信息 ,充分反映了信息间的各种关系。用户在浏览过程中能够根据自己的需要灵活地访问有关信息。如果超文本能支持图形、图像、视频等多媒体信息 ,则称为超媒体。超文本和超媒体只是研究对象不同 ,所以一般并不作严格的区别。目前Web网页主要采用超文本的组织方式 ,由许多不同的节点和链组成。1)节点 (Node)。节点是存贮信息的基本单元。每个节点表达一个特定的主题。节点中可以通过链与其他节点相连接。节点内容可以是文本、图形、图像、视频、…  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号