首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
重点研究了HITS算法,并且在原有算法的基础上对其进行了改进。对搜索出的信息利用改进的HITS算法确定了权威Web页面,有效地去除了无效网页。  相似文献   

2.
基于结构挖掘和使用挖掘的Web挖掘算法研究   总被引:1,自引:0,他引:1  
Web挖掘是指使用数据挖掘技术从Web文档和服务中发现和提取信息和知识的技术。本文概述了Web数据挖掘的基本情况以及Web结构挖掘和Web使用挖掘的基本概念。结合对Web结构挖掘中的PageRank算法和Web使用挖掘的主要步骤和算法的研究后,本文提出了一种融合这两种Web挖掘算法的一种新的、综合的Web挖掘算法。  相似文献   

3.
介绍了搜索引擎和Web结构挖掘的相关知识,重点研究Web结构挖掘的PageRank算法以及它在搜索引擎中的应用。在基于Web页面相似度的基础上提出了改进的PageRank算法,通过实验证明,改进后的算法可以使搜索引擎的性能得到极大的提高。  相似文献   

4.
数据挖掘技术的重点已经从传统的基于数据库的应用转移到了基于Web的应用。本文分析了Web挖掘的过程模型。对基于数据挖掘的Web挖掘系统的框架进行了设计研究。  相似文献   

5.
Web中存在着大量的、丰富的超链接.挖掘链接结构可以有助于提高Web信息检索的精度、发现潜在的Web社区.全面分析了基于Web链接结构的挖掘算法及其优缺点.并对挖掘算法在Web潜在社区发现中的应用作了探讨.  相似文献   

6.
Web挖掘研究   总被引:3,自引:0,他引:3  
介绍了Web挖掘的任务和分类;讨论了Web的内容挖掘、结构挖掘和使用记录挖掘。  相似文献   

7.
Web数据挖掘研究   总被引:2,自引:0,他引:2  
针对当前Web数据量急剧膨胀的状况,本文主要介绍了一种解决Web信息过载问题的新技术--Web数据挖掘.本文首先简述了Web挖掘的定义和分类,之后详细论述了各类Web挖掘中所用到的关键技术,最后对Web挖掘的发展趋势作了展望.  相似文献   

8.
Web挖掘能从大量非结构化、异构的Web信息资源中发现有用的知识或者模式,它已经被广泛地应用于许多不同的领域。目前,Web挖掘在教育领域中的应用也逐渐被人们关注。本文首先分别对Web挖掘的分类和方法做了详细的论述,最后对Web挖掘在教育中的应用做了比较全面的探讨。  相似文献   

9.
Web挖掘是数据挖掘技术与数据库技术、Web相结合的产物;介绍了Web挖掘的概念、分类、内容挖掘、Web挖掘的不足,论述XML在Web中的应用;利用XML存储数据的模型,在Web挖掘中提出了基于Web内容挖掘的系统模型.  相似文献   

10.
Web挖掘是数据挖掘技术与数据库技术、Web相结合的产物;介绍了Web挖掘的概念、分类、内容挖掘、Web挖掘的不足,论述XML在Web中的应用;利用XML存储数据的模型,在Web挖掘中提出了基于Web内容挖掘的系统模型。  相似文献   

11.
介绍了Web日志挖掘的模型,分析了使用关联规则挖掘Web日志时遇到的规则数量大且存在冗余等问题,提出了基于频繁闭项集的挖掘办法来减少规则数量.同时引入最小关联规则的概念,从而避免了冗余规则的产生.最后用实验验证了算法的有效性,并以周口师范学院校园网为例,对该网站日志数据进行分析,得到了有价值的规则,并对该网站提出了相应的建议和意见.  相似文献   

12.
在多点数据监测系统中,为了将各区域服务器的数据有效整合,对海量数据的有效采集和处理成为必须解决的关键问题。文章通过引入Web文本挖掘原理和数据抽取方法,将网页列表页的抽取算法应用到多点数据采集,并构建了相应的多监测点数据采集体系。通过对多监测点海洋数据的处理实例表明,基于网页列表页的抽取算法有效地抽取到了准确数据项,解决了嵌套数据记录、自动抽取和多台计算机协同工作问题,提高了数据采集效率。  相似文献   

13.
在Web数据挖掘研究领域中,数据预处理在Web日志挖掘中起着至关重要的作用,在介绍了数据挖掘的概念、分类和结构体系的基础上,阐述了对网站大量Web日志数据进行预处理所采用的算法和处理过程,即先将已知IP地址与物理地址的对应关系保存在HashMap中,然后综合运用折半与顺序查找算法,可以显著减少查找次数,提高查询效率.  相似文献   

14.
在电子商务网站的Web日志中,蕴含着大量有价值的信息,利用Web挖掘技术能够有效获取这些信息,这将有助于提高电子商务运营管理的经营决策,在Web挖掘研究过程中,结合Web日志具有的数据量大,不确定等特点,提出了一种基于粗集理论的最小决策模型,运用这一模型,通过对决策表进行知识简化,可以导出简化决策有,最后获得最小解,电子商务系统的决策人员就可以依据得到的最小解,为提供个性化服务进行决策,应用基于粗集理论的数据挖掘方法,对Web日志进行挖掘,已经成为当前研究的热点问题。  相似文献   

15.
介绍了频繁模式挖掘的相关概念和基本定理,提出了基于事务模式树的分层挖掘算法。该算法首次提出并实现了可累加挖掘,并以实例分析进行了验证。  相似文献   

16.
针对Web挖掘,首先论述了Web挖掘的基本理论,接着分析数据挖掘中的聚类算法,讨论了聚类分析的数据结构和数据类型,以及聚类算法的分类,详细介绍了数据挖掘中用到的主要聚类算法,最后对评价聚类结果的方法进行了分析。  相似文献   

17.
通过挖掘Web日志记录,发现用户访问Web页面的模式,从而为识别电子商务的潜在客户、改进服务器系统性能提供帮助,是Web使用挖掘的重要使命。挖掘过程主要包含数据预处理、模式发现和模式分析三个阶段。针对这三个阶段,分别对数据预处理的技术、常用的Web使用挖掘的方法和算法以及主要应用进行了阐述。  相似文献   

18.
对搜索引擎算法进行分类总结,对常用搜索引擎算法思想进行分析、比较,提出相应的优化策略。  相似文献   

19.
Internet的迅速发展,使WorldWideWeb(WWW)成为一个巨大的、蕴涵着具有潜在价值知识的分布式信息空间。数据挖掘是从大量的数据中发现隐含的规律性内容,解决数据的应用质量问题,并充分利用有用的数据,帮助决策者调整策略,减少风险,做出正确的决策,是最具有前瞻性的一项技术。数据挖掘技术应用在Web环境下,通过对服务器日志信息采集,创建Web日志挖掘模型,分析经常访问的信息串,以利于网站管理者和经营者对网站管理进行决策参考。  相似文献   

20.
如何在数量巨大的Internet中快速准确的搜索到符合要求的Web页是一个值得探讨的重要课题.构造了一种能够准确区分Web文本之间亲和力的挖掘模型,运用人工免疫算法使该模型具有较高的聚类精度和自发现能力.实验结果表明,该模型不仅能够有效的进行文本内容挖掘,保持较低的错误肯定率和错误否定率,还具有很强的自适应性和更新能力,进行适当的参数设置后检测周期也随之大幅缩短,提高了挖掘模型的效率.该模型的提出为Web挖掘领域提供了一种新的研究思路.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号