首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 93 毫秒
1.
对Web日志数据的预处理是Web日志挖掘的基础和关键。论文分析了Web日志挖掘处理的基本过程,分析讨论了Web日志挖掘中的数据预处理技术及其过程。  相似文献   

2.
Web日志挖掘是利用数据挖掘技术挖掘和分析网络日志,并获取网站使用过程中的有价值的信息和模式的过程。预处理是Web日志挖掘的第一步,也是非常关键的一步,预处理的结果决定了挖掘的效率和质量。本文主要阐述了预处理的一般过程,并针对目前国内外常用的一些预处理技术进行了探讨和分析。  相似文献   

3.
在数据挖掘研究领域中,Web日志挖掘是Web使用挖掘的一个分支。它作为Web挖掘的一个重要组成部分,具有独特的理论和实践意义.通过介绍Web日志挖掘的概念,系统阐述了Web日志挖掘的全过程:数据收集、数据预处理、模式识别、实际应用.说明Web日志挖掘应用广泛,能够实现网站的优化问题.  相似文献   

4.
在Web数据挖掘研究领域中,数据预处理在Web日志挖掘中起着至关重要的作用,在介绍了数据挖掘的概念、分类和结构体系的基础上,阐述了对网站大量Web日志数据进行预处理所采用的算法和处理过程,即先将已知IP地址与物理地址的对应关系保存在HashMap中,然后综合运用折半与顺序查找算法,可以显著减少查找次数,提高查询效率.  相似文献   

5.
Web日志挖掘是Web挖掘中的一个重要分支。介绍了其研究背景和意义,阐述了Web日志挖掘的过程和常用的方法。在对其研究现状加以分析的基础上,提出了未来研究所面临的问题。  相似文献   

6.
本文探索了一种新的Web日志挖掘算法,以便更有效地捕获用户访问模式.该算法首先把原始的用户访问序列转换为一个最长前向访问序列的集合,在转换中过滤掉了用户的回退操作;算法的第二步是根据第一步所得到的结果求得一个用户频繁访问模式.算法经实验模拟测试具有较为满意的时间复杂度和空间复杂度.  相似文献   

7.
W eb日志的数据挖掘,可以发现用户访问页面的行为模式,改进W eb站点的性能和结构,提高查找信息的质量和效率.对W eb日志挖掘预处理的数据清洗、识别用户、识别用户会话和识别片断四个主要阶段所要完成的任务进行分析,论述了现有W eb日志预处理方法中的用户识别技术,提出了一种基于Cook ie技术和扩充日志属性的用户识别方法.  相似文献   

8.
本论文将数据挖掘应用于图书馆网站Web日志记录,来获取用户访问网站的行为模式,帮助改善网站页面布局、改进为用户提供资源的方式,提高用户访问和使用资源的效率,介绍了用户行为模式挖掘的过程.  相似文献   

9.
Web数据挖掘研究   总被引:2,自引:0,他引:2  
针对当前Web数据量急剧膨胀的状况,本文主要介绍了一种解决Web信息过载问题的新技术--Web数据挖掘.本文首先简述了Web挖掘的定义和分类,之后详细论述了各类Web挖掘中所用到的关键技术,最后对Web挖掘的发展趋势作了展望.  相似文献   

10.
随着www的广泛应用及相应的Web技术的出现,使数据挖掘的研究进入了一个新的阶段.关联规则挖掘是数据挖掘中的一个重要研究分支.本文提出了一种Web日志挖掘中频繁访问页组的加强算法.  相似文献   

11.
通过对我院校园网web服务器log记录进行数据挖掘,获取访问用户的特征和访问习惯,并与用户个人信息数据相结合,就能发现其中蕴含的知识,提取出用户的兴趣特征,从而开发有利于用户的界面,构建web智能化站点。  相似文献   

12.
一种改进的Apriori算法在web日志挖掘中的应用   总被引:1,自引:0,他引:1  
在对web日志挖掘的处理流程以及难点深入分析的基础上,为了达到更快挖掘频繁访问页面组的目标,提出一种改进的Apriori算法,主要通过减少候选项集和对事务数据库的压缩来实现性能的提高.候选项集的减少是通过对频繁项集的缩减间接来实现,事务数据库的压缩则通过一系列预先定义的规则来实现.实验数据表明,无论对于短事务集,还是长事务集,算法的性能都得到了提升,更好地满足了实际应用的需要.  相似文献   

13.
对基于Web日志的数据预处理过程做了相关研究,特别关注于用户识别和会话识别的启发式规则,对会话识别中基于时间的两条启发式方法进行了改进,形成新的基于时间的方法,并结合获取的数据予以验证,讨论分析了验证结果。新的方法提高了会话识别的准确性,为下一步的数据挖掘打下了基础。  相似文献   

14.
构建了WEB日志挖掘技术在远程开放教育网站和网上教育平台建设中的应用模式,通过WEB日志挖掘可以掌握学习者个性化学习的特点和要求,从而为建设适合的现代远程教育网站和在线教育平台提供WEB页面结构设计、资源建设、教学互动等方面的依据。  相似文献   

15.
以web挖掘和网页信息聚类为基础,来构建智能化电子商务站点;从而在商务活动中根据访问用户的访问特征和习惯,发现其中蕴含的知识,提取出用户的兴趣爱好,从而开发用户喜好的界面,掌握商务活动先机.  相似文献   

16.
介绍web挖掘的技术基础,阐述了Web挖掘的含义,从Web数据中发现潜在的有用信息和先前不知道的知识。描述了web挖掘的现状、分类以及web挖掘技术的流程,并对web挖掘的前景加以展望。  相似文献   

17.
粗糙集理论是有效处理不精确、不确定和含糊信息的软计算工具,模糊聚类分析是依据客观事务间的特征、亲疏程度和相似性,通过建立模糊相似关系对客观事务进行分类的方法.网站日志数据通常是大量的,冗余的,日志中的页面之间的关系也是模糊的,不确定的.该文利用粗糙集理论和模糊聚类的方法对某学校网站的日志数据进行实例分析,抽取用户感兴趣的模式,理解用户的浏览兴趣行为,以便进一步改善网站结构,为用户提供个性化服务.  相似文献   

18.
介绍web挖掘的技术基础,阐述了web挖掘的含义,从web数据中发现潜在的有用信息和先前不知道的知识.描述了web挖掘的现状、分类以及web挖掘技术的流程,并对web挖掘的前景加以展望.  相似文献   

19.
随着校园网的快速发展,产生了海量信息,怎样利用数据挖掘技术根据校园网用户的访问日志挖掘出有价值的信息,是值得深入研究的。作者首先介绍了Web日志挖掘技术的主要内容,再深入研究在校园网信息处理方面的应用,重点以遵义师范学院校园网为实例,使用关联规则进行研究分析,探讨出用户的兴趣与偏好,从而更好地为学校教学管理服务。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号