首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 86 毫秒
1.
对Web日志数据的预处理是Web日志挖掘的基础和关键。论文分析了Web日志挖掘处理的基本过程,分析讨论了Web日志挖掘中的数据预处理技术及其过程。  相似文献   

2.
对基于Web日志的数据预处理过程做了相关研究,特别关注于用户识别和会话识别的启发式规则,对会话识别中基于时间的两条启发式方法进行了改进,形成新的基于时间的方法,并结合获取的数据予以验证,讨论分析了验证结果。新的方法提高了会话识别的准确性,为下一步的数据挖掘打下了基础。  相似文献   

3.
在Web数据挖掘研究领域中,数据预处理在Web日志挖掘中起着至关重要的作用,在介绍了数据挖掘的概念、分类和结构体系的基础上,阐述了对网站大量Web日志数据进行预处理所采用的算法和处理过程,即先将已知IP地址与物理地址的对应关系保存在HashMap中,然后综合运用折半与顺序查找算法,可以显著减少查找次数,提高查询效率.  相似文献   

4.
W eb日志的数据挖掘,可以发现用户访问页面的行为模式,改进W eb站点的性能和结构,提高查找信息的质量和效率.对W eb日志挖掘预处理的数据清洗、识别用户、识别用户会话和识别片断四个主要阶段所要完成的任务进行分析,论述了现有W eb日志预处理方法中的用户识别技术,提出了一种基于Cook ie技术和扩充日志属性的用户识别方法.  相似文献   

5.
事务识别在Web日志挖掘步骤中至关重要,如果没有高效的识别算法,挖掘的效率将大打折扣。本文详细研究了事务识别的两种模型,介绍并改进了基于最大向前引用模型的识别方法MFP算法,同时对这两种方法进行了比较,结果表时,改进后的MFP算法具有更高的挖掘效率。  相似文献   

6.
Web挖掘的预处理是生成用户模式和进行信息推荐的基础。文章研究了Web挖掘预处理的三个主要步骤:数据清洗、用户识别和会话识别,给出了各个步骤的关键算法,并提出了一种基于注册用户和Cookies技术、用户IP等综合因素来改进用户识别的算法。  相似文献   

7.
在数据挖掘研究领域中,Web日志挖掘是Web使用挖掘的一个分支。它作为Web挖掘的一个重要组成部分,具有独特的理论和实践意义.通过介绍Web日志挖掘的概念,系统阐述了Web日志挖掘的全过程:数据收集、数据预处理、模式识别、实际应用.说明Web日志挖掘应用广泛,能够实现网站的优化问题.  相似文献   

8.
Web日志挖掘是Web挖掘中的一个重要分支。介绍了其研究背景和意义,阐述了Web日志挖掘的过程和常用的方法。在对其研究现状加以分析的基础上,提出了未来研究所面临的问题。  相似文献   

9.
提出使用XML文件的方法存储不同Web日志的格式.采用一个通用的方法分析原始的Web日志,并对日志做预处理、产生Web日志挖掘系统所需的数据,从而使Web日志挖掘更快速和准确.  相似文献   

10.
本论文将数据挖掘应用于图书馆网站Web日志记录,来获取用户访问网站的行为模式,帮助改善网站页面布局、改进为用户提供资源的方式,提高用户访问和使用资源的效率,介绍了用户行为模式挖掘的过程.  相似文献   

11.
通过对我院校园网web服务器log记录进行数据挖掘,获取访问用户的特征和访问习惯,并与用户个人信息数据相结合,就能发现其中蕴含的知识,提取出用户的兴趣特征,从而开发有利于用户的界面,构建web智能化站点。  相似文献   

12.
一种改进的Apriori算法在web日志挖掘中的应用   总被引:1,自引:0,他引:1  
在对web日志挖掘的处理流程以及难点深入分析的基础上,为了达到更快挖掘频繁访问页面组的目标,提出一种改进的Apriori算法,主要通过减少候选项集和对事务数据库的压缩来实现性能的提高.候选项集的减少是通过对频繁项集的缩减间接来实现,事务数据库的压缩则通过一系列预先定义的规则来实现.实验数据表明,无论对于短事务集,还是长事务集,算法的性能都得到了提升,更好地满足了实际应用的需要.  相似文献   

13.
面向Web的数据挖掘是当今数据挖掘技术的热点。XML作为直接面向Web数据、基于Internet上的一种新的数据管理手段,为面向Web的数据挖掘带来了便利。分析了Web数据挖掘的特点和XML语言的优点,提出了运用XML解决Web数据挖掘中半结构化数据的模型抽取方法,最后对该方法进行了实例说明。  相似文献   

14.
粗糙集理论是有效处理不精确、不确定和含糊信息的软计算工具,模糊聚类分析是依据客观事务间的特征、亲疏程度和相似性,通过建立模糊相似关系对客观事务进行分类的方法.网站日志数据通常是大量的,冗余的,日志中的页面之间的关系也是模糊的,不确定的.该文利用粗糙集理论和模糊聚类的方法对某学校网站的日志数据进行实例分析,抽取用户感兴趣的模式,理解用户的浏览兴趣行为,以便进一步改善网站结构,为用户提供个性化服务.  相似文献   

15.
构建了WEB日志挖掘技术在远程开放教育网站和网上教育平台建设中的应用模式,通过WEB日志挖掘可以掌握学习者个性化学习的特点和要求,从而为建设适合的现代远程教育网站和在线教育平台提供WEB页面结构设计、资源建设、教学互动等方面的依据。  相似文献   

16.
针对Web上数据的特点,指出了采用XML技术进行网络数据挖掘的优势.  相似文献   

17.
以web挖掘和网页信息聚类为基础,来构建智能化电子商务站点;从而在商务活动中根据访问用户的访问特征和习惯,发现其中蕴含的知识,提取出用户的兴趣爱好,从而开发用户喜好的界面,掌握商务活动先机.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号