首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 31 毫秒
1.
Web日志挖掘与传统数据挖掘的区别在于数据源不同,Web日志挖掘的对象通常是服务器的日志信息,而传统数据挖掘的对象多为数据库。日志挖掘主要分为三个步骤:数据预处理、模式识别和模式分析。数据预处理这个环节是整个过程的基础和实施有效挖掘算法的前提,在Web日志挖掘中起着非常重要的作用。为此,本文深入探讨了数据预处理环节的主要任务,提出了一种新Web挖掘预处理方案。  相似文献   

2.
Web日志挖掘数据预处理技术的研究   总被引:1,自引:0,他引:1  
在Web数据挖掘研究领域中,数据预处理在Web日志挖掘过程中起着至关重要的作用,深入探讨了数据预处理环节的过程,并介绍一种由用户访问序列直接生成用户访问事务的算法.  相似文献   

3.
Web日志挖掘就是分析Web日志文件,从中发现用户的访问模式。数据预处理在Web日志挖掘中起着至关重要的作用,直接影响挖掘的质量和结果。详细介绍了数据预处理的主要过程,并给出了相应的对策。  相似文献   

4.
数字图书馆个性化服务与Web日志挖掘数据预处理技术   总被引:2,自引:0,他引:2  
柳胜国 《现代情报》2007,27(7):65-67
通过对挖掘服务器日志文件的分析和研究,可以对网站的组织结构及其性能进行改进,增加个性化服务,发现潜在的读者群体,建立数字图书馆个性化服务的用户模式。数据预处理关系到Web日志挖掘的质量。数据预处理包括数据清理、识别用户、识别用户会话、格式化,目的是分割服务器日志为多个独一无二的用户的一次访问序列。  相似文献   

5.
Web用户行为模式挖掘是在Web日志挖掘基础上的应用研究,是以网络日志为研究对象,从用户的访问记录中提取感兴趣内容的挖掘模式。E—Learning是指通过因特网或其它数字化内容进行的学习与教学活动。从Web用户行为模式挖掘方法及流程入手,对该方法进行了详细的阐述。将这些方法运用到E—Learning系统中,构建出一种基于Web用户访问模式挖掘的模型,实现从E-Learning系统的日志文件中挖掘出有用的数据,这些数据可为教育决策和教育教学优化提供信息和知识服务。  相似文献   

6.
基于Web文本挖掘的企业竞争情报获取方法研究   总被引:1,自引:0,他引:1  
本文从Web数据挖掘方法入手,介绍了企业竞争情报的获取方法,包括基于Web内容挖掘的获取方法、基于Web结构挖掘的获取方法和基于Web使用记录挖掘的获取方法,进而研究了基于web文本挖掘的竞争情报获取步骤,最后剖析了基于Web文本挖掘的企业竞争情报中客户知识获取的案例。  相似文献   

7.
王冰 《情报杂志》2007,26(3):58-60
Web搜索引擎是主要基于关键词匹配的检索技术,面对WWW新的应用模式,已不能很好地满足用户的需求。而Web数据挖掘系统是对Web文档集合和用户需求集合的匹配与选择,它通过Web内容挖掘、Web结构挖掘、Web用户使用记录挖掘等数据挖掘方法,从与WWW相关的资源和检索行为中抽取用户感兴趣的、有用的模式和隐含的信息,以满足情报检索的相关性和准确性的要求。因此,可运用相关搜索引擎和相关网站的设计方法,建立军事情报Web挖掘应用系统。  相似文献   

8.
研究利用Web日志文件来进行CRM数据挖掘是很有实际应用价值的,本文从这种实际需求出发,提出在数据预处理过程中使用启发式规则来识别用户,并介绍了一种基于IIS本身配置进行数据采集的方法。  相似文献   

9.
本文论述了Web用户访问模式挖掘中的数据预处理,主要提出了数据预处理中如何识别会话的一种改进算法。该方法通过使用三个因素来构造会话:①根据先验知识,确定会话时间阈值识别会话;②根据页面访问时间统计分布,确定相邻网页访问时间间隔阈值识别会话;③页面内容及站点结构确定页面重要程度识别会话。实验结果表明,相对于传统的单一方法进行会话识别的方法,该方法能够准确的识别会话,更为合理有效。  相似文献   

10.
Web日志挖掘是Web数据挖掘的重要分支,已成为研究人员关注的焦点。本文首先分析了Web日志的格式,再对Web日志挖掘过程中的数据预处理进行了深入的讨论,最后阐述了Web日志挖掘在网站建设上的应用。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号