首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 11 毫秒
1.
本论文将数据挖掘应用于图书馆网站Web日志记录,来获取用户访问网站的行为模式,帮助改善网站页面布局、改进为用户提供资源的方式,提高用户访问和使用资源的效率,介绍了用户行为模式挖掘的过程.  相似文献   

2.
本文探索了一种新的Web日志挖掘算法,以便更有效地捕获用户访问模式.该算法首先把原始的用户访问序列转换为一个最长前向访问序列的集合,在转换中过滤掉了用户的回退操作;算法的第二步是根据第一步所得到的结果求得一个用户频繁访问模式.算法经实验模拟测试具有较为满意的时间复杂度和空间复杂度.  相似文献   

3.
Web挖掘为电子商务的海量数据处理提供了强有力的技术手段.本文分析了Web挖掘的基本过程和方法,并重点探讨了基于用户访问行动的Web挖掘方法.以Web日志作为Web挖掘的数据源,提出了用户访问行动的关联矩阵表示方法,并建立了Web用户和页面聚类模型,为电子商务的客户管理、内容管理、个性化服务等提供了决策依据.  相似文献   

4.
Web日志挖掘是对用户与Web服务器在交互时产生的数据,采用数据挖掘技术发现隐含的规律性知识。首先对Web日志挖掘进行了概述,重点研究了关联规则算法中的Apriori算法,并对Apriori算法进行了改进,最后给出具体实例。  相似文献   

5.
随着www的广泛应用及相应的Web技术的出现,使数据挖掘的研究进入了一个新的阶段.关联规则挖掘是数据挖掘中的一个重要研究分支.本文提出了一种Web日志挖掘中频繁访问页组的加强算法.  相似文献   

6.
对电子商务网站的用户访问模式挖掘中数据预处理阶段所采用的技术做了全面的研究,主要包括源数据的采集方法以及数据清理、用户识别、会话识别、事务识别、会话子序列生成等所采用的技术。并给出了框架网页过滤、识别搜索引擎Robot产生的访问记录,以及生成用户会话语义序列的方法。  相似文献   

7.
发现用户对网站的兴趣是Web挖掘的一个重要研究方向.根据用户的访问序列进行聚类分析,把用户归为不同的簇,可以给不同簇的用户提供个性化的服务,改善网站的组织结构,提高广告的投放效果.  相似文献   

8.
介绍电子商务和Web数据挖掘的概念,并介绍Web使用挖掘中应用最多的技术——Web日志挖掘.重点阐述了日志挖掘算法——关联规则的有关知识,以及改进的频繁项目集生成算法Apriori和强关联规则生成算法,并结合实例进行了分析研究.  相似文献   

9.
Web挖掘的一个研究方向是发现用户对网页的兴趣.用户的浏览网页意味着用户对该网页上的某种概念感兴趣.文中提出基于隐马尔可夫模型,对用户访问网页的序列进行分析,发现用户感兴趣的概念,然后把蕴含用户感兴趣概念程度最大的网页推荐给用户.这种模式实质上是一种Web服务设计,给用户提供个性化的优质服务,提高网站的服务质量.  相似文献   

10.
在Web数据挖掘研究领域中,数据预处理在Web日志挖掘中起着至关重要的作用,在介绍了数据挖掘的概念、分类和结构体系的基础上,阐述了对网站大量Web日志数据进行预处理所采用的算法和处理过程,即先将已知IP地址与物理地址的对应关系保存在HashMap中,然后综合运用折半与顺序查找算法,可以显著减少查找次数,提高查询效率.  相似文献   

11.
互联网的广泛应用使Web数据挖掘成为当前数据挖掘研究的热点,而Web数据的结构却使对其所进行的数据控制十分复杂,XML的出现为Web数据挖掘技术提供了一个很好的入口。本文分析了XML文档的数据结构,提出一种经由HTML文档转换成XHTML并最终由XSL所决定的XML文档的Web数据挖掘模式。  相似文献   

12.
W eb日志的数据挖掘,可以发现用户访问页面的行为模式,改进W eb站点的性能和结构,提高查找信息的质量和效率.对W eb日志挖掘预处理的数据清洗、识别用户、识别用户会话和识别片断四个主要阶段所要完成的任务进行分析,论述了现有W eb日志预处理方法中的用户识别技术,提出了一种基于Cook ie技术和扩充日志属性的用户识别方法.  相似文献   

13.
介绍了Web日志挖掘的模型,分析了使用关联规则挖掘Web日志时遇到的规则数量大且存在冗余等问题,提出了基于频繁闭项集的挖掘办法来减少规则数量.同时引入最小关联规则的概念,从而避免了冗余规则的产生.最后用实验验证了算法的有效性,并以周口师范学院校园网为例,对该网站日志数据进行分析,得到了有价值的规则,并对该网站提出了相应的建议和意见.  相似文献   

14.
Web用户行为模式挖掘是在Web日志挖掘基础上的应用研究,是以网络日志为研究对象,从用户的访问记录中提取感兴趣内容的挖掘模式。E Learning是指通过因特网或其它数字化内容进行的学习与教学活动。从Web用户行为模式挖掘方法及流程入手,对该方法进行了详细的阐述。将这些方法运用到E Learning系统中,构建出一种基于Web用户访问模式挖掘的模型,实现从E Learning系统的日志文件中挖掘出有用的数据,这些数据可为教育决策和教育教学优化提供信息和知识服务。  相似文献   

15.
随着互联网的高速发展,Web挖掘由于其独特的优点,在电子商务的应用中扮演了越来越重要的角色。文章主要介绍了Web挖掘的概念和分类,论述了电子商务Web挖掘的过程和方法,最后阐述了Web挖掘在电子商务中的具体应用。  相似文献   

16.
在数据挖掘研究领域中,Web日志挖掘是Web使用挖掘的一个分支。它作为Web挖掘的一个重要组成部分,具有独特的理论和实践意义.通过介绍Web日志挖掘的概念,系统阐述了Web日志挖掘的全过程:数据收集、数据预处理、模式识别、实际应用.说明Web日志挖掘应用广泛,能够实现网站的优化问题.  相似文献   

17.
近年来,数据挖掘(Data Mining)引起了信息产业界的极大关注,其主要原因是通过数据挖掘可以将大量数据转换成有用的信息和知识。本文讨论在一个具体的电子商务网站环境下,Web挖掘模式对客户分类的支持作用。  相似文献   

18.
对基于Web日志的数据预处理过程做了相关研究,特别关注于用户识别和会话识别的启发式规则,对会话识别中基于时间的两条启发式方法进行了改进,形成新的基于时间的方法,并结合获取的数据予以验证,讨论分析了验证结果。新的方法提高了会话识别的准确性,为下一步的数据挖掘打下了基础。  相似文献   

19.
教育网站的Web数据挖掘   总被引:1,自引:0,他引:1  
将数据挖掘引入教育网站的建设中,以解决访问信息的有效获取问题,介绍了教育网站数据挖掘的意义,对数据挖掘的基本流程与结果进行了分析和探讨,提出了在站点中自动发现那些存储位置同用户期望的位置不同的Web页面的方法。  相似文献   

20.
提出了一种挖掘频繁项目集的有效算法——FFP-Growth,该算法采用自底向上的策略搜索频繁模式树,但不同于FP-Growth的是它无须生成条件模式基和频繁模式子树,且生成的频繁模式树较TD-FP-Growth生成的频繁模式树小,因而能提高关联规则的挖掘效率.类似于TD-FP-Growth的扩展TD-FP-Growth(M)和TD-FP-Growth(C),FFP-Growth很容易被扩展,以此来有效地减小搜索空间.实验结果表明本提出的算法是有效可行的.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号