首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 56 毫秒
1.
本论文将数据挖掘应用于图书馆网站Web日志记录,来获取用户访问网站的行为模式,帮助改善网站页面布局、改进为用户提供资源的方式,提高用户访问和使用资源的效率,介绍了用户行为模式挖掘的过程.  相似文献   

2.
Web日志挖掘是Web挖掘中的一个重要分支。介绍了其研究背景和意义,阐述了Web日志挖掘的过程和常用的方法。在对其研究现状加以分析的基础上,提出了未来研究所面临的问题。  相似文献   

3.
对Web日志数据的预处理是Web日志挖掘的基础和关键。论文分析了Web日志挖掘处理的基本过程,分析讨论了Web日志挖掘中的数据预处理技术及其过程。  相似文献   

4.
本文探索了一种新的Web日志挖掘算法,以便更有效地捕获用户访问模式.该算法首先把原始的用户访问序列转换为一个最长前向访问序列的集合,在转换中过滤掉了用户的回退操作;算法的第二步是根据第一步所得到的结果求得一个用户频繁访问模式.算法经实验模拟测试具有较为满意的时间复杂度和空间复杂度.  相似文献   

5.
Web日志挖掘是利用数据挖掘技术挖掘和分析网络日志,并获取网站使用过程中的有价值的信息和模式的过程。预处理是Web日志挖掘的第一步,也是非常关键的一步,预处理的结果决定了挖掘的效率和质量。本文主要阐述了预处理的一般过程,并针对目前国内外常用的一些预处理技术进行了探讨和分析。  相似文献   

6.
在Web日志挖掘的基础上,构建挖掘系统模型,采用模糊聚类方法对采集的日志数据进行聚类,得到用户的访问模式,从而指导校园网网站管理人员改善Web站点结构,提高用户查找信息的准确率和效率。  相似文献   

7.
用户行为分析是改进搜索引擎的重要依据,为了更好地理解中文搜索用户的检索行为,在引入分词的基础上对搜狗搜索引擎在一个月内的真实查询日志进行了分析,对查询语言、查询长度、rank和网页深度与点击次数四个方面的用户行为进行分析。所得结论对改进中文搜索引擎的设计和更准确地评测检索效果都有较好的指导意义。  相似文献   

8.
介绍了Web日志挖掘的模型,分析了使用关联规则挖掘Web日志时遇到的规则数量大且存在冗余等问题,提出了基于频繁闭项集的挖掘办法来减少规则数量.同时引入最小关联规则的概念,从而避免了冗余规则的产生.最后用实验验证了算法的有效性,并以周口师范学院校园网为例,对该网站日志数据进行分析,得到了有价值的规则,并对该网站提出了相应的建议和意见.  相似文献   

9.
随着计算机网络技术的不断发展,远程教育教学系统越来越多地被应用到高校远程教育教学中,但当前的远程教学中,学员只是被动地接收远程教育网站中的知识。如何根据学员的访问信息,为学员提供个性化教学;如何通过学员的访问信息,改善网络的拓扑结构,更好地促进远程教育系统的功能的发挥,结合Web日志挖掘的基本功能,本文提出了基于Web日志挖掘改善远程教育教学系统,为学员提供个性化教学的基本模式。  相似文献   

10.
事务识别在Web日志挖掘步骤中至关重要,如果没有高效的识别算法,挖掘的效率将大打折扣。本文详细研究了事务识别的两种模型,介绍并改进了基于最大向前引用模型的识别方法MFP算法,同时对这两种方法进行了比较,结果表时,改进后的MFP算法具有更高的挖掘效率。  相似文献   

11.
在数据挖掘研究领域中,Web日志挖掘是Web使用挖掘的一个分支。它作为Web挖掘的一个重要组成部分,具有独特的理论和实践意义.通过介绍Web日志挖掘的概念,系统阐述了Web日志挖掘的全过程:数据收集、数据预处理、模式识别、实际应用.说明Web日志挖掘应用广泛,能够实现网站的优化问题.  相似文献   

12.
W eb日志的数据挖掘,可以发现用户访问页面的行为模式,改进W eb站点的性能和结构,提高查找信息的质量和效率.对W eb日志挖掘预处理的数据清洗、识别用户、识别用户会话和识别片断四个主要阶段所要完成的任务进行分析,论述了现有W eb日志预处理方法中的用户识别技术,提出了一种基于Cook ie技术和扩充日志属性的用户识别方法.  相似文献   

13.
如何在数量巨大的Internet中快速准确的搜索到符合要求的Web页是一个值得探讨的重要课题.构造了一种能够准确区分Web文本之间亲和力的挖掘模型,运用人工免疫算法使该模型具有较高的聚类精度和自发现能力.实验结果表明,该模型不仅能够有效的进行文本内容挖掘,保持较低的错误肯定率和错误否定率,还具有很强的自适应性和更新能力,进行适当的参数设置后检测周期也随之大幅缩短,提高了挖掘模型的效率.该模型的提出为Web挖掘领域提供了一种新的研究思路.  相似文献   

14.
基于URL路径的Web信息检索模型的研究   总被引:1,自引:0,他引:1  
Web的结构信息可以揭示许多蕴涵在Web内容之外的隐含的有用信息,如Web页面的URL可以反映页面的类型,也可以在一定程度上反映页面间在存储位置和内容方面的层次关系。详细介绍了一种基于URL路径的个性化Web智能信息检索模型以及实现方法。  相似文献   

15.
Web挖掘研究   总被引:3,自引:0,他引:3  
介绍了Web挖掘的任务和分类;讨论了Web的内容挖掘、结构挖掘和使用记录挖掘。  相似文献   

16.
对基于Web日志的数据预处理过程做了相关研究,特别关注于用户识别和会话识别的启发式规则,对会话识别中基于时间的两条启发式方法进行了改进,形成新的基于时间的方法,并结合获取的数据予以验证,讨论分析了验证结果。新的方法提高了会话识别的准确性,为下一步的数据挖掘打下了基础。  相似文献   

17.
基于结构挖掘和使用挖掘的Web挖掘算法研究   总被引:1,自引:0,他引:1  
Web挖掘是指使用数据挖掘技术从Web文档和服务中发现和提取信息和知识的技术。本文概述了Web数据挖掘的基本情况以及Web结构挖掘和Web使用挖掘的基本概念。结合对Web结构挖掘中的PageRank算法和Web使用挖掘的主要步骤和算法的研究后,本文提出了一种融合这两种Web挖掘算法的一种新的、综合的Web挖掘算法。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号