共查询到20条相似文献,搜索用时 156 毫秒
1.
2.
Web日志挖掘数据预处理方法研究
总被引:1,自引:0,他引:1
柳胜国 《现代图书情报技术》2004,20(12):55-57
Web日志挖掘技术是Web数据挖掘中最重要的应用。通过对挖掘服务器日志文件的分析和研究,可以对网站的组织结构及其性能进行改进,增加个性化服务,发现潜在的读者群体。数据预处理关系到Web日志挖掘的质量。数据预处理包括数据清理、识别用户、识别用户会话、格式化,目的是分割服务器日志为多个独一无二的用户的一次访问序列,并给予了算法实现。 相似文献
3.
基于高校图书馆Web日志挖掘的分析与研究 总被引:1,自引:0,他引:1
以长江大学图书馆主页服务器Web日志文件为例,介绍了Web日志分析流程、Web日志格式,分析了Web日志挖掘的数据预处理过程,最后给出了应用实例。 相似文献
4.
图书馆服务流程与用户满意之间存在着直接的联系。如果服务流程存在不足,将引发用户的不满意。传统的图书馆用户满意分析,多是采用调查的方式,未能充分挖掘利用图书馆服务流程日志。流程挖掘是对事件日志的挖掘,其典型应用场景可以用于流程分析与诊断,进而在流程分析的基础上实现对图书馆用户满意的分析。在构建基于流程挖掘的用户满意分析模型之后,还对该模型实现的三个核心环节进行了研究:生成事件日志、选择挖掘算法、分析用户满意,并给了一个所提方法的简单示例。 相似文献
5.
基于SQL Server 2005的Web日志挖掘系统构建 总被引:6,自引:0,他引:6
分析Web日志挖掘在图书馆中的应用,提出一种利用SQL Server 2005数据挖掘平台构建日志挖掘系统的方法,详细介绍系统主要组件的功能和实现方法,并给出相应的系统框架设计图,最后论述此设计的优点。 相似文献
6.
基于XML的Web日志挖掘研究* 总被引:2,自引:0,他引:2
潘有能 《现代图书情报技术》2006,1(5):62-64
设计一个基于XML的Web日志挖掘体系结构,简要介绍XGMML和LOGML,并在此基础上讨论LOGML文档的生成方法及利用Apriori算法对日志文档进行频繁集、频繁序列和频繁子图挖掘。 相似文献
7.
数字图书馆网站服务系统中存有大量有关用户访问信息的日志文件,通过对这些日志文件的挖掘可以得到有关数字图书馆资源利用情况和用户兴趣的信息。但实际上,这些日志文件很少被利用。针对这一现状,作者对日志文件进行挖掘试验分析,得出用户的频繁下载集合,以用于推荐链接和评价数据库资源。 相似文献
8.
9.
基于马尔可夫转移矩阵的多步过程挖掘方法 总被引:1,自引:0,他引:1
针对目前过程挖掘算法对过程日志要求较高,且挖掘结果只能用特定形式化描述模型进行表示,提出一种基于马尔可夫转移矩阵的多步过程挖掘方法。首先基于日志构建马尔可夫转移矩阵,其次定义关系挖掘规则分析过程中的逻辑关系,接着设计过程挖掘算法建立活动间的结构关系,而后给出一种形式化表示算法将挖掘结果表示成有向网络图,最后通过仿真验证方法的可行性。 相似文献
10.
岳修志 《现代图书情报技术》2005,21(2):81-83
按照标准的服务器日志格式,对图书馆Web服务器日志文件的记录进行分析,并通过对其一定时间段的数据挖掘,对图书馆网站的使用状况进行了有益的探讨。 相似文献
11.
12.
朱志国 《中国科技资源导刊 (中国信息导报)》2011,(3):62-67
Web 用户访问模式挖掘技术可以从服务器、浏览器端的日志记录中自动发现用户的访问偏好、兴趣和趋势等
信息,目前已经成为web 挖掘领域的一个研究热点。文章首先给出Web 访问模式挖掘系统的一般框架模型,然后介绍了
框架模型中主要组成部分的工作原理,在此基础上,对Web 访问模式挖掘系统中的一些关键技术的最新研究进展状况作
了阐述和分析,其中包括数据采集、数据预处理、模式发现、用户可视化界面等,最后分析了未来该领域的研究重点作
了展望。 相似文献
13.
14.
15.
Web数据挖掘对Web数据检索的支持作用 总被引:3,自引:0,他引:3
本文在对Web数据检索和Web数据挖掘的技术特性进行简要介绍的基础上 ,阐述了二者之间的主要区别 ,并着重对Web数据挖掘对Web数据检索构成的支持作用进行了具体分析。这些支持作用体现在 :自动分类 ,揭示知识特征 ,群集处理 ,超链结构挖掘和用户知识模型挖掘。 相似文献
16.
指出Web挖掘是从数据挖掘发展而来,是集合Web技术、数据挖掘、信息科学等多领域为一体的一项综合技术;介绍Web挖掘的概念、分类以及Web页面之间链接结构挖掘的HITS与Page-rank等算法;提出基于样本模式特征提取的信息检索方法。最后,分析Web链接挖掘面临的问题和未来研究的发展趋势。 相似文献
17.
基于领域本体实现Web文本挖掘研究 总被引:1,自引:0,他引:1
18.
北京大学图书馆的主页日志分析 总被引:2,自引:0,他引:2
张学宏 《现代图书情报技术》2005,21(5):81-83
从分析主页服务器日志的重要性出发,论述了日志分析在图书馆中进行用户分析、主页设计和获得用户反馈等方面的实际价值,并介绍了一次主页日志的分析过程,同时指出了利用日志分析的局限性。 相似文献
19.
对影响Web使用挖掘效果的会话识别方法进行理论研究,将会话识别按照对用户行为的不同假设分为基于时间的、基于导航的和基于语义的三种启发式方法,并对每种方法又进行细分研究,对会话识别理论方法进行综述,讨论这三种方法的各自优点和存在的问题。在对会话识别的方法进行综合比较的基础上,指出会话识别方法研究的两个趋势,一个是表示Web日志访问请求所代表的语义,一个是分析用户行为。 相似文献
20.
基于Web挖掘技术的信息检索系统设计与实现 总被引:2,自引:0,他引:2
本文详细介绍一个基于Web文本挖掘技术的信息检索系统的设计与实现。基于Web文本挖掘技术的信息检索技术融合了文本挖掘的思想,它将单一的资源发现或者单一的信息提取的传统的信息检索方法结合起来,从而达到在WWW发现资源并将其中的信息提取出来进行处理的目的。 相似文献