共查询到20条相似文献,搜索用时 15 毫秒
1.
Web日志挖掘与传统数据挖掘的区别在于数据源不同,Web日志挖掘的对象通常是服务器的日志信息,而传统数据挖掘的对象多为数据库。日志挖掘主要分为三个步骤:数据预处理、模式识别和模式分析。数据预处理这个环节是整个过程的基础和实施有效挖掘算法的前提,在Web日志挖掘中起着非常重要的作用。为此,本文深入探讨了数据预处理环节的主要任务,提出了一种新Web挖掘预处理方案。 相似文献
2.
Web日志中包含了大量的用户浏览信息,如何有效地从中挖掘出用户浏览模式就尤为重要了。本文在分析现有用户浏览模式挖掘算法存在问题的基础上,根据Web日志的特点,对关联规则挖掘算法进行改进,提出了基于滑动窗口的浏览模式挖掘算法TBPM。并在此算法基础上设计了增量更新算法,对实际数据的实验结果验证了本算法的有效性。 相似文献
3.
4.
Web日志挖掘数据预处理技术的研究 总被引:1,自引:0,他引:1
在Web数据挖掘研究领域中,数据预处理在Web日志挖掘过程中起着至关重要的作用,深入探讨了数据预处理环节的过程,并介绍一种由用户访问序列直接生成用户访问事务的算法. 相似文献
5.
Web数据挖掘与高校数字图书馆个性化服务 总被引:2,自引:0,他引:2
针对高校数字图书馆个性化服务的实现,首先介绍Web数据挖掘和个性化服务的相关概念及特点,再详细叙述Web日志挖掘的相关算法及过程,最后指出Web数据挖掘是高校数字图书馆进行个性化服务的主要途径. 相似文献
6.
Web网络中存在海量文本,需要进行合理高效的文本抽取,实现Web文本数据挖掘。由于Web文本数据的高维特性,文本抽取过程中自动分类配对困难。提出一种基于RBF神经网络隐节点共振致密配对的Web数据文本抽取算法,进行Web数据文本特征采样与关联主特征挖掘,在每次移动中形成RBF隐节点共振致密配对,得到最优文本特征选择的路径,建立RBF神经网络分类器,实现基于蚁群算法的特征抽取算法改进。实验结果表明,该算法能有效实现对隐节点的共振致密配对,特征挖掘跟踪性能较好,保障了挖掘性能,系统所提取的特征分量与其他模糊分量差距较小,文本正确抽取召回率高于传统方法,在Web网络数据文本抽取中具有优越可靠的应用价值。 相似文献
7.
Web日志挖掘是Web数据挖掘的重要分支,已成为研究人员关注的焦点。本文首先分析了Web日志的格式,再对Web日志挖掘过程中的数据预处理进行了深入的讨论,最后阐述了Web日志挖掘在网站建设上的应用。 相似文献
8.
介绍了当前Web数据挖掘所采用的三种数据收集方法:Web日志挖掘,packet sniffer技术以及如何从应用服务器端收集数据。在分析Web日志挖掘不足的基础上对后面两种数据收集方法进行了研究,最后结合从服务器端收集数据的方法构建了一种基于用户会话的数据挖掘模型,为企业更好地理解客户行为提供相对可靠的依据。 相似文献
9.
介绍了当前Web数据挖掘所采用的三种数据收集方法:Web日志挖掘,packet sniffer技术以及如何从应用服务器端收集数据.在分析Web日志挖掘不足的基础上对后面两种数据收集方法进行了研究,最后结合从服务器端收集数据的方法构建了一种基于用户会话的数据挖掘模型,为企业更好地理解客户行为提供相对可靠的依据. 相似文献
10.
Web日志挖掘就是分析Web日志文件,从中发现用户的访问模式。数据预处理在Web日志挖掘中起着至关重要的作用,直接影响挖掘的质量和结果。详细介绍了数据预处理的主要过程,并给出了相应的对策。 相似文献
11.
针对FCM算法主要应用于点数据聚类,不能直接处理关系型数据的缺点。本文提出了一种基于Web日志的数据挖掘聚类算法,首先对FCM算法进行改进使其能够处理关系型数据,并对算法进行了健壮性改进。然后针对传统FCM算法需要在没有先验知识的基础上,事先确定聚类类别数的缺点,引入了竞争凝聚算法(CA),与FCM算法相结合,形成了CA-FCM算法,使之能够自动确定最佳分类类别数。实验表明,CA-FCM算法的挖掘结果与FCM算法的结果相近,在用户访问会话数量不太大时性能优于FCM算法。 相似文献
12.
本文针对web数据挖掘技术在个性化检索中的应用展开了研究。首先对于个性化检索中的工作流程进行了文字介绍和流程图的展示,然后详细的对于数据挖掘在个性化检索中的关键技术进行说明,最后对于Web日志挖掘的访问模式及其算法进行深入性的分析。 相似文献
13.
Web日志挖掘是Web数据挖掘的重要分支,已成为研究人员关注的焦点、本文对日志挖掘过程中的数据预处理和模式发现进行了深入的讨论.并总结了Web日志挖掘在网站建设和维护方面的应用, 相似文献
14.
WEB日志挖掘技术及其应用研究 总被引:2,自引:0,他引:2
Web日志挖掘是Web数据挖掘的重要分支,已成为研究人员关注的焦点。本文对日志挖掘过程中的数据预处理和模式发现进行了深入的讨论,并总结了Web日志挖掘在网站建设和维护方面的应用。 相似文献
15.
基于Web日志挖掘的网络动态竞争情报分析研究 总被引:1,自引:0,他引:1
通过挖掘蕴含在WebE1志中的隐含模式和知识,Web日志挖掘为企业实现网络竞争情报动态分析提供了一种有效的途径。文章分析Web日志挖掘的原理和过程,并探讨Web日志挖掘在动态竞争情报分析中的应用。 相似文献
16.
数字图书馆个性化服务与Web日志挖掘数据预处理技术 总被引:2,自引:0,他引:2
通过对挖掘服务器日志文件的分析和研究,可以对网站的组织结构及其性能进行改进,增加个性化服务,发现潜在的读者群体,建立数字图书馆个性化服务的用户模式。数据预处理关系到Web日志挖掘的质量。数据预处理包括数据清理、识别用户、识别用户会话、格式化,目的是分割服务器日志为多个独一无二的用户的一次访问序列。 相似文献
17.
提出一种基于自适应遗传模拟退火策略的Web日志关联规则挖掘算法。该算法在遗传模拟退火策略基础上,引入自适应的交叉概率和变异概率,使其具有较强的全局搜索能力,有效地避免了早熟的现象。实验结果证明,该算法能有效地解决Web日志关联规则挖掘问题。 相似文献
18.
Web用户行为模式挖掘是在Web日志挖掘基础上的应用研究,是以网络日志为研究对象,从用户的访问记录中提取感兴趣内容的挖掘模式。E—Learning是指通过因特网或其它数字化内容进行的学习与教学活动。从Web用户行为模式挖掘方法及流程入手,对该方法进行了详细的阐述。将这些方法运用到E—Learning系统中,构建出一种基于Web用户访问模式挖掘的模型,实现从E-Learning系统的日志文件中挖掘出有用的数据,这些数据可为教育决策和教育教学优化提供信息和知识服务。 相似文献
19.
提出了一种用于从Web日志中挖掘Web访问存取模式的新算法CSB(conditional sequence base mining algorithm).给出了CSB算法的主要思想和具体执行过程及相关算法. 相似文献