首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 46 毫秒
1.
一种改进的Apriori算法在web日志挖掘中的应用   总被引:1,自引:0,他引:1  
在对web日志挖掘的处理流程以及难点深入分析的基础上,为了达到更快挖掘频繁访问页面组的目标,提出一种改进的Apriori算法,主要通过减少候选项集和对事务数据库的压缩来实现性能的提高.候选项集的减少是通过对频繁项集的缩减间接来实现,事务数据库的压缩则通过一系列预先定义的规则来实现.实验数据表明,无论对于短事务集,还是长事务集,算法的性能都得到了提升,更好地满足了实际应用的需要.  相似文献   

2.
互联网的广泛应用使Web数据挖掘成为当前数据挖掘研究的热点,而Web数据的结构却使对其所进行的数据控制十分复杂,XML的出现为Web数据挖掘技术提供了一个很好的入口。本文分析了XML文档的数据结构,提出一种经由HTML文档转换成XHTML并最终由XSL所决定的XML文档的Web数据挖掘模式。  相似文献   

3.
XML是扩展性标记语言,它定义了描述数据、交换数据的标准。UML是一种得到广泛应用的标准建模语言,是构建XML文档词汇表的关键和基础。本文首先简要介绍了利用UML关联关系的建模方法,然后通过样例详细阐述了UML关联关系到XML文档的映射。  相似文献   

4.
web挖掘技术是指从大量的web数据中提取隐含的、先前未知的、有潜在应用价值的模式、规则和知识,它是在数字图书馆中应用广泛的新技术。以XML为基础的新一代Web环境是直接面对Web数据的,不仅可以4良好地兼容原有的Web的应用,而又可以更好地实现Web中的信息共享与交换。本文介绍了基于XML的web挖掘技术的特点、方法及在数字图书馆中的应用。  相似文献   

5.
XML是基于Internet上一种新的数据管理手段,以其为基础的新一代WWW环境直接面对Web数据。XML在基于Web的数据挖掘中扮演着重要的角色,本文探讨了XML在Web的数据挖掘研究中进行数据抽取与转换所起作用。  相似文献   

6.
关联规则是数据挖掘领域的一个重要分支。随着大量数据的收集和存储,人们对于从数据库中挖掘关联规则越来越感兴趣,Apriori算法就是经典的关联挖掘算法。文章分析了Apriori的算法思想、算法描述及实际应用。  相似文献   

7.
Web挖掘是数据挖掘技术与数据库技术、Web相结合的产物;介绍了Web挖掘的概念、分类、内容挖掘、Web挖掘的不足,论述XML在Web中的应用;利用XML存储数据的模型,在Web挖掘中提出了基于Web内容挖掘的系统模型.  相似文献   

8.
Web挖掘是数据挖掘技术与数据库技术、Web相结合的产物;介绍了Web挖掘的概念、分类、内容挖掘、Web挖掘的不足,论述XML在Web中的应用;利用XML存储数据的模型,在Web挖掘中提出了基于Web内容挖掘的系统模型。  相似文献   

9.
XML已经成为表示结构化和半结构化数据的标准格式,XML中采用DTD和XML Schema模式来描述数据结构.结合XML Schema与面向对象的思想,提出了一种基于XML Schema建模的方法,并辅以实例.  相似文献   

10.
本文研究了论文“基于Apriori算法的水平加权关联规则挖掘”中的New-A-Apriori算法,指出了该算法的不足及错误之处,提出了一种挖掘加权频繁项集的算法MWFS。并通过具体实例说明了采用MWFS算法的挖掘过程。  相似文献   

11.
介绍了关联规则的基本概念,总结了关联规则的分类及各种挖掘算法,并对一些典型算法进行了介绍,最后展望了关联规则挖掘的下一步研究方向。  相似文献   

12.
随着数据挖掘技术的广泛使用,产生了信息安全和隐私保护的新问题。对当前分布式隐私保护关联规则挖掘的经典算法进行了改进,在不使用当前流行的多方安全计算(SMC)的条件下,用较简单的方法进行隐私保护关联规则挖掘,降低了运算量。同时,在分布式关联规则挖掘的同时,很好地保持了各个站点的数据和信息。  相似文献   

13.
在FDM算法的基础上,提出了一种改进的并行关联规则挖掘算法FDM_DT,此算法利用DHP算法中的Hash表技术改进了2阶侯选项集的生成过程,并采用Apriori Tid算法中的Tid表技术对事务数据库中的事务数进行有效消减。因此,此算法在处理大规模数据时有较高的综合效率。  相似文献   

14.
关联挖掘研究综述   总被引:1,自引:0,他引:1  
数据挖掘是一种重要的数据分析方法,旨在发现庞大的数据中隐藏着的、先前未知的并潜在有用的模式和信息,以帮助人们正确理解和认识数据,进行科学决策。关联挖掘是数据挖掘中研究最早也是最活跃的领域,其中,频繁模式挖掘是关联挖掘的核心和基础。对关联挖掘算法的研究和发展进行综述,分析挖掘算法面临的主要挑战,概括最新研究进展。  相似文献   

15.
将关联规则挖掘用于奖学金评测信息分析中,借助数据挖掘技术对奖学金信息进行深度挖掘,寻找与各个奖项相关联的因素.算法上,直接采用Apriori算法进行频繁项目集的发现.  相似文献   

16.
学生在学习过程中未达到学习目标,说明存在知识缺陷,如何智能性重构学习路径弥补知识缺陷是ICAI的关键技术I。CAI有其本身的规律及特点,利用数据挖掘算法,能较好提高ICAI的因材施教的能力。本文通过分析研究挖掘算法,提出在目标测评ICAI系统中挖掘算法的合理实现方法。  相似文献   

17.
在数据挖掘算法中,Apriori算法是关联规则的经典算法。文章在分析经典Apriori算法的基础上,提出了改进型的Apriori算法。改进后的算法对事务数据库进行两次压缩,减少事务数据库的平均长度,提高了数据挖掘的效率,具有一定的实用性。  相似文献   

18.
19.
针对关联规则挖掘中传统Apriori算法需要通过多次扫描数据库来发现频繁项集的问题,提出一种基于简单双矩阵的方法来实现频繁项集的发现.该方法仅需要扫描数据库一次,并充分利用项集的出现次数和是否出现逻辑值来获取频繁项集.实验表明,该方法比Apriori算法更高效.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号