首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 156 毫秒
1.
传统关联规则挖掘算法所讨论的只是一次事务内部的模式,但实际应用中随着时间的推移,事务之间会有某种联系或发展趋势,传统关联规则算法则无法揭示其中的规律。将在SPAM算法的基础上进行改进,加入通用时间约束,提出一个新算法——TSPAM算法。TSPAM算法采纳SPAM算法中的相关概念和方法,在SPAM算法的裁减部分和候选集的生成部分进行改进,对其加入时间约束。实验表明新算法对挖掘具有时间特征的序列模式是行之有效的。  相似文献   

2.
关联规则挖掘是数据挖掘领域中的一个非常重要的研究内容,其主要目标就是发现数据库中一组对象之间某种关联。频繁项集挖掘是关联规则挖掘的关键步骤,它在很大程度上决定了关联规则挖掘的效率。介绍了Apriori算法及其算法改进。该改进算法对剪枝步进行了优化,提高了连接效率,并且不断减小数据库的规模,去掉无效事务,减少了每次扫描数据库所花费的时间,提高了算法效率。经过试验论证,性能比原有算法提高,具有一定的实用性。  相似文献   

3.
关联规则挖掘是数据挖掘研究领域中的一个重要任务,旨在挖掘事务数据库中有趣的关联。Apriori算法是关联规则挖掘中的经典算法。然而Apriori算法存在着产生候选项目集效率低和频繁扫描数据等缺点。提出了一种新的Apriori的改进算法,该算法在生成k(k>1)项频繁集时,不需要重新扫描数据库,只是在生成1项频集时,才需要扫描事务数据库,有效地减少了对事务数据库的读操作,在时间复杂度上较经典的Apriori算法有更加优越的性能。  相似文献   

4.
关联规则的挖掘分为两步,首先找出满足最小支持度要求的频繁项目集,然后根据频繁项目集生成满足最小置信度要求的关联规则集.目前对关联规则挖掘的研究主要集中在频繁项集的生成上,然而,作为整个关联规则挖掘的一部分,由频繁项集生成关联规则的算法也有待进一步研究和改进.本文首先对传统的集合操作进行了扩展,然后在扩展集合操作的基础上,提出了由已挖掘出的最大频繁项集生成关联规则的算法ARD-ES,并对算法的复杂度作了理论和实验上的分析.实验表明,ARD-ES算法随着事务数据库容量的增大,时间占用的攀升基本上是线性的,空间占用在某一定值上下波动.  相似文献   

5.
关联规则是数据挖掘中一个非常重要的任务,有许多针对于关联规则的挖掘算法,然而需要提高算法的有效性来处理现实世界中的数据集。基于聚类的关联规则挖掘算法法通过扫描数据库创建聚类表,将收集的事务记录放入聚类表中,通过局部聚类表的约束来产生频繁项集,不仅可以剪枝候选项集,降低数据扫描的时间,而且确保挖掘结果集的正确性。实验结果表明,基于聚类的关联规则挖掘算法比Apfiori算法有更高的执行效率。  相似文献   

6.
通过研究已有的Apriori改进算法,本文对事务数据库进行了改造,在此基础上给出了事务粒的定义,从粒的角度阐述了事务与项集之间的关系.通过约定事务粒之间合成规则,本文设计了基于事务粒的Apriori改进算法,从而将粒计算理论有效地应用于关联规则的挖掘中.  相似文献   

7.
关联规则挖掘向来是数据挖掘的一个重要领域,挖掘算法也层出不穷。本文在深入分析FP树特性的基础上,改进了FP树的构造过程,通过一次扫描事务数据库即可生成FP树。从而缩短了关联规则挖掘时间,提高了效率,实验验证了其有效性。  相似文献   

8.
关联规则挖掘的核心问题是算法的效率和伸缩性,这就产生了基于约束的关联规则挖掘方法。关联规则挖掘中除了支持度和信任度外的约束外,最基本的是项目约束。本文总结和归纳了含有项目约束的关联规则挖掘的分类,并在算法Apriori的基础上,介绍了基于项目约束的关联规则的挖掘算法D irect。  相似文献   

9.
常浩 《太原大学学报》2013,14(2):127-130
数据挖掘是从事务数据库中抽取有用的知识和感兴趣的模式,而从事务数据库中发现关联规则是最常见的挖掘技术之一。提出一个遗传模糊关联规则挖掘框架和综合聚类、模糊和遗传概念的多最小支持度的遗传模糊关联规则挖掘算法。该算法从定量事务数据库中抽取合理的多最小支持度值、隶属函数和模糊关联规则,首先使用k—means聚类算法采集相似项目,然后初始化一个种群设定相同的支持度值,每一个染色体通过需求满足的标准和隶属函数的适应性来评估是否满足其适应度。  相似文献   

10.
介绍了关联规则挖掘的相关概念和算法,对就业事务数据进行了采集和预处理,使用Visual FoxPro开发了一个就业事务关系挖掘工具,并对学生就业各项事务进行了关联挖掘分析,找出它们之间客观存在的关系,为学校就业指导工作服务。  相似文献   

11.
介绍了数据挖掘中Web挖掘的相关理论,探讨了Web挖掘技术在电子政务中的各类应用,并基于Web使用挖掘技术设计了一个Web挖掘原型系统,给出了访问模式挖掘、关联规则挖掘和系统智能推荐的实现思路,在一定范围内解决了传统电子政务系统的弊病,以期对基于电子政务的数据挖掘起到积极的借鉴作用。  相似文献   

12.
为了解决传统关联规则挖掘中候选集数量过多,计算时间复杂度过高的问题,提出了基于语义相关性的关联规则挖掘方法.该方法采用本体概念之间的语义相关性描述领域中的复杂关系,通过语义相关度过滤掉领域中相关性较小的候选集,以减少关联规则挖掘中候选集的数量.计算语义相关性时,将本体层次关系看作有向无环图而不是层次树,不仅考虑直接层次关系,还考虑非直接层次关系和其他典型语义关系.实验结果表明,该方法能有效减少候选集数量,提高关联规则挖掘的效率.  相似文献   

13.
日志是计算机取证、入侵检测分析的重要数据来源,运用关联规则挖掘算法对日志进行分析是获取日志中所蕴含有用信息的重要方法,针对基于置信度-支持度框架的常用关联规则挖掘算法在日志分析中存在的不足,引入日志关键属性的概念,提出了基于关键属性约束的关联规则挖掘算法。实验结果表明,该算法能有效阻止无趣规则的产生,提高挖掘结果的有效性。  相似文献   

14.
关联规则是数据挖掘的重要研究内容之一,而传统的串行算法已不能满足数据库空前发展的需求.本文提出了关联规则的并行挖掘算法,探讨了相关的数据结构,并对算法进行了定性分析.  相似文献   

15.
在信息系统的范畴内,数据约束不同于业务流程和数据流程,数据约束是数据应遵循的语义限制,反映应用领域的信息规则,对数据约束的形式化表达是设计和管理数据库系统的基本任务.为了探讨数据约束的形式化表达问题,对条件函数依赖和传统函数依赖这两种数据约束表达方法作了比较研究.通过比较分析两者的表达能力、表达形式、对数据约束规律的揭示以及应用范围,指出了数据约束表达的三个层次.研究对数据库系统的设计与管理有理论参考价值.  相似文献   

16.
关联规则挖掘综述   总被引:3,自引:0,他引:3  
介绍了当前关联规则挖掘的研究情况,分析了传统关联规则挖掘算法的不足.与此同时,介绍了几种优化算法.最后,展望了关联规则挖掘的未来研究方向.  相似文献   

17.
将项目权值引入传统关联规则挖掘中是在项目属性上的扩展。本文分析项目权值对加权关联规则挖掘的影响,并对加权关联规则现有的算法进行总结,同时比较各算法的优缺点。最后对加权关联规则的未来研究发展方向进行探讨。  相似文献   

18.
对数据挖掘中的关联规则和序列模式的概念和作用进行了探讨,对关联规则中寻找大项集的部分应用程序加以实现,同时对两种模式的实现过程用程序流程的方式加以说明,并讨论了几种不同的实现算法。  相似文献   

19.
介绍了Web日志挖掘的模型,分析了使用关联规则挖掘Web日志时遇到的规则数量大且存在冗余等问题,提出了基于频繁闭项集的挖掘办法来减少规则数量.同时引入最小关联规则的概念,从而避免了冗余规则的产生.最后用实验验证了算法的有效性,并以周口师范学院校园网为例,对该网站日志数据进行分析,得到了有价值的规则,并对该网站提出了相应的建议和意见.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号