首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
提高最大频繁项目集挖掘算法的效率是关联规则挖掘研究一个重点领域.本文主要对影响最大频繁项目集挖掘效率的数据分布、搜索策略、支持度计算及剪枝策略等技术进行研究.  相似文献   

2.
增量式更新算法能充分利用已挖掘出的知识来提高挖掘效率,是数据挖掘高效算法研究中一个主要方向.本文首先分析了经典的关联规则增量式更新算法FUP(Fast Updating algorithm)算法的不足,提出了一种改进的关联规则增量式更新算法IIUA(Improved Incremental Updating Algorithm),极大地降低了存储空间和挖掘时间需求,从而提高了整个关联规则挖掘的效率.  相似文献   

3.
发现最大频繁项目集在关联规则挖掘中有着重要意义。通过已发现的最大频繁项目集,可容易地发现频繁项目集。提出了一种基于事务树(T-tree)的最大频繁项目集挖掘算法MFIA(Maximum Frequent Itemsets Algorithm),其挖掘过程中只需对数据库扫描一次,从而提高了最大频繁项目集的挖掘效率。  相似文献   

4.
提出了一种挖掘频繁项目集的有效算法——FFP-Growth,该算法采用自底向上的策略搜索频繁模式树,但不同于FP-Growth的是它无须生成条件模式基和频繁模式子树,且生成的频繁模式树较TD-FP-Growth生成的频繁模式树小,因而能提高关联规则的挖掘效率.类似于TD-FP-Growth的扩展TD-FP-Growth(M)和TD-FP-Growth(C),FFP-Growth很容易被扩展,以此来有效地减小搜索空间.实验结果表明本提出的算法是有效可行的.  相似文献   

5.
增量式更新算法能充分利用已挖掘出的知识来提高挖掘效率,是数据挖掘高效算法研究中一个主要方向.本文首先分析了经典的关联规则增量式更新算法FUP(Fast Updating algorithm)算法的不足,提出了一种改进的关联规则增量式更新算法IIUA(Improved Incremental Updating Algorithm),极大地降低了存储空间和挖掘时间需求,从而提高了整个关联规则挖掘的效率.  相似文献   

6.
挖掘最大频繁项目集是多种数据挖掘应用中的关键问题,其挖掘过程的高花费要求对高效更新算法进行深入研究。为此,我们在改进频繁模式树(FP-Tree)的基础上提出了处理最小支持度和数据库都发生变化时的最大频繁项目集更新算法FUMFIA(Fast Updating Maximal Frequent Itemsets Algorithm)。通过对实验结果的分析可以看出,该算法在进行更新挖掘时具有很好的时空效率。  相似文献   

7.
对Pincer—Search进行了改进,提出了一种新的发现最大频繁项目集的算法NDMFS。由于NDMFS算法采用了位阵存储技术和自底向上、自顶向下双向搜索策略,从而进一步提高了算法的效率,显著降低了系统的I/O成本和CPU时间。  相似文献   

8.
关联规则挖掘算法分析与比较   总被引:2,自引:0,他引:2  
由于数据挖掘的数据量巨大,导致关联规则挖掘中产生大量的频繁项目集。在分析经典的Apriori算法和AprioriTid算法的基础上,对Apriori和AprioriTid算法进行了分析与比较,探讨了在关系数据库环境下实现关联规则挖掘的方法。  相似文献   

9.
数据挖掘是目前数据库界广泛研究的课题,而频繁项集的挖掘是关联规则挖掘、序列模式挖掘、相关分析挖掘、聚类模式挖掘和回归模式挖掘等问题中的关键步骤.该文介绍了频繁项集挖掘算法的相关概念,对目前频繁项集挖掘典型算法进行了分析和比较,并作出了适当的评价.  相似文献   

10.
针对数据删除的关联规则的更新问题,提出了一种新的算法,该算法充分利用了保留下来的原数据库中所有项目的计数以及挖掘出来的最大频繁项目集及其计数,找出更新后的数据库中新增的频繁一项集和被删除的原频繁一项集,进而挖掘出更新后的关联规则。  相似文献   

11.
基于关联规则挖掘算法的研究现状,对几种经典的关联规则挖掘算法进行了重点介绍,如Apriori、FP-Growth、QDT等。通过对几种典型算法的步骤及主要思想进行详细阐述,提出了这几种算法的优缺点及目前研究面临的主要问题,为关联规则挖掘算法的优化研究提供了借鉴。  相似文献   

12.
对关联规则的挖掘算法进行了讨论,提出了一种基于集合枚举树的关联规则挖掘算法.由于该算法产生的侯选项目集为最小侯选项目集,不需要修剪,因而提高了算法的效率。  相似文献   

13.
为了解决频繁闭项目集挖掘中时间和存储开销大的问题,提出了一种基于FC-tree(频繁闭模式树)的频繁闭项目集挖掘算法max-FCIA(最大频繁闭项目集挖掘算法).该算法利用哈希表映射事务数据库,通过对哈希表进行操作从而得到所有频繁项目集的支持度,进而生成包含所有频繁项目的有序树.经过剪枝处理的有序树就是包含所有最小频繁闭项目集的FC-tree,最后用最小频繁闭项目集生成频繁闭项目集.实验结果表明,该算法通过映射事务数据库,减少了扫描数据库所浪费的时间,提高程序执行效率.另外,运用有效的剪枝策略,避免了不必要候选项目集的生成,节省了存储空间,实验证明该算法是有效的.  相似文献   

14.
Apriori算法是整个关联规则算法的基础.它必须对数据库进行重复性扫描.效率低,耗时巨大.针对关联规则的维护问题,提出利用已生成关联规则的挖掘结果进行更新的算法,仅需对数据库进行两次扫描,提高了关联规则的更新效率.  相似文献   

15.
基于项目增长法高效求解最大频繁项集   总被引:1,自引:0,他引:1  
针对Apriori算法存在的问题提出了一种改进方法.本算法只需对数据库一次扫描,即可得到所有频繁项集;增强了产生候选项的针对性和有效性;提高了候选项的支持事务计数的效率;在求解最大频繁项集时,由于求解过程中无需用到大量的中间结果,节省了内存空间;通过比较分析,本方法提高了挖掘效率和性能.  相似文献   

16.
对多维关联规则挖掘的理论及实现进行了详细的介绍,尤其对基于多维频繁项集的挖掘算法结合实例进行了详尽的阐述和实现。通过选用先进行立方体计算、后进行数据挖掘的OLAM模式,确定了数据挖掘的范围,然后再进行多维关联规则的挖掘。将交互式挖掘嵌入到联机分析系统中来。  相似文献   

17.
模糊关联规则的挖掘算法   总被引:2,自引:0,他引:2  
关联规则的挖掘是数据挖掘中的重要内容之一,关联规则包含了一组对象之间的特定关系.目前对关联规则的研究,仅限于用确定和精确的概念表示的确定关联规则.而现实生活中,数据之间的关系通常表现为模糊关系,用确定的关联规则不能表示数据之间的这种关系.为了拓广关联规则的表示和应用范围,本文讨论了模糊关联规则的概念,并提出了一种基于集合枚举树的模糊关联规则的挖掘算法FAAR.  相似文献   

18.
有效的挖掘频繁项集是挖掘最大频繁项集的关键步骤.为了克服Apriori算法在挖掘最大频繁项集上的不足,以及FP-Tree存储结构算法多次遍历的缺点,本文引进了新的矩阵技术,减少了FP-Tree遍历次数来挖掘频繁项集,提高了挖掘频繁项集和最大频繁项集效率.并以此提出基于FP-Tree的改进算法FPgrowth*和FPmax*.最后实验结果说明,矩阵技术的引进有效的提高了频繁项集和最大频繁项集挖掘效率.  相似文献   

19.
关联规则挖掘用于发现大量数据中项集之间有趣的关联或相关联系,在关联规则挖掘过程中,频繁项集的产生是最重要的步骤。本文提出一种新的频繁项集生成算法,基于项分组的思想,利用矩阵来存储各项的频率信息.只需扫描数据库一次。由于对项进行了分组,充分利用了各个事务的重复信息,因此在项数很多时算法效率仍然较高,实践证明,这是一个高效的频繁项集生成算法。  相似文献   

20.
频繁项目集挖掘是数据挖掘应用研究的一个重要研究内容.文章在FP-Growth算法的基础上,提出了一种基于集合的频繁项目集挖掘算法,该算法直接对FP-tree进行挖掘,不需要产生节点的条件模式基,因此在挖掘频繁模式集时节省了空间和时间,提高了算法的执行效率.最后对该算法进行了实例分析.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号