共查询到20条相似文献,搜索用时 0 毫秒
1.
提出了基于散列技术的关联规则挖掘算法的基本思想,只需扫描数据库一次.不产生候选项目集.也不使用逐层迭代的方法,利用散列文件组织的特性来提高挖掘效率. 相似文献
2.
李新良 《娄底职业技术学院学报》2007,5(3):54-58
目前,已经提出了许多挖掘关联规则的算法及其变型,其中最著名的是Apriori算法,但传统的算法效率太低,为了解决这些问题,提出了一种快速更新的关联挖掘算法。 相似文献
3.
Apriori关联规则挖掘算法分析与改进 总被引:1,自引:0,他引:1
刘宏强 《中国石油大学胜利学院学报》2009,23(1)
对数据挖掘及关联规则挖掘的定义及相关概念作了简单的介绍,对基于关联规则的Apriori算法基本思想及其核心算法作了深入剖析,提出了该算法的瓶颈问题,并就此问题提出了改进思路,同时对改进的Apriori算法进行了评价. 相似文献
4.
5.
潘雷 《南京晓庄学院学报》2005,21(5):71-76
Apriori算法是关联规则挖掘技术中的一个经典算法。笔者通过对该算法的思想和性能分析,认为它存在两方面的不足。本文提出了一种提高频繁项集挖掘算法效率的优化方法。实验表明,该优化算法对提高频繁项集挖掘算法的效率是有效的。 相似文献
6.
将项目权值引入传统关联规则挖掘中是在项目属性上的扩展。本文分析项目权值对加权关联规则挖掘的影响,并对加权关联规则现有的算法进行总结,同时比较各算法的优缺点。最后对加权关联规则的未来研究发展方向进行探讨。 相似文献
7.
为提高频繁项集的生成效率,提出一种基于概念格的频繁项集生成算法。首先将事务数据库映射为形式背景,利用概念格构建算法从形式背景中生成概念及其偏序关系,概念内涵表示项集,概念外延表示项集对应的支持度计数。根据概念的外延长度将所有概念划分到不同的层中,层的序号与概念外延长度相同,将层按照序号进行降序排列,从层序号大于等于最小支持度计数的概念中生成频繁项集。在两个人工数据集上的实验结果表明所提算法在时间性能上优于对比算法,最小支持度计数的值越小,所提算法的优势越明显。 相似文献
8.
Apriori算法是关联规则挖掘中的经典算法。通过对Apriori算法的基本思想和性能的研究分析,提出了一种基于垂直事务列表的树形结构的挖掘算法,减少了候选频繁项集的数量,提高了挖掘算法的效率。实验结果表明新算法具有良好的性能。 相似文献
9.
经过分析关联规则中Apriori算法存在的不足,为减少对事务数据库的扫描次数,缩减产生频繁项集的时间,列出两种基于哈希表的计算项集支持计数的方法以及利用哈希表来进行项集的地址定位的方法,使得生成频繁项集的效率有所提高。 相似文献
10.
刘晓玲 《济南职业学院学报》2007,(1):58-59
在挖掘关联规则的过程中,关键步骤是产生频繁项集.文中提出一种有效的频繁项集挖掘算法—FLMA.算法利用逻辑运算挖掘频繁项集,不产生候选项集,且只需扫描数据库一次,所以此算法是非常有效的. 相似文献
11.
对Apriori算法进行优化,提出了一种Z_Apriori算法。该算法在首次产生频繁项集时,扫描数据库并通过二进制编码串记录每个项目在事务里是否出现过,在每次进行计算迭代过程中无需再对数据库进行扫描,避免了对数据库的重复扫描,在系统性能和效率上较经典的Apriori算法有一定的改善。 相似文献
12.
关联规则挖掘算法分析与比较 总被引:2,自引:0,他引:2
由于数据挖掘的数据量巨大,导致关联规则挖掘中产生大量的频繁项目集。在分析经典的Apriori算法和AprioriTid算法的基础上,对Apriori和AprioriTid算法进行了分析与比较,探讨了在关系数据库环境下实现关联规则挖掘的方法。 相似文献
13.
Apriori算法是整个关联规则算法的基础.它必须对数据库进行重复性扫描.效率低,耗时巨大.针对关联规则的维护问题,提出利用已生成关联规则的挖掘结果进行更新的算法,仅需对数据库进行两次扫描,提高了关联规则的更新效率. 相似文献
14.
关联规则挖掘研究是数据挖掘研究的一项重要的内容.Apriori算法是挖掘关联规则的经典算法,但存在一些不足之处.本文在Apriori算法基础上,提出了基于链表数据结构的关联规则改进算法.由于该算法只需对交易数据库进行一次检索,故能大量减少所需的I/O次数,提高了系统的性能. 相似文献
15.
为了快速地从数据库中挖掘出频繁项集,本文中提出了一种将数据库中的频繁项集搜寻问题转化为用二分查找法去直接搜索构建的向量子空间中的向量问题。该算法不仅运算简单,只需扫描一次数据库,而且具有提高搜索速度等优点。 相似文献
16.
17.
基于关联规则挖掘算法的研究现状,对几种经典的关联规则挖掘算法进行了重点介绍,如Apriori、FP-Growth、QDT等。通过对几种典型算法的步骤及主要思想进行详细阐述,提出了这几种算法的优缺点及目前研究面临的主要问题,为关联规则挖掘算法的优化研究提供了借鉴。 相似文献
18.
关联规则的挖掘分为两步,首先找出满足最小支持度要求的频繁项目集,然后根据频繁项目集生成满足最小置信度要求的关联规则集.目前对关联规则挖掘的研究主要集中在频繁项集的生成上,然而,作为整个关联规则挖掘的一部分,由频繁项集生成关联规则的算法也有待进一步研究和改进.本文首先对传统的集合操作进行了扩展,然后在扩展集合操作的基础上,提出了由已挖掘出的最大频繁项集生成关联规则的算法ARD-ES,并对算法的复杂度作了理论和实验上的分析.实验表明,ARD-ES算法随着事务数据库容量的增大,时间占用的攀升基本上是线性的,空间占用在某一定值上下波动. 相似文献
19.
介绍了关联规则的基本概念,总结了关联规则的分类及各种挖掘算法,并对一些典型算法进行了介绍,最后展望了关联规则挖掘的下一步研究方向。 相似文献
20.
介绍了关联规则的基本概念,总结了关联规则的分类及各种挖掘算法,并对一些典型算法进行了介绍,最后,展望了关联规则挖掘的下一步研究方向。 相似文献