首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 171 毫秒
1.
关联规则挖掘是数据挖掘研究领域中的一个重要任务,旨在挖掘事务数据库中有趣的关联。Apriori算法是关联规则挖掘中的经典算法。然而Apriori算法存在着产生候选项目集效率低和频繁扫描数据等缺点。提出了一种新的Apriori的改进算法,该算法在生成k(k>1)项频繁集时,不需要重新扫描数据库,只是在生成1项频集时,才需要扫描事务数据库,有效地减少了对事务数据库的读操作,在时间复杂度上较经典的Apriori算法有更加优越的性能。  相似文献   

2.
一种基于二进制编码的频繁项集查找算法   总被引:1,自引:0,他引:1  
在数据挖掘中频繁项集的查找时间是影响挖掘关联规则效率的关键因素,Apriori算法是用来找出频繁项集的典型算法,本文针对Apriori算法需反复扫描数据库、产生大量候选项集的不足,提出一种效率更高的基于二进制编码的频繁项集查找算法,该算法找出频繁项集只需一次数据库扫描,不产生候选项集,与Apriori算法相比,算法效率更高.  相似文献   

3.
Apriori算法是一种有效的关联规则挖掘算法,Apriori算法使用一种称作逐层搜索的迭代方法得到频繁项集,但是它产生大量的候选项集,还需要多次扫描数据库,每次对数据库的重复扫描非常冗长,大量的时间消耗在内存与数据库中的数据交换上。因此笔者引入了一种不产生候选项集的频繁项集挖掘算法——FP-growth算法,并对FP-growth算法的相关性质、实现作以介绍。  相似文献   

4.
Apriori算法是一种挖掘布尔型关联规则的典型算法。该算法在生成频繁项集时会有频繁的数据库扫描操作,并且在由低维频繁项集连接生成高维候选项集时,如果频繁项集维数过大,笛卡尔积后就会产生大量的候选项集,从而影响算法的效率。针对上述2个方面对Apriori算法进行改进,并将改进后的算法应用在试卷分析系统中。经过系统测试,改进后的算法具有较高的效率和较强的稳定性。  相似文献   

5.
关联规则可在大量数据中找出事务的隐藏联系,其中,Apriori算法是关联规则分析中较为有效的方法。然而,经典Apriori算法需频繁扫描数据库和事务集,使在生成频繁项集的过程中产生大量候选项集。针对该问题,利用事务集对应权重和初始数据库映射形成的布尔矩阵,在经典Apriori算法的基础上,提出一种改进算法。数值算例结果表明,改进后的算法能较为明显地减少计算时间,从而提升经典Apriori算法效率。  相似文献   

6.
关联规则可在庞大的数据集中找出不同事务之间隐藏的关系,其中Apriori算法是关联规则分析中较为有效的办法。然而,Apriori算法产生候选项集的效率较低且扫描数据过于频繁,造成算法计算需要耗费较长时间。另外,初始定义的最小支持度与最小置信度也不足以过滤无用的关联规则。针对以上问题,利用概率理论与有效的参数设置,在原有Apriori算法基础上,提出一种基于概率事务压缩的关联规则改进算法。数值算例结果表明,新算法可在第二次迭代之后,大幅减少低效候选项集,从而提升经典Apriori算法效率。  相似文献   

7.
关联规则挖掘通过发现密切相关项集的方法已经在商业决策中被广泛使用.现针对关联规则挖掘的经典算法Apriori需要重复多次扫描整个数据库导致在空间和时间方面有很大负载的问题,提出了根据研究者所感兴趣的项集作为关联规则的结果,采用对数据库进行类标签压缩来减少迭代次数.通过实验显示该方法可以有效提高Apriori算法的效率.  相似文献   

8.
关联规则挖掘是一种最有影响的数据挖掘技术。它在交易数据库或其他数据仓库项目集之中提取有意义的关联,频繁模式和关联。大多数现有的算法发现频繁模式都需要多次遍历数据库,导致大量的磁盘读取,造成了巨大的I/O负载。为了减少重复读盘,本文提出了一种新的自上而下的方法,即Apriori算法的改进版本,此算法大大降低了数据库的扫描次数,避免生成不必要的模式而减少了数据库的扫描,节省了大量的时间和空间。  相似文献   

9.
本文主要研究了数据挖掘中关联规则挖掘算法的改进方法,通过分析经典的Apriori算法,找出算法的不足.提出了一种基于矩阵行向量运算的频繁集挖掘的关联规则挖掘算法思想,并对Apriori算法进行了改进。  相似文献   

10.
介绍了关联规则挖掘的情况,并在分析Apriori算法的基础上,提出一个优化的Apriori算法,减少了扫描数据库的次数,从而提高了挖掘的效率。  相似文献   

11.
关联规则挖掘用于发现大量数据中项集之间有趣的关联或相关联系,在关联规则挖掘过程中,频繁项集的产生是最重要的步骤。本文提出一种新的频繁项集生成算法,基于项分组的思想,利用矩阵来存储各项的频率信息.只需扫描数据库一次。由于对项进行了分组,充分利用了各个事务的重复信息,因此在项数很多时算法效率仍然较高,实践证明,这是一个高效的频繁项集生成算法。  相似文献   

12.
关联规则挖掘的一种改进算法   总被引:1,自引:0,他引:1  
关联规则的提取是数据挖掘中的重要研究课题,文章对关联规则提取中的Apriori算法进行了深入研究,指出了该算法的某些不足,提出了一种改进算法.  相似文献   

13.
基于项目增长法高效求解最大频繁项集   总被引:1,自引:0,他引:1  
针对Apriori算法存在的问题提出了一种改进方法.本算法只需对数据库一次扫描,即可得到所有频繁项集;增强了产生候选项的针对性和有效性;提高了候选项的支持事务计数的效率;在求解最大频繁项集时,由于求解过程中无需用到大量的中间结果,节省了内存空间;通过比较分析,本方法提高了挖掘效率和性能.  相似文献   

14.
针对Apriori算法寻找频繁项集问题,提出了一种基于有向图的频繁集挖掘算法DGFM,该算法将事务数据库表示成二进制矩阵,利用有向图的思想,将频繁项的二进制位串作为有向图的权值,再将二进制矩阵用邻接表存储,通过搜索邻接表来生成频繁项集,最后试验证明该方法比Apriori算法具有更高的效率和性能.  相似文献   

15.
提出基于云计算平台(以Hadoop为例)应用布尔矩阵Apriori算法进行大数据关联规则挖掘的MR_B_Apriori算法。将Hadoop平台与布尔矩阵Apriori算法相结合,利用MapReduce框架分块处理布尔矩阵,计算出分块数据的频度,合并融合得到大数据集的频繁项集。分析表明MR_B_Apriori算法能够适用于大数据的频繁项集挖掘。  相似文献   

16.
结合遗传算法全局优化的特点,本文提出了采用遗传算法与Apriori方法结合的改进算法,并将其应用于关联规则挖掘过程。改进算法具备较好的全局优化的特性,特别是在深度挖掘和小关联度挖掘的方面,较传统算法的效率有所提高。  相似文献   

17.
发现最大频繁项目集在关联规则挖掘中有着重要意义。通过已发现的最大频繁项目集,可容易地发现频繁项目集。提出了一种基于事务树(T-tree)的最大频繁项目集挖掘算法MFIA(Maximum Frequent Itemsets Algorithm),其挖掘过程中只需对数据库扫描一次,从而提高了最大频繁项目集的挖掘效率。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号