首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 62 毫秒
1.
关联规则挖掘是数据挖掘研究领域中的一个重要任务,旨在挖掘事务数据库中有趣的关联。Apriori算法是关联规则挖掘中的经典算法。然而Apriori算法存在着产生候选项目集效率低和频繁扫描数据等缺点。提出了一种新的Apriori的改进算法,该算法在生成k(k>1)项频繁集时,不需要重新扫描数据库,只是在生成1项频集时,才需要扫描事务数据库,有效地减少了对事务数据库的读操作,在时间复杂度上较经典的Apriori算法有更加优越的性能。  相似文献   

2.
提出了一种新的Apriori改进算法,该算法在生成k项频繁集时,不需要多次扫描数据库,有效地减少了对事务数据库的读操作,较经典的Apriori算法有更加优越的性能。  相似文献   

3.
针对Apriori算法多次扫描事务数据库且产生庞大的候选集性能瓶颈,本文提出了Apriori算法的优化算法。该算法利用频繁项集产生时需要自身连接的特征,在连接前对频繁项集依据支持度由小到大进行排序,从而优化连接策略,并将其运用到描述事务数据库的布尔矩阵中。经实验证明,该算法随着事务数据库规模的扩大,较Apriori算法有明显的优越性。  相似文献   

4.
针对Apriori算法的若干不足,如需要多次连接数据库,多次扫描事务记录,在剪枝步骤比对次数过多等缺点,文章实现了把数据库映射到十字链表的方法,并且与传统Apriori算法进行了对比,实验表明十字链表的方法可以大幅度减少数据挖掘所需时间,可明显减少连接及扫描数据库次数,减少剪枝步骤对比次数,提升算法执行效率.  相似文献   

5.
针对经典的Apriori算法需要多次扫描数据库,不适合大规模数据这个问题,提出了一种改进的Apriori算法.该算法采用布尔向量关系运算思想,将事务数据库扫描后转化成压缩矩阵,在MapReduce框架下将压缩矩阵进行分块,每块分别被做并列式处理.利用分压缩矩阵快速计算所有的候选项集,从中产生频繁K-项集,降低了Apriori算法的时间复杂度.  相似文献   

6.
Apriori算法是一种有效的关联规则挖掘算法,Apriori算法使用一种称作逐层搜索的迭代方法得到频繁项集,但是它产生大量的候选项集,还需要多次扫描数据库,每次对数据库的重复扫描非常冗长,大量的时间消耗在内存与数据库中的数据交换上。因此笔者引入了一种不产生候选项集的频繁项集挖掘算法——FP-growth算法,并对FP-growth算法的相关性质、实现作以介绍。  相似文献   

7.
一种基于二进制编码的频繁项集查找算法   总被引:1,自引:0,他引:1  
在数据挖掘中频繁项集的查找时间是影响挖掘关联规则效率的关键因素,Apriori算法是用来找出频繁项集的典型算法,本文针对Apriori算法需反复扫描数据库、产生大量候选项集的不足,提出一种效率更高的基于二进制编码的频繁项集查找算法,该算法找出频繁项集只需一次数据库扫描,不产生候选项集,与Apriori算法相比,算法效率更高.  相似文献   

8.
介绍了关联规则挖掘的情况,并在分析Apriori算法的基础上,提出一个优化的Apriori算法,减少了扫描数据库的次数,从而提高了挖掘的效率。  相似文献   

9.
为明确中医治疗抑郁症用药规律,融合Apriori优化算法与Relim算法,采用数据挖掘技术进行分析。针对传统Apriori算法频繁扫描数据库从而生成大量候选项集的缺点,改变其原有剪枝方式以减少扫描次数。将改进后的Apriori算法与无需产生候选项集的Relim算法就中医治疗抑郁症的方剂数据进行关联规则分析,并绘制两个算法时间效率图。结果发现,两种算法在挖掘药物频繁项集与关联规则的结果基本相同,通过分析发现,中医常以疏肝、理气、补肾、滋阴等药物为主治疗抑郁症。改进后的Apriori算法可降低数据库扫描次数,较传统Apriori算法运行效率有所提高,Relim算法在空间利用率和时间执行率上均略优于改进后的Apriori算法。两种算法挖掘结果体现出中医治疗抑郁症注重疏肝理气、补肾滋阴、调理气血等特点。基于关联规则的方法可作为中医用药规律分析的重要工具。  相似文献   

10.
本文将Apriori算法应用于计算机免疫系统中提取规则,并详细地给出了Apriori算法,同时由于Apriori算法需要频繁扫描数据库,运行效率比较低,从而提出了Apriori算法的三种改进策略:优化连接策略,数据划分策略和减少交易数据策略。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号