首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 0 毫秒
1.
提出了一种新的Apriori改进算法,该算法在生成k项频繁集时,不需要多次扫描数据库,有效地减少了对事务数据库的读操作,较经典的Apriori算法有更加优越的性能。  相似文献   

2.
陈建辉 《宜春学院学报》2007,29(4):87-88,122
在对关联规则挖掘算法Apriori进行深入研究的基础上,提出了一种改进的算法SDA算法,在三个方面进行了改进:(1)频繁2-项集生成方法;(2)改进Apriori_gen算法(3)减少事务数据库.在实验数据集上所做的实验结果表明SDA算法是有效的.  相似文献   

3.
关联规则挖掘是数据挖掘研究领域中的一个重要任务,旨在挖掘事务数据库中有趣的关联。Apriori算法是关联规则挖掘中的经典算法。然而Apriori算法存在着产生候选项目集效率低和频繁扫描数据等缺点。提出了一种新的Apriori的改进算法,该算法在生成k(k>1)项频繁集时,不需要重新扫描数据库,只是在生成1项频集时,才需要扫描事务数据库,有效地减少了对事务数据库的读操作,在时间复杂度上较经典的Apriori算法有更加优越的性能。  相似文献   

4.
关联规则挖掘研究是数据挖掘研究的一项重要的内容.Apriori算法是挖掘关联规则的经典算法,但存在一些不足之处.本文在Apriori算法基础上,提出了基于链表数据结构的关联规则改进算法.由于该算法只需对交易数据库进行一次检索,故能大量减少所需的I/O次数,提高了系统的性能.  相似文献   

5.
为了探究互联网时代下学生的培优情况,通过问卷调查形式面向广大高校学子进行信息收集,基于Apriori算法对数据进行布尔关联规则频繁项集挖掘,并对传统Apriori算法进行改进.通过变换数据库的数据结构,使得整个算法对项目数据库只进行一次扫描操作;基于算法特有的定律特性,针对性地设计剪枝操作,减少项集连接时产生的大量冗余...  相似文献   

6.
挖掘频繁项集是近年数据挖掘任务中的关键问题,提高频繁项集的生成效率一直是数据挖掘领域研究的热点之一,研究人员从不同的角度对算法进行改进以提高算法的效率。文章通过集合的交集运算,得到一种新的频繁项集挖掘算法-SetFIS算法,该算法能快速、直观地求出事务数据库的频繁项集。  相似文献   

7.
挖掘频繁项集是近年数据挖掘任务中的关键问题,提高频繁项集的生成效率一直是数据挖掘领域研究的热点之一,研究人员从不同的角度对算法进行改进以提高算法的效率。文章通过集合的交集运算,得到一种新的频繁项集挖掘算法-SetFIS算法,该算法能快速、直观地求出事务数据库的频繁项集。  相似文献   

8.
关联规则挖掘是数据挖掘领域中的一个非常重要的研究内容,其主要目标就是发现数据库中一组对象之间某种关联。频繁项集挖掘是关联规则挖掘的关键步骤,它在很大程度上决定了关联规则挖掘的效率。介绍了Apriori算法及其算法改进。该改进算法对剪枝步进行了优化,提高了连接效率,并且不断减小数据库的规模,去掉无效事务,减少了每次扫描数据库所花费的时间,提高了算法效率。经过试验论证,性能比原有算法提高,具有一定的实用性。  相似文献   

9.
Apriori关联规则挖掘算法分析与改进   总被引:1,自引:0,他引:1  
对数据挖掘及关联规则挖掘的定义及相关概念作了简单的介绍,对基于关联规则的Apriori算法基本思想及其核心算法作了深入剖析,提出了该算法的瓶颈问题,并就此问题提出了改进思路,同时对改进的Apriori算法进行了评价.  相似文献   

10.
在关联规则挖掘中,Apriori和FP-tree是两种最基本的算法.文章讨论这两种算法的基本思想、数据挖掘步骤、优缺点并以具体的实例描述两种算法的实现过程.深入分析这两种算法为关联规则挖掘算法的扩展和改进奠定了基础.  相似文献   

11.
在数据挖掘算法中,Apriori算法是关联规则的经典算法。文章在分析经典Apriori算法的基础上,提出了改进型的Apriori算法。改进后的算法对事务数据库进行两次压缩,减少事务数据库的平均长度,提高了数据挖掘的效率,具有一定的实用性。  相似文献   

12.
针对Apriori算法多次扫描事务数据库且产生庞大的候选集性能瓶颈,本文提出了Apriori算法的优化算法。该算法利用频繁项集产生时需要自身连接的特征,在连接前对频繁项集依据支持度由小到大进行排序,从而优化连接策略,并将其运用到描述事务数据库的布尔矩阵中。经实验证明,该算法随着事务数据库规模的扩大,较Apriori算法有明显的优越性。  相似文献   

13.
提出了使用网格技术的关联规则数据挖掘及实施,并分析、比较了经典Apriori算法和分布式Apriori算法的实施结果。通过WEKA工具对预评估系统的效率评估,和中心数据库上的Apriori和先验Apriori算法性能分析。在网格环境下可以通过减少数据处理时间、资源优化、负载分担来提高计算网络的效率并减少成本,从而使用户得到计算量更大、成本更低、速度更快的计算结果。还介绍了基于网格环境的分布式Apriori关联规则算法,并解释了如何获取知识。  相似文献   

14.
将项目权值引入传统关联规则挖掘中是在项目属性上的扩展。本文分析项目权值对加权关联规则挖掘的影响,并对加权关联规则现有的算法进行总结,同时比较各算法的优缺点。最后对加权关联规则的未来研究发展方向进行探讨。  相似文献   

15.
Apriori关联算法在学生成绩中的应用   总被引:4,自引:1,他引:4  
介绍了数据挖掘中关联规则的概念及经典的Apriori算法,以及Apriori算法在学生成绩中的应用.  相似文献   

16.
潘磊 《教育技术导刊》2009,19(9):186-189
为提升电网系统日志故障诊断效率,在 Spark 环境下,基于并行 Apriori 算法构建分布式日志故障挖掘系统,针对电网系统相关设备后台日志数据,构建频繁项集并挖掘关联规则,形成系统故障规则库,用于系统故障诊断。系统对 50 万条真实日志数据进行检验。结果表明,该系统可有效发现相关故障日志。同时,该系统在 80G 内存、10 个虚拟节点的集群上以 50s 的速度完成了故障挖掘工作,准确率达 90%,同时提升了原单机系统效率,实现了预期效果。  相似文献   

17.
在挖掘关联规则的过程中,关键步骤是产生频繁项集.文中提出一种有效的频繁项集挖掘算法—FLMA.算法利用逻辑运算挖掘频繁项集,不产生候选项集,且只需扫描数据库一次,所以此算法是非常有效的.  相似文献   

18.
目前,已经提出了许多挖掘关联规则的算法及其变型,其中最著名的是Apriori算法,但传统的算法效率太低,为了解决这些问题,提出了一种快速更新的关联挖掘算法。  相似文献   

19.
戴娟  邱雁 《考试周刊》2011,(4):168-169
为了快速地从数据库中挖掘出频繁项集,本文中提出了一种将数据库中的频繁项集搜寻问题转化为用二分查找法去直接搜索构建的向量子空间中的向量问题。该算法不仅运算简单,只需扫描一次数据库,而且具有提高搜索速度等优点。  相似文献   

20.
针对关联规则挖掘中传统Apriori算法需要通过多次扫描数据库来发现频繁项集的问题,提出一种基于简单双矩阵的方法来实现频繁项集的发现.该方法仅需要扫描数据库一次,并充分利用项集的出现次数和是否出现逻辑值来获取频繁项集.实验表明,该方法比Apriori算法更高效.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号