首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 93 毫秒
1.
本文在研究了多维关联规则数据挖掘的理论及方法的基础上,深入分析以往算法的优缺点并结合图书馆行业管理信息系统的特点,选择对Apriori算法结合数据立方体技术进行改进和优化,形成了适合利用多维关联规则对图书馆数据进行挖掘的新算法。  相似文献   

2.
关联规则挖掘是数据挖掘领域中的一个非常重要的研究内容,其主要目标就是发现数据库中一组对象之间某种关联。频繁项集挖掘是关联规则挖掘的关键步骤,它在很大程度上决定了关联规则挖掘的效率。介绍了Apriori算法及其算法改进。该改进算法对剪枝步进行了优化,提高了连接效率,并且不断减小数据库的规模,去掉无效事务,减少了每次扫描数据库所花费的时间,提高了算法效率。经过试验论证,性能比原有算法提高,具有一定的实用性。  相似文献   

3.
目前,已经提出了许多挖掘关联规则的算法及其变型,其中最著名的是Apriori算法,但传统的算法效率太低,为了解决这些问题,提出了一种快速更新的关联挖掘算法。  相似文献   

4.
介绍了关联规则挖掘的情况,并在分析Apriori算法的基础上,提出一个优化的Apriori算法,减少了扫描数据库的次数,从而提高了挖掘的效率。  相似文献   

5.
在数据挖掘算法中,Apriori算法是关联规则的经典算法。文章在分析经典Apriori算法的基础上,提出了改进型的Apriori算法。改进后的算法对事务数据库进行两次压缩,减少事务数据库的平均长度,提高了数据挖掘的效率,具有一定的实用性。  相似文献   

6.
Apriori关联规则挖掘算法分析与改进   总被引:1,自引:0,他引:1  
对数据挖掘及关联规则挖掘的定义及相关概念作了简单的介绍,对基于关联规则的Apriori算法基本思想及其核心算法作了深入剖析,提出了该算法的瓶颈问题,并就此问题提出了改进思路,同时对改进的Apriori算法进行了评价.  相似文献   

7.
Apriori算法是关联规则挖掘中的经典算法。通过对Apriori算法的基本思想和性能的研究分析,提出了一种基于垂直事务列表的树形结构的挖掘算法,减少了候选频繁项集的数量,提高了挖掘算法的效率。实验结果表明新算法具有良好的性能。  相似文献   

8.
分析了挖掘频繁访问模式的过程和当前Apriori算法的缺陷,提出了一种Apriori算法的改进算法:BLApriori算法.改进的算法采用不规则数组来保存项集信息,有效省去了扫描数据库所耗费的大量时间.将项集有序性引入到该数组上,减少了候选项集的个数.并采用二进制来表示1阶频繁访问模式,提高了模式匹配和连接的效率.试验结果表明,该改进算法能更有效地发现各种长度不同的访问模式.  相似文献   

9.
陈建辉 《宜春学院学报》2007,29(4):87-88,122
在对关联规则挖掘算法Apriori进行深入研究的基础上,提出了一种改进的算法SDA算法,在三个方面进行了改进:(1)频繁2-项集生成方法;(2)改进Apriori_gen算法(3)减少事务数据库.在实验数据集上所做的实验结果表明SDA算法是有效的.  相似文献   

10.
提出了一种新的Apriori改进算法,该算法在生成k项频繁集时,不需要多次扫描数据库,有效地减少了对事务数据库的读操作,较经典的Apriori算法有更加优越的性能。  相似文献   

11.
关联规则是数据挖掘领域的一个重要分支。随着大量数据的收集和存储,人们对于从数据库中挖掘关联规则越来越感兴趣,Apriori算法就是经典的关联挖掘算法。文章分析了Apriori的算法思想、算法描述及实际应用。  相似文献   

12.
潘磊 《教育技术导刊》2009,19(9):186-189
为提升电网系统日志故障诊断效率,在 Spark 环境下,基于并行 Apriori 算法构建分布式日志故障挖掘系统,针对电网系统相关设备后台日志数据,构建频繁项集并挖掘关联规则,形成系统故障规则库,用于系统故障诊断。系统对 50 万条真实日志数据进行检验。结果表明,该系统可有效发现相关故障日志。同时,该系统在 80G 内存、10 个虚拟节点的集群上以 50s 的速度完成了故障挖掘工作,准确率达 90%,同时提升了原单机系统效率,实现了预期效果。  相似文献   

13.
针对经典的Ap606算法耗费大量的时间和空间的特点,提出基于模式矩阵的关联规则算法。该算法扫描数据库次数为一次,降低了挖掘的时间复杂度;扫描后的数据库以矩阵形式存放,减少空间复杂度。并应用具体事例进行验证,对效率进行了比较。  相似文献   

14.
数据挖掘应用极大地推动了人们掌握、处理信息的能力,本文主要介绍了数据挖掘中的关联规则,关联规则中的经典算法Apriori算法,以及Apriori算法存在的不足,提出了Apfiori算法的改进研究,  相似文献   

15.
关联规则可在庞大的数据集中找出不同事务之间隐藏的关系,其中Apriori算法是关联规则分析中较为有效的办法。然而,Apriori算法产生候选项集的效率较低且扫描数据过于频繁,造成算法计算需要耗费较长时间。另外,初始定义的最小支持度与最小置信度也不足以过滤无用的关联规则。针对以上问题,利用概率理论与有效的参数设置,在原有Apriori算法基础上,提出一种基于概率事务压缩的关联规则改进算法。数值算例结果表明,新算法可在第二次迭代之后,大幅减少低效候选项集,从而提升经典Apriori算法效率。  相似文献   

16.
Apriori算法是关联规则挖掘技术中的一个经典算法。笔者通过对该算法的思想和性能分析,认为它存在两方面的不足。本文提出了一种提高频繁项集挖掘算法效率的优化方法。实验表明,该优化算法对提高频繁项集挖掘算法的效率是有效的。  相似文献   

17.
挖掘频繁项集是近年数据挖掘任务中的关键问题,提高频繁项集的生成效率一直是数据挖掘领域研究的热点之一,研究人员从不同的角度对算法进行改进以提高算法的效率。文章通过集合的交集运算,得到一种新的频繁项集挖掘算法-SetFIS算法,该算法能快速、直观地求出事务数据库的频繁项集。  相似文献   

18.
提出基于云计算平台(以Hadoop为例)应用布尔矩阵Apriori算法进行大数据关联规则挖掘的MR_B_Apriori算法。将Hadoop平台与布尔矩阵Apriori算法相结合,利用MapReduce框架分块处理布尔矩阵,计算出分块数据的频度,合并融合得到大数据集的频繁项集。分析表明MR_B_Apriori算法能够适用于大数据的频繁项集挖掘。  相似文献   

19.
挖掘频繁项集是近年数据挖掘任务中的关键问题,提高频繁项集的生成效率一直是数据挖掘领域研究的热点之一,研究人员从不同的角度对算法进行改进以提高算法的效率。文章通过集合的交集运算,得到一种新的频繁项集挖掘算法-SetFIS算法,该算法能快速、直观地求出事务数据库的频繁项集。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号