首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 109 毫秒
1.
陈建辉 《宜春学院学报》2007,29(4):87-88,122
在对关联规则挖掘算法Apriori进行深入研究的基础上,提出了一种改进的算法SDA算法,在三个方面进行了改进:(1)频繁2-项集生成方法;(2)改进Apriori_gen算法(3)减少事务数据库.在实验数据集上所做的实验结果表明SDA算法是有效的.  相似文献   

2.
提出了一种新的Apriori改进算法,该算法在生成k项频繁集时,不需要多次扫描数据库,有效地减少了对事务数据库的读操作,较经典的Apriori算法有更加优越的性能。  相似文献   

3.
关联规则挖掘是数据挖掘研究领域中的一个重要任务,旨在挖掘事务数据库中有趣的关联。Apriori算法是关联规则挖掘中的经典算法。然而Apriori算法存在着产生候选项目集效率低和频繁扫描数据等缺点。提出了一种新的Apriori的改进算法,该算法在生成k(k>1)项频繁集时,不需要重新扫描数据库,只是在生成1项频集时,才需要扫描事务数据库,有效地减少了对事务数据库的读操作,在时间复杂度上较经典的Apriori算法有更加优越的性能。  相似文献   

4.
关联规则挖掘是数据挖掘领域中的一个非常重要的研究内容,其主要目标就是发现数据库中一组对象之间某种关联。频繁项集挖掘是关联规则挖掘的关键步骤,它在很大程度上决定了关联规则挖掘的效率。介绍了Apriori算法及其算法改进。该改进算法对剪枝步进行了优化,提高了连接效率,并且不断减小数据库的规模,去掉无效事务,减少了每次扫描数据库所花费的时间,提高了算法效率。经过试验论证,性能比原有算法提高,具有一定的实用性。  相似文献   

5.
Apriori关联规则挖掘算法分析与改进   总被引:1,自引:0,他引:1  
对数据挖掘及关联规则挖掘的定义及相关概念作了简单的介绍,对基于关联规则的Apriori算法基本思想及其核心算法作了深入剖析,提出了该算法的瓶颈问题,并就此问题提出了改进思路,同时对改进的Apriori算法进行了评价.  相似文献   

6.
为了探究互联网时代下学生的培优情况,通过问卷调查形式面向广大高校学子进行信息收集,基于Apriori算法对数据进行布尔关联规则频繁项集挖掘,并对传统Apriori算法进行改进.通过变换数据库的数据结构,使得整个算法对项目数据库只进行一次扫描操作;基于算法特有的定律特性,针对性地设计剪枝操作,减少项集连接时产生的大量冗余...  相似文献   

7.
在数据挖掘算法中,Apriori算法是关联规则的经典算法。文章在分析经典Apriori算法的基础上,提出了改进型的Apriori算法。改进后的算法对事务数据库进行两次压缩,减少事务数据库的平均长度,提高了数据挖掘的效率,具有一定的实用性。  相似文献   

8.
目前,已经提出了许多挖掘关联规则的算法及其变型,其中最著名的是Apriori算法,但传统的算法效率太低,为了解决这些问题,提出了一种快速更新的关联挖掘算法。  相似文献   

9.
挖掘频繁项集是近年数据挖掘任务中的关键问题,提高频繁项集的生成效率一直是数据挖掘领域研究的热点之一,研究人员从不同的角度对算法进行改进以提高算法的效率。文章通过集合的交集运算,得到一种新的频繁项集挖掘算法-SetFIS算法,该算法能快速、直观地求出事务数据库的频繁项集。  相似文献   

10.
挖掘频繁项集是近年数据挖掘任务中的关键问题,提高频繁项集的生成效率一直是数据挖掘领域研究的热点之一,研究人员从不同的角度对算法进行改进以提高算法的效率。文章通过集合的交集运算,得到一种新的频繁项集挖掘算法-SetFIS算法,该算法能快速、直观地求出事务数据库的频繁项集。  相似文献   

11.
在远程教育系统的网上考试系统模块中,数据库和数据仓库中的用户交互数据记录了用户对系统的访问行为信息,利用最小支持度和最小置信度,挖掘出频繁项集,对这些信息的分析有利于远程教育教学管理人员和教师掌握学生对知识的掌握情况,从而可以对教学内容加以改进,对教学平台进行优化.  相似文献   

12.
对云计算技术和数据挖掘进行研究,分析Apriori算法,针对其局限性,提出优化方案,引入云计算中MapReduce模型,实现并行化。提出一种基于MapReduce的频繁项集挖掘方法,以提高算法的运行效率,降低算法执行所需的开销。  相似文献   

13.
关联规则挖掘是一种最有影响的数据挖掘技术。它在交易数据库或其他数据仓库项目集之中提取有意义的关联,频繁模式和关联。大多数现有的算法发现频繁模式都需要多次遍历数据库,导致大量的磁盘读取,造成了巨大的I/O负载。为了减少重复读盘,本文提出了一种新的自上而下的方法,即Apriori算法的改进版本,此算法大大降低了数据库的扫描次数,避免生成不必要的模式而减少了数据库的扫描,节省了大量的时间和空间。  相似文献   

14.
为明确中医治疗抑郁症用药规律,融合Apriori优化算法与Relim算法,采用数据挖掘技术进行分析。针对传统Apriori算法频繁扫描数据库从而生成大量候选项集的缺点,改变其原有剪枝方式以减少扫描次数。将改进后的Apriori算法与无需产生候选项集的Relim算法就中医治疗抑郁症的方剂数据进行关联规则分析,并绘制两个算法时间效率图。结果发现,两种算法在挖掘药物频繁项集与关联规则的结果基本相同,通过分析发现,中医常以疏肝、理气、补肾、滋阴等药物为主治疗抑郁症。改进后的Apriori算法可降低数据库扫描次数,较传统Apriori算法运行效率有所提高,Relim算法在空间利用率和时间执行率上均略优于改进后的Apriori算法。两种算法挖掘结果体现出中医治疗抑郁症注重疏肝理气、补肾滋阴、调理气血等特点。基于关联规则的方法可作为中医用药规律分析的重要工具。  相似文献   

15.
潘磊 《教育技术导刊》2009,19(9):186-189
为提升电网系统日志故障诊断效率,在 Spark 环境下,基于并行 Apriori 算法构建分布式日志故障挖掘系统,针对电网系统相关设备后台日志数据,构建频繁项集并挖掘关联规则,形成系统故障规则库,用于系统故障诊断。系统对 50 万条真实日志数据进行检验。结果表明,该系统可有效发现相关故障日志。同时,该系统在 80G 内存、10 个虚拟节点的集群上以 50s 的速度完成了故障挖掘工作,准确率达 90%,同时提升了原单机系统效率,实现了预期效果。  相似文献   

16.
Apriori算法是一种挖掘布尔型关联规则的典型算法。该算法在生成频繁项集时会有频繁的数据库扫描操作,并且在由低维频繁项集连接生成高维候选项集时,如果频繁项集维数过大,笛卡尔积后就会产生大量的候选项集,从而影响算法的效率。针对上述2个方面对Apriori算法进行改进,并将改进后的算法应用在试卷分析系统中。经过系统测试,改进后的算法具有较高的效率和较强的稳定性。  相似文献   

17.
提出基于云计算平台(以Hadoop为例)应用布尔矩阵Apriori算法进行大数据关联规则挖掘的MR_B_Apriori算法。将Hadoop平台与布尔矩阵Apriori算法相结合,利用MapReduce框架分块处理布尔矩阵,计算出分块数据的频度,合并融合得到大数据集的频繁项集。分析表明MR_B_Apriori算法能够适用于大数据的频繁项集挖掘。  相似文献   

18.
一种基于二进制编码的频繁项集查找算法   总被引:1,自引:0,他引:1  
在数据挖掘中频繁项集的查找时间是影响挖掘关联规则效率的关键因素,Apriori算法是用来找出频繁项集的典型算法,本文针对Apriori算法需反复扫描数据库、产生大量候选项集的不足,提出一种效率更高的基于二进制编码的频繁项集查找算法,该算法找出频繁项集只需一次数据库扫描,不产生候选项集,与Apriori算法相比,算法效率更高.  相似文献   

19.
关联规则是数据挖掘领域的一个重要分支。随着大量数据的收集和存储,人们对于从数据库中挖掘关联规则越来越感兴趣,Apriori算法就是经典的关联挖掘算法。文章分析了Apriori的算法思想、算法描述及实际应用。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号