共查询到20条相似文献,搜索用时 15 毫秒
1.
提出采用事务压缩和哈希技术相结合方式的改进算法.该算法通过备份数据库Dk生成候选项目集Ck,在生成Ck的同时计算支持度.针对生成频繁2-项目集L2的瓶颈,在生成L2的时候使用DHP算法.从时间复杂度上对Apriori算法和改进算法进行比较,说明改进算法在效率上优于Apriori算法. 相似文献
2.
Apriori算法是一种挖掘布尔型关联规则的典型算法。该算法在生成频繁项集时会有频繁的数据库扫描操作,并且在由低维频繁项集连接生成高维候选项集时,如果频繁项集维数过大,笛卡尔积后就会产生大量的候选项集,从而影响算法的效率。针对上述2个方面对Apriori算法进行改进,并将改进后的算法应用在试卷分析系统中。经过系统测试,改进后的算法具有较高的效率和较强的稳定性。 相似文献
3.
马文庆 《佳木斯教育学院学报》2012,(11):467+469
本文在研究了多维关联规则数据挖掘的理论及方法的基础上,深入分析以往算法的优缺点并结合图书馆行业管理信息系统的特点,选择对Apriori算法结合数据立方体技术进行改进和优化,形成了适合利用多维关联规则对图书馆数据进行挖掘的新算法。 相似文献
4.
李晋芳 《晋城职业技术学院学报》2014,(2):60-62
关联规则挖掘是一种最有影响的数据挖掘技术。它在交易数据库或其他数据仓库项目集之中提取有意义的关联,频繁模式和关联。大多数现有的算法发现频繁模式都需要多次遍历数据库,导致大量的磁盘读取,造成了巨大的I/O负载。为了减少重复读盘,本文提出了一种新的自上而下的方法,即Apriori算法的改进版本,此算法大大降低了数据库的扫描次数,避免生成不必要的模式而减少了数据库的扫描,节省了大量的时间和空间。 相似文献
5.
近年来,数据挖掘已经引起了信息产业界的极大关注,这是快速增长的数据量和日益贫乏的信息量之间矛盾运动的必然结果。在介绍关联规则基本概念的基础上,对关联规则的Apriori算法进行了详细的分析和研究,将Apriori算法应用于高校教务管理信息系统,对学生成绩数据进行分析,探讨了高等学校专业课程间相关性问题,得到了一些合理、可靠的课程关联规则。 相似文献
6.
臧勇 《新课程学习(社会综合)》2010,(12)
分析了挖掘频繁访问模式的过程和当前Apriori算法的缺陷,提出了一种Apriori算法的改进算法:BLApriori算法.改进的算法采用不规则数组来保存项集信息,有效省去了扫描数据库所耗费的大量时间.将项集有序性引入到该数组上,减少了候选项集的个数.并采用二进制来表示1阶频繁访问模式,提高了模式匹配和连接的效率.试验结果表明,该改进算法能更有效地发现各种长度不同的访问模式. 相似文献
7.
针对Apriori算法的若干不足,如需要多次连接数据库,多次扫描事务记录,在剪枝步骤比对次数过多等缺点,文章实现了把数据库映射到十字链表的方法,并且与传统Apriori算法进行了对比,实验表明十字链表的方法可以大幅度减少数据挖掘所需时间,可明显减少连接及扫描数据库次数,减少剪枝步骤对比次数,提升算法执行效率. 相似文献
8.
关联规则可在庞大的数据集中找出不同事务之间隐藏的关系,其中Apriori算法是关联规则分析中较为有效的办法。然而,Apriori算法产生候选项集的效率较低且扫描数据过于频繁,造成算法计算需要耗费较长时间。另外,初始定义的最小支持度与最小置信度也不足以过滤无用的关联规则。针对以上问题,利用概率理论与有效的参数设置,在原有Apriori算法基础上,提出一种基于概率事务压缩的关联规则改进算法。数值算例结果表明,新算法可在第二次迭代之后,大幅减少低效候选项集,从而提升经典Apriori算法效率。 相似文献
9.
10.
本文研究了论文“基于Apriori算法的水平加权关联规则挖掘”中的New-A-Apriori算法,指出了该算法的不足及错误之处,提出了一种挖掘加权频繁项集的算法MWFS。并通过具体实例说明了采用MWFS算法的挖掘过程。 相似文献
11.
在对关联规则挖掘算法Apriori进行深入研究的基础上,提出了一种改进的算法SDA算法,在三个方面进行了改进:(1)频繁2-项集生成方法;(2)改进Apriori_gen算法(3)减少事务数据库.在实验数据集上所做的实验结果表明SDA算法是有效的. 相似文献
12.
提出了一种新的Apriori改进算法,该算法在生成k项频繁集时,不需要多次扫描数据库,有效地减少了对事务数据库的读操作,较经典的Apriori算法有更加优越的性能。 相似文献
13.
针对经典的Ap606算法耗费大量的时间和空间的特点,提出基于模式矩阵的关联规则算法。该算法扫描数据库次数为一次,降低了挖掘的时间复杂度;扫描后的数据库以矩阵形式存放,减少空间复杂度。并应用具体事例进行验证,对效率进行了比较。 相似文献
14.
15.
16.
周蓓 《常熟理工学院学报》2010,24(8)
研究实现了一种改进的Apriori算法,通过对事务集进行扫描、删除对k一项频繁集无意义的事务,降低事务处理过程中频繁的连接次数来提高算法的效率.对图书借阅相关性挖掘的实际应用表明,随着数据量的增大,改进Apriori算法的时间效率可以提高10%以上. 相似文献
17.
在远程教育系统的网上考试系统模块中,数据库和数据仓库中的用户交互数据记录了用户对系统的访问行为信息,利用最小支持度和最小置信度,挖掘出频繁项集,对这些信息的分析有利于远程教育教学管理人员和教师掌握学生对知识的掌握情况,从而可以对教学内容加以改进,对教学平台进行优化. 相似文献
18.
19.
随着信息技术的发展,数据量变得非常庞大,如何从海量数据中找到有用、有关联的信息,数据挖掘技术应运而生。Apriori算法作为重要的关联分析算法在这些年得到了广泛应用。主要介绍了关联规则的基本模型、Apriori算法的原理以及如何使用Apriori算法挖掘出有意义的关联规则。 相似文献