首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
提出采用事务压缩和哈希技术相结合方式的改进算法.该算法通过备份数据库Dk生成候选项目集Ck,在生成Ck的同时计算支持度.针对生成频繁2-项目集L2的瓶颈,在生成L2的时候使用DHP算法.从时间复杂度上对Apriori算法和改进算法进行比较,说明改进算法在效率上优于Apriori算法.  相似文献   

2.
Apriori算法是一种挖掘布尔型关联规则的典型算法。该算法在生成频繁项集时会有频繁的数据库扫描操作,并且在由低维频繁项集连接生成高维候选项集时,如果频繁项集维数过大,笛卡尔积后就会产生大量的候选项集,从而影响算法的效率。针对上述2个方面对Apriori算法进行改进,并将改进后的算法应用在试卷分析系统中。经过系统测试,改进后的算法具有较高的效率和较强的稳定性。  相似文献   

3.
本文在研究了多维关联规则数据挖掘的理论及方法的基础上,深入分析以往算法的优缺点并结合图书馆行业管理信息系统的特点,选择对Apriori算法结合数据立方体技术进行改进和优化,形成了适合利用多维关联规则对图书馆数据进行挖掘的新算法。  相似文献   

4.
关联规则挖掘是一种最有影响的数据挖掘技术。它在交易数据库或其他数据仓库项目集之中提取有意义的关联,频繁模式和关联。大多数现有的算法发现频繁模式都需要多次遍历数据库,导致大量的磁盘读取,造成了巨大的I/O负载。为了减少重复读盘,本文提出了一种新的自上而下的方法,即Apriori算法的改进版本,此算法大大降低了数据库的扫描次数,避免生成不必要的模式而减少了数据库的扫描,节省了大量的时间和空间。  相似文献   

5.
赵轶  周艳山 《林区教学》2008,(6):121-122
近年来,数据挖掘已经引起了信息产业界的极大关注,这是快速增长的数据量和日益贫乏的信息量之间矛盾运动的必然结果。在介绍关联规则基本概念的基础上,对关联规则的Apriori算法进行了详细的分析和研究,将Apriori算法应用于高校教务管理信息系统,对学生成绩数据进行分析,探讨了高等学校专业课程间相关性问题,得到了一些合理、可靠的课程关联规则。  相似文献   

6.
分析了挖掘频繁访问模式的过程和当前Apriori算法的缺陷,提出了一种Apriori算法的改进算法:BLApriori算法.改进的算法采用不规则数组来保存项集信息,有效省去了扫描数据库所耗费的大量时间.将项集有序性引入到该数组上,减少了候选项集的个数.并采用二进制来表示1阶频繁访问模式,提高了模式匹配和连接的效率.试验结果表明,该改进算法能更有效地发现各种长度不同的访问模式.  相似文献   

7.
针对Apriori算法的若干不足,如需要多次连接数据库,多次扫描事务记录,在剪枝步骤比对次数过多等缺点,文章实现了把数据库映射到十字链表的方法,并且与传统Apriori算法进行了对比,实验表明十字链表的方法可以大幅度减少数据挖掘所需时间,可明显减少连接及扫描数据库次数,减少剪枝步骤对比次数,提升算法执行效率.  相似文献   

8.
关联规则可在庞大的数据集中找出不同事务之间隐藏的关系,其中Apriori算法是关联规则分析中较为有效的办法。然而,Apriori算法产生候选项集的效率较低且扫描数据过于频繁,造成算法计算需要耗费较长时间。另外,初始定义的最小支持度与最小置信度也不足以过滤无用的关联规则。针对以上问题,利用概率理论与有效的参数设置,在原有Apriori算法基础上,提出一种基于概率事务压缩的关联规则改进算法。数值算例结果表明,新算法可在第二次迭代之后,大幅减少低效候选项集,从而提升经典Apriori算法效率。  相似文献   

9.
为挖掘公司股东关联关系,选用数据挖掘中关联规则的经典Apriori算法,使用Python编程语言对金融行业公司股东进行关联分析.在支持度阈值为10%、置信度阈值为70%条件下,挖掘出12条强关联规则,如香港中央结算有限公司(陆股通)、中央汇金资产管理有限责任公司共同投资某金融企业时,中国证券金融股份有限公司投资可能性达...  相似文献   

10.
本文研究了论文“基于Apriori算法的水平加权关联规则挖掘”中的New-A-Apriori算法,指出了该算法的不足及错误之处,提出了一种挖掘加权频繁项集的算法MWFS。并通过具体实例说明了采用MWFS算法的挖掘过程。  相似文献   

11.
陈建辉 《宜春学院学报》2007,29(4):87-88,122
在对关联规则挖掘算法Apriori进行深入研究的基础上,提出了一种改进的算法SDA算法,在三个方面进行了改进:(1)频繁2-项集生成方法;(2)改进Apriori_gen算法(3)减少事务数据库.在实验数据集上所做的实验结果表明SDA算法是有效的.  相似文献   

12.
提出了一种新的Apriori改进算法,该算法在生成k项频繁集时,不需要多次扫描数据库,有效地减少了对事务数据库的读操作,较经典的Apriori算法有更加优越的性能。  相似文献   

13.
针对经典的Ap606算法耗费大量的时间和空间的特点,提出基于模式矩阵的关联规则算法。该算法扫描数据库次数为一次,降低了挖掘的时间复杂度;扫描后的数据库以矩阵形式存放,减少空间复杂度。并应用具体事例进行验证,对效率进行了比较。  相似文献   

14.
关联规则挖掘通过发现密切相关项集的方法已经在商业决策中被广泛使用.现针对关联规则挖掘的经典算法Apriori需要重复多次扫描整个数据库导致在空间和时间方面有很大负载的问题,提出了根据研究者所感兴趣的项集作为关联规则的结果,采用对数据库进行类标签压缩来减少迭代次数.通过实验显示该方法可以有效提高Apriori算法的效率.  相似文献   

15.
关联规则挖掘是数据挖掘研究领域中的一个重要任务,旨在挖掘事务数据库中有趣的关联。Apriori算法是关联规则挖掘中的经典算法。然而Apriori算法存在着产生候选项目集效率低和频繁扫描数据等缺点。提出了一种新的Apriori的改进算法,该算法在生成k(k>1)项频繁集时,不需要重新扫描数据库,只是在生成1项频集时,才需要扫描事务数据库,有效地减少了对事务数据库的读操作,在时间复杂度上较经典的Apriori算法有更加优越的性能。  相似文献   

16.
研究实现了一种改进的Apriori算法,通过对事务集进行扫描、删除对k一项频繁集无意义的事务,降低事务处理过程中频繁的连接次数来提高算法的效率.对图书借阅相关性挖掘的实际应用表明,随着数据量的增大,改进Apriori算法的时间效率可以提高10%以上.  相似文献   

17.
在远程教育系统的网上考试系统模块中,数据库和数据仓库中的用户交互数据记录了用户对系统的访问行为信息,利用最小支持度和最小置信度,挖掘出频繁项集,对这些信息的分析有利于远程教育教学管理人员和教师掌握学生对知识的掌握情况,从而可以对教学内容加以改进,对教学平台进行优化.  相似文献   

18.
为进一步提高关联规则挖掘的运行效率,在传统Apriori算法的基础上,提出了一种基于分辨矩阵和Apriori算法的关联规则挖掘算法。在数据预处理阶段,采用分辨矩阵对原始数据集进行属性约简,达到降维的目的;在关联规则挖掘阶段,采用位图来表示原始数据集,并在每一步运算过程中通过置信度阈值对特征集进行约简。应用实例和仿真实验表明,该方法在时间复杂度和空间复杂度都有了极大的改善,具有一定的应用价值。  相似文献   

19.
随着信息技术的发展,数据量变得非常庞大,如何从海量数据中找到有用、有关联的信息,数据挖掘技术应运而生。Apriori算法作为重要的关联分析算法在这些年得到了广泛应用。主要介绍了关联规则的基本模型、Apriori算法的原理以及如何使用Apriori算法挖掘出有意义的关联规则。  相似文献   

20.
入侵检测是一种动态的网络安全技术,其检测规则的建立是入侵检测性能好坏的关键.通过对关联规则Apriori算法的分析,通过减少数据扫描的事务量来优化该算法.应用于入侵检测系统中起到了较好的效果.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号