首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
介绍了关联规则隐私保护方法的研究概况,提出了利用基于敏感模式隐私保护算法,并通过实验验证该算法在模式丢失以及数据集中的差异上等性能有明显改善。最后,对未来关联规则挖掘领域中涉及的信息隐藏研究进行了展望。  相似文献   

2.
关联规则挖掘是数据挖掘研究领域中的一个重要任务,旨在挖掘事务数据库中有趣的关联。Apriori算法是关联规则挖掘中的经典算法。然而Apriori算法存在着产生候选项目集效率低和频繁扫描数据等缺点。提出了一种新的Apriori的改进算法,该算法在生成k(k>1)项频繁集时,不需要重新扫描数据库,只是在生成1项频集时,才需要扫描事务数据库,有效地减少了对事务数据库的读操作,在时间复杂度上较经典的Apriori算法有更加优越的性能。  相似文献   

3.
FP-growth算法是关联规则挖掘算法中的经典算法,用于挖掘频繁项目集。但它的时间和空间效率还不足够高。提出了一种新的频繁模式树构造方法,性能得以提高。  相似文献   

4.
FP—Growth算法是关联规则挖掘的一个经典算法。本文提出一种基于事务一项矩阵的挖掘算法MFP—Growth算法,利用向量矩阵表示事务数据库,整个挖掘过程只扫描一遍数据库,通过构造各个频繁项的条件矩阵,利用条件矩阵的向量运算来进行频繁模式的挖掘,减少了算法占用的内存空间,提高了挖掘效率.实验结果表明,MFP—Growth算法是有效可行的.  相似文献   

5.
为了解决分布式动态数据库关联规则挖掘效率低的问题,利用MPI与OpenMP的优点,提出了实现增量关联规则挖掘的混合模式。在次频繁项概念基础上,给出该混合模式总体架构,设计了基于MPI与OpenMP的分布式动态数据库增量关联规则挖掘混合模式工作流程,并给出了伪代码描述,该模式只处理变化的数据。实验结果表明,该模式比现有的串行与分布式关联规则挖掘方法效率更高、性能更优。  相似文献   

6.
计算机软件蕴含大量工作信息,有效挖掘软件数据信息之间的内在关联是信息时代对软件应用的潜在要求。针对经典Apriori算法挖掘数据效率低、复杂度高的问题,提出一种改进Apriori算法用于挖掘计算机软件数据的关联规则。为计算机软件算法设置双重支持度阈值,即频繁项集与非频繁项集支持度阈值,快速获得强关联的频繁项集;在此基础上基于映射规则重构事务数据库,压缩数据库规模,减少算法的剪枝操作,降低计算机软件数据关联规则挖掘复杂度。以人力资源类计算机软件数据为例展开关联分析测试,结果显示,该算法挖掘的关联信息与人力资源实际管理情况一致,相比经典Apriori算法其效率有所提升。  相似文献   

7.
随着数据挖掘技术的广泛使用,产生了信息安全和隐私保护的新问题。对当前分布式隐私保护关联规则挖掘的经典算法进行了改进,在不使用当前流行的多方安全计算(SMC)的条件下,用较简单的方法进行隐私保护关联规则挖掘,降低了运算量。同时,在分布式关联规则挖掘的同时,很好地保持了各个站点的数据和信息。  相似文献   

8.
为明确中医治疗抑郁症用药规律,融合Apriori优化算法与Relim算法,采用数据挖掘技术进行分析。针对传统Apriori算法频繁扫描数据库从而生成大量候选项集的缺点,改变其原有剪枝方式以减少扫描次数。将改进后的Apriori算法与无需产生候选项集的Relim算法就中医治疗抑郁症的方剂数据进行关联规则分析,并绘制两个算法时间效率图。结果发现,两种算法在挖掘药物频繁项集与关联规则的结果基本相同,通过分析发现,中医常以疏肝、理气、补肾、滋阴等药物为主治疗抑郁症。改进后的Apriori算法可降低数据库扫描次数,较传统Apriori算法运行效率有所提高,Relim算法在空间利用率和时间执行率上均略优于改进后的Apriori算法。两种算法挖掘结果体现出中医治疗抑郁症注重疏肝理气、补肾滋阴、调理气血等特点。基于关联规则的方法可作为中医用药规律分析的重要工具。  相似文献   

9.
关联规则挖掘用于发现大量数据中项集之间有趣的关联或相关联系,在关联规则挖掘过程中,频繁项集的产生是最重要的步骤。本文提出一种新的频繁项集生成算法,基于项分组的思想,利用矩阵来存储各项的频率信息.只需扫描数据库一次。由于对项进行了分组,充分利用了各个事务的重复信息,因此在项数很多时算法效率仍然较高,实践证明,这是一个高效的频繁项集生成算法。  相似文献   

10.
为提高关联规则中频繁集挖掘的效率,将频繁集的挖掘转化为TSP问题中最短路径的求解。应用蚁群算法的思想,结合频繁项集的特点对算法进行改进,进而挖掘满足最小支持度的项的组合。实验表明,与传统的Apriori算法相比,改进后的蚁群算法能够在较短的时间里挖掘出大部分的频繁项集,可以有效地进行频繁项集的挖掘。  相似文献   

11.
Apriori算法是关联规则挖掘技术中的一个经典算法。笔者通过对该算法的思想和性能分析,认为它存在两方面的不足。本文提出了一种提高频繁项集挖掘算法效率的优化方法。实验表明,该优化算法对提高频繁项集挖掘算法的效率是有效的。  相似文献   

12.
关联规则挖掘是数据挖掘领域中的一个非常重要的研究内容,其主要目标就是发现数据库中一组对象之间某种关联。频繁项集挖掘是关联规则挖掘的关键步骤,它在很大程度上决定了关联规则挖掘的效率。介绍了Apriori算法及其算法改进。该改进算法对剪枝步进行了优化,提高了连接效率,并且不断减小数据库的规模,去掉无效事务,减少了每次扫描数据库所花费的时间,提高了算法效率。经过试验论证,性能比原有算法提高,具有一定的实用性。  相似文献   

13.
关联规则挖掘算法是数据挖掘领域的主要研究方向之一。对几种经典的关联规则挖掘算法进行了分析、探讨和比较,给出了一种基于支持矩阵的、不需要产生候选项目集的算法设计思想。算法为事务数据库中的每个项目设置二进制向量,利用逻辑与运算构造支持矩阵来挖掘频繁项目集,极大地节省了存储空间,提高了算法运行效率。  相似文献   

14.
关联规则的挖掘分为两步,首先找出满足最小支持度要求的频繁项目集,然后根据频繁项目集生成满足最小置信度要求的关联规则集.目前对关联规则挖掘的研究主要集中在频繁项集的生成上,然而,作为整个关联规则挖掘的一部分,由频繁项集生成关联规则的算法也有待进一步研究和改进.本文首先对传统的集合操作进行了扩展,然后在扩展集合操作的基础上,提出了由已挖掘出的最大频繁项集生成关联规则的算法ARD-ES,并对算法的复杂度作了理论和实验上的分析.实验表明,ARD-ES算法随着事务数据库容量的增大,时间占用的攀升基本上是线性的,空间占用在某一定值上下波动.  相似文献   

15.
Apriori算法是整个关联规则算法的基础.它必须对数据库进行重复性扫描.效率低,耗时巨大.针对关联规则的维护问题,提出利用已生成关联规则的挖掘结果进行更新的算法,仅需对数据库进行两次扫描,提高了关联规则的更新效率.  相似文献   

16.
关联规则是数据挖掘中一个非常重要的任务,有许多针对于关联规则的挖掘算法,然而需要提高算法的有效性来处理现实世界中的数据集。基于聚类的关联规则挖掘算法法通过扫描数据库创建聚类表,将收集的事务记录放入聚类表中,通过局部聚类表的约束来产生频繁项集,不仅可以剪枝候选项集,降低数据扫描的时间,而且确保挖掘结果集的正确性。实验结果表明,基于聚类的关联规则挖掘算法比Apfiori算法有更高的执行效率。  相似文献   

17.
提高最大频繁项目集挖掘算法的效率是关联规则挖掘研究一个重点领域.本文主要对影响最大频繁项目集挖掘效率的数据分布、搜索策略、支持度计算及剪枝策略等技术进行研究.  相似文献   

18.
数据挖掘是目前数据库界广泛研究的课题,而频繁项集的挖掘是关联规则挖掘、序列模式挖掘、相关分析挖掘、聚类模式挖掘和回归模式挖掘等问题中的关键步骤.该文介绍了频繁项集挖掘算法的相关概念,对目前频繁项集挖掘典型算法进行了分析和比较,并作出了适当的评价.  相似文献   

19.
发现关联规则是数据挖掘技术的重要任务之一。之前提出的绝大多数算法需要多次遍历数据库才能产生频繁项集,造成巨大的CPU和内存开销。根据网上交易数据海量的特点,提出了一种基于频繁模式增长(FP-growth)的并行算法。该算法可以在不产生候选集的基础上并行的挖掘海量数据。试验证明该算法可以缓解了项目数量巨大而内存不足的矛盾,减少了算法的执行时间。利用该算法对网上交易进行关联规则挖掘,发现了有价值的决策支持信息。  相似文献   

20.
提出了一种挖掘频繁项目集的有效算法——FFP-Growth,该算法采用自底向上的策略搜索频繁模式树,但不同于FP-Growth的是它无须生成条件模式基和频繁模式子树,且生成的频繁模式树较TD-FP-Growth生成的频繁模式树小,因而能提高关联规则的挖掘效率.类似于TD-FP-Growth的扩展TD-FP-Growth(M)和TD-FP-Growth(C),FFP-Growth很容易被扩展,以此来有效地减小搜索空间.实验结果表明本提出的算法是有效可行的.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号