首页 | 本学科首页   官方微博 | 高级检索  
 共查询到19条相似文献,搜索用时 62 毫秒
随着数据挖掘技术的广泛使用,产生了信息安全和隐私保护的新问题。对当前分布式隐私保护关联规则挖掘的经典算法进行了改进,在不使用当前流行的多方安全计算(SMC)的条件下,用较简单的方法进行隐私保护关联规则挖掘,降低了运算量。同时,在分布式关联规则挖掘的同时,很好地保持了各个站点的数据和信息。  相似文献   

近年来,数据挖掘备受青睐,它可以从大量数据集合中提取隐藏的知识。如何实现既找到数据中隐藏的知识,又不透露其中的敏感信息尤为关键。隐私保护数据挖掘(PPDM)能够实现对敏感信息的保护,关联规则隐藏是PPDM技术中的一种,用来保护敏感性的关联规则。总结了关于隐私保护的数据挖掘方法并指出了其优缺点,同时重点对关联规则隐藏算法进行了分析。  相似文献   

介绍了关联规则的基本概念和分类方法,分析了典型的Apriori算法,并描述了Apriori算法的性能瓶颈与改进策略.最后展望了关联规则挖掘的进一步研究方向.  相似文献   

关联规则挖掘综述   总被引:3,自引:0,他引:3  
介绍了当前关联规则挖掘的研究情况,分析了传统关联规则挖掘算法的不足.与此同时,介绍了几种优化算法.最后,展望了关联规则挖掘的未来研究方向.  相似文献   

主要介绍了关联规则挖掘的研究情况,对一些典型算法进行了分析和评价,指出传统关联规则衡量标准的不足,并归纳出关联规则的价值衡量方法,最后,展望了关联规则挖掘的未来研究方向。  相似文献   

设计了一种基于遗传算法的关联规则算法,该算法将遗传算法和关联规则相结合.对遗传算法的编码方法、适应度函数的构造、交叉算子和变异算子进行了分析,给出了所设计方法的具体步骤,并进行了试验.试验表明,改进后的算法的执行效率高于Apriori算法.  相似文献   

本文介绍了数据挖掘中的关联规则经典Apriori算法.针对Apriori算法在执行速度和效率上的缺点,提出了一种改进的Apriori算法.  相似文献   

多媒体图像挖掘的关联规则挖掘   总被引:1,自引:1,他引:0  
数据挖掘从大量的数据中提取隐含在其中的有用信息和知识,采用关联规则挖掘方法,对多媒体图像进行关联规则挖掘,得出多媒体图像的关联规则。  相似文献   

关联规则是数据挖掘的重要研究内容之一,而传统的串行算法已不能满足数据库空前发展的需求.本文提出了关联规则的并行挖掘算法,探讨了相关的数据结构,并对算法进行了定性分析.  相似文献   

基于对数据挖掘,特别是关联规则挖掘的研究,提出了一种改进型遗传算法的关联规则提取算法,并从编码方法、适应度函数的构造和遗传算子的设计方面进行讨论分析。通过对早熟问题的分析并改进自适应算子,提高了算法的效率,使算法在相对稳定的动态种群规模中寻找优质解。  相似文献   

提出了一种挖掘频繁项目集的有效算法——FFP-Growth,该算法采用自底向上的策略搜索频繁模式树,但不同于FP-Growth的是它无须生成条件模式基和频繁模式子树,且生成的频繁模式树较TD-FP-Growth生成的频繁模式树小,因而能提高关联规则的挖掘效率.类似于TD-FP-Growth的扩展TD-FP-Growth(M)和TD-FP-Growth(C),FFP-Growth很容易被扩展,以此来有效地减小搜索空间.实验结果表明本提出的算法是有效可行的.  相似文献   

在概念层次里进行关联规则的挖掘,并考虑到用户感知与主观判断所产生的认知不确定性;结合模糊分割法与FP-Growth方法,应用于概念层次架构中找出关联规则方法,主要分为两个阶段:层级架构的顺序将数据项做抽象化,找出高频模糊格;由高频模糊格来产生多层次模糊关规则。最后通过比较验证所提方法可提高算法的执行效率、缩短计算时间。  相似文献   

项目加权关联规则挖掘中,权值反映了数据的重要程度,权值对项目支持度有加强或减弱作用.通过比较M INWAL(O)、M INWAL(W)等加权关联规则挖掘模型,分析了权值对加权关联规则挖掘产生的影响,并针对M INWAL(W)模型在加权候选频繁项目集剪枝方面存在的不足,利用支持度下界对剪枝策略进行了改进,从而有效地减少挖掘过程的计算量.  相似文献   

针对Apriori算法多次扫描事务数据库且产生庞大的候选集性能瓶颈,本文提出了Apriori算法的优化算法。该算法利用频繁项集产生时需要自身连接的特征,在连接前对频繁项集依据支持度由小到大进行排序,从而优化连接策略,并将其运用到描述事务数据库的布尔矩阵中。经实验证明,该算法随着事务数据库规模的扩大,较Apriori算法有明显的优越性。  相似文献   

详细了分析传统关联规则Apriori算法的不足,提出了一种改进的关联规则快速挖掘算法。针对当前高校招生录取后大量考生流失问题,使用该算法对某地区考生信息进行数理分析和仿真实验,挖掘了隐含的有用信息,为高校招生录取提供决策性的作用。  相似文献   

关联规则广泛应用于网络入侵检测,以Access2003数据库为基础,实现了关联规则挖掘apriori算法,成功挖掘出网络数据特征项与入侵类型之间的关联规则,能有效地对网络入侵数据进行关联规则分析。  相似文献   

By analyzing the existing prefix-tree data structure, an improved pattern tree was introduced for processing new transactions. It firstly stored transactions in a lexicographic order tree and then restructured the tree by sorting each path in a frequency-descending order. While updating the improved pattern tree, there was no need to rescan the entire new database or reconstruct a new tree for incremental updating. A test was performed on synthetic dataset T1014D100K with 100 000 transactions and 870 items. Experimental results show that the smaller the minimum sup- port threshold, the faster the improved pattern tree achieves over CanTree for all datasets. As the minimum support threshold increased from 2% to 3.5%, the runtime decreased from 452.71 s to 186.26 s. Meanwhile, the runtime re- quired by CanTree decreased from 1 367.03 s to 432.19 s. When the database was updated, the execution time of im- proved pattern tree consisted of construction of original improved pattern trees and reconstruction of initial tree. The experiment results showed that the runtime was saved by about 15% compared with that of CanTree. As the number of transactions increased, the runtime of improved pattern tree was about 25% shorter than that of FP-tree. The improved pattern tree also required less memory than CanTree.  相似文献   

本文首先介绍了关联规则挖掘的含义和功能,然后重点分析了它在某购物网站中的应用,得出对卖家有用的建议,起到了支撑作用。  相似文献   

In the daily life, people often repeat regular routes in certain periods. In this paper, a mining system is developed to find the continuous route patterns of personal past trips. In order to count the diversity of personal moving status, the mining system employs the adaptive GPS data recording and five data filters to guarantee the clean trips data. The mining system uses a client/server architecture to protect personal privacy and to reduce the computational load. The server conducts the main mining procedure but with insufficient information to recover real personal routes. In order to improve the scalability of sequential pattern mining, a novel pattern mining algorithm, continuous route pattern mining (CRPM), is proposed. This algorithm can tolerate the different disturbances in real routes and extract the frequent patterns. Experimental results based on nine persons' trips show that CRPM can extract more than two times longer route patterns than the traditional route pattern mining algorithms.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号