共查询到19条相似文献,搜索用时 62 毫秒
1.
2.
近年来,数据挖掘备受青睐,它可以从大量数据集合中提取隐藏的知识。如何实现既找到数据中隐藏的知识,又不透露其中的敏感信息尤为关键。隐私保护数据挖掘(PPDM)能够实现对敏感信息的保护,关联规则隐藏是PPDM技术中的一种,用来保护敏感性的关联规则。总结了关于隐私保护的数据挖掘方法并指出了其优缺点,同时重点对关联规则隐藏算法进行了分析。 相似文献
3.
张丽 《赤峰学院学报(自然科学版)》2009,25(5):17-18
介绍了关联规则的基本概念和分类方法,分析了典型的Apriori算法,并描述了Apriori算法的性能瓶颈与改进策略.最后展望了关联规则挖掘的进一步研究方向. 相似文献
4.
5.
6.
李广霞 《石家庄职业技术学院学报》2013,25(4):27-29
设计了一种基于遗传算法的关联规则算法,该算法将遗传算法和关联规则相结合.对遗传算法的编码方法、适应度函数的构造、交叉算子和变异算子进行了分析,给出了所设计方法的具体步骤,并进行了试验.试验表明,改进后的算法的执行效率高于Apriori算法. 相似文献
7.
张丽 《赤峰学院学报(自然科学版)》2013,(2):22-23
本文介绍了数据挖掘中的关联规则经典Apriori算法.针对Apriori算法在执行速度和效率上的缺点,提出了一种改进的Apriori算法. 相似文献
8.
多媒体图像挖掘的关联规则挖掘 总被引:1,自引:1,他引:0
数据挖掘从大量的数据中提取隐含在其中的有用信息和知识,采用关联规则挖掘方法,对多媒体图像进行关联规则挖掘,得出多媒体图像的关联规则。 相似文献
9.
关联规则是数据挖掘的重要研究内容之一,而传统的串行算法已不能满足数据库空前发展的需求.本文提出了关联规则的并行挖掘算法,探讨了相关的数据结构,并对算法进行了定性分析. 相似文献
10.
基于对数据挖掘,特别是关联规则挖掘的研究,提出了一种改进型遗传算法的关联规则提取算法,并从编码方法、适应度函数的构造和遗传算子的设计方面进行讨论分析。通过对早熟问题的分析并改进自适应算子,提高了算法的效率,使算法在相对稳定的动态种群规模中寻找优质解。 相似文献
11.
12.
在概念层次里进行关联规则的挖掘,并考虑到用户感知与主观判断所产生的认知不确定性;结合模糊分割法与FP-Growth方法,应用于概念层次架构中找出关联规则方法,主要分为两个阶段:层级架构的顺序将数据项做抽象化,找出高频模糊格;由高频模糊格来产生多层次模糊关规则。最后通过比较验证所提方法可提高算法的执行效率、缩短计算时间。 相似文献
13.
项目加权关联规则挖掘中,权值反映了数据的重要程度,权值对项目支持度有加强或减弱作用.通过比较M INWAL(O)、M INWAL(W)等加权关联规则挖掘模型,分析了权值对加权关联规则挖掘产生的影响,并针对M INWAL(W)模型在加权候选频繁项目集剪枝方面存在的不足,利用支持度下界对剪枝策略进行了改进,从而有效地减少挖掘过程的计算量. 相似文献
14.
彭迎春 《深圳信息职业技术学院学报》2011,9(1):13-17
针对Apriori算法多次扫描事务数据库且产生庞大的候选集性能瓶颈,本文提出了Apriori算法的优化算法。该算法利用频繁项集产生时需要自身连接的特征,在连接前对频繁项集依据支持度由小到大进行排序,从而优化连接策略,并将其运用到描述事务数据库的布尔矩阵中。经实验证明,该算法随着事务数据库规模的扩大,较Apriori算法有明显的优越性。 相似文献
15.
详细了分析传统关联规则Apriori算法的不足,提出了一种改进的关联规则快速挖掘算法。针对当前高校招生录取后大量考生流失问题,使用该算法对某地区考生信息进行数理分析和仿真实验,挖掘了隐含的有用信息,为高校招生录取提供决策性的作用。 相似文献
16.
17.
By analyzing the existing prefix-tree data structure, an improved pattern tree was introduced for processing new transactions. It firstly stored transactions in a lexicographic order tree and then restructured the tree by sorting each path in a frequency-descending order. While updating the improved pattern tree, there was no need to rescan the entire new database or reconstruct a new tree for incremental updating. A test was performed on synthetic dataset T1014D100K with 100 000 transactions and 870 items. Experimental results show that the smaller the minimum sup- port threshold, the faster the improved pattern tree achieves over CanTree for all datasets. As the minimum support threshold increased from 2% to 3.5%, the runtime decreased from 452.71 s to 186.26 s. Meanwhile, the runtime re- quired by CanTree decreased from 1 367.03 s to 432.19 s. When the database was updated, the execution time of im- proved pattern tree consisted of construction of original improved pattern trees and reconstruction of initial tree. The experiment results showed that the runtime was saved by about 15% compared with that of CanTree. As the number of transactions increased, the runtime of improved pattern tree was about 25% shorter than that of FP-tree. The improved pattern tree also required less memory than CanTree. 相似文献
18.
19.
In the daily life, people often repeat regular routes in certain periods. In this paper, a mining system is developed to find the continuous route patterns of personal past trips. In order to count the diversity of personal moving status, the mining system employs the adaptive GPS data recording and five data filters to guarantee the clean trips data. The mining system uses a client/server architecture to protect personal privacy and to reduce the computational load. The server conducts the main mining procedure but with insufficient information to recover real personal routes. In order to improve the scalability of sequential pattern mining, a novel pattern mining algorithm, continuous route pattern mining (CRPM), is proposed. This algorithm can tolerate the different disturbances in real routes and extract the frequent patterns. Experimental results based on nine persons' trips show that CRPM can extract more than two times longer route patterns than the traditional route pattern mining algorithms. 相似文献