首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
频繁项集挖掘算法研究   总被引:2,自引:0,他引:2  
在数据库中挖掘频繁项集是数据挖掘领域的最基本、最重要的问题。自从Agrawal的开创性工作以来,有关研究从未停止过。然而由于其内在的计算复杂性,这一问题并未完全解决。通过描述频繁项集挖掘的特点,并根据解空间的分类对已有各种频繁项集、闭频繁项集、最大闭频项集和不生成频繁项集的挖掘算法进行了分析和比较。  相似文献   

2.
翟悦 《科教文汇》2011,(4):89-90
针对传统的Apriori算法需要产生大量的候选项目集和多次扫描数据库的不足,提出了一种新的基于内积运算的频繁项集生成算法。该算法对事务数据库布尔化表示,通过内积运算搜寻矩阵行向量直接生成频繁项集,打破了频繁项集必须从低次到高次的局限,当频繁项集可能是大项集时,大大提高了搜索效率。  相似文献   

3.
针对频繁项集挖掘时间与空间效率低的问题,提出一种基于New FP-tree的高效频繁项集挖掘算法。此算法利用New FP-tree结构存储事务数据库中的频繁项集信息,无需递归构造条件模式树,仅需两次扫描数据库即可生成所有频繁项集。最后的实验证明了该算法的有效性。  相似文献   

4.
在挖掘关联规则的过程中,关键步骤是产生频繁项集。文中利用逻辑与运算并建立频繁项集支持矩阵,提出一种有效的频繁项集挖掘算法-LA。算法利用逻辑与运算挖掘频繁项集,不产生候选项集,且只需扫描数据库一次,所以此算法是非常有效的。  相似文献   

5.
在挖掘关联规则的过程中,关键步骤是产生频繁项集。文中利用逻辑与运算并建立频繁项集支持矩阵,提出一种有效的频繁项集挖掘算法—LA。算法利用逻辑与运算挖掘频繁项集,不产生候选项集,且只需扫描数据库一次,所以此算法是非常有效的。  相似文献   

6.
提出一种信息检索中基于频繁项集的查询优化算法.实验结果表明,该算法有效,其扩展词能提高和改善信息检索性能.  相似文献   

7.
刘芝怡 《科技通报》2014,(4):131-133
在研究传统挖掘频繁项集并行算法的基础上,提出一种以FP-forest为基础的高效能并行挖掘算法FPPMA(FP-forest based high-effect Parallel Mining Algorithm)。此算法中,各运算节点只需要和核心节点之间传递少量信息,而无需和其他运算节点通信,减少了通信费用。此外,运算节点不需要同步和交换数据就可独立挖掘出全局频繁项集。  相似文献   

8.
谭峻松  首照宇 《大众科技》2010,(9):38-40,29
在分析与研究分布式数据挖掘和频繁闭项集挖掘的基础上,通过设计一个Unite_Tree算法构建全局FP-Tree树,并在全局FP-Tree树的基础上设计了一种分布式环境下动态频繁闭项集的挖掘算法D-MFCI。最后,通过仿真实验证明D-MFCI算法可以实现分布式数据库中关联规则的快速挖掘,减少生成规则的冗余度,提高规则的可读性。  相似文献   

9.
针对企业工作效率日益提高的需求,根据现有企业工作流管理系统的不足,对Apriori算法进行优化,提出MWPMA工作流频繁模式挖掘算法。  相似文献   

10.
研究频繁项集模式挖掘优化问题。传统的挖掘算法常产生大规模的候选项集,并且反复扫描数据库,导致频繁项集挖掘时间过长,空间效率太低。为了改进频繁项集挖掘时时间与空间效率低的问题,提出一种高效频繁项集挖掘算法CPT-Mine。此算法利用编码模式树存储事务数据库中的频繁项集信息,构建FP数组,加快产生频繁项集,引入CPT-Mine算法,快速地挖掘数据库中所包含的频繁项集,无需递归构造条件模式树,只需两次扫描数据库即可生成所有频繁项集。最后的实验证明了该算法能缩短挖掘时间3~10 s,空间效率提高43%。  相似文献   

11.
湛宁  宋文军 《科技通报》2013,29(2):195-196,199
研究了基于关联规则的Apriori算法、FP-Growth算法,分析了两类算法的缺点.提出利用遗传算法改进关联规则挖掘算法,给出了属性种群和规则种群的适应度函数,并且给出了具体的算法流程.利用某企业服务网站WEB服务器的使用日志,来测试3种算法的性能.实验结果表明,改进算法的运行时间最短,提高了数据挖掘效率,完全可以应用于电子商务系统中.  相似文献   

12.
高速多目标运动状态监测过程,运动参数的频域徙动导致参数估计和挖掘困难,传统方法对高速频率徙动运动目标参数的挖掘采用MapReduce框架的并行FP-Growth算法,算法需要对运动目标的速度和加速度进行预估计,实现困难。基于多普勒扩散的项集期望支持数模型,提出一种改进的基于闭频繁项集挖掘的高速多目标的运动参数挖掘算法,构建高速多目标运动参数信号模型,采用普勒频率模糊数搜索的方法完成高速多目标的频域徙动动态平滑,准确挖掘出运动参数的相位、时延、速度和频率等相关信息。研究结果表明,该算法能准确拟合时延、速度等运动参数,拟合值与真实值相同,对高速运动目标的运动参数估计精确,在高速运动目标参数挖掘和精确制导等方面具有较高的应用价值。  相似文献   

13.
对大数据的频繁项集挖掘是关联规则挖掘的关键步骤,通过有效的频繁项挖掘提高大数据量数据库的访问效率。传统方法中对大数据的频繁项集挖掘采用FP-Growth的粗糙集挖掘算法,扩展性和容错性不好。提出一种基于贝叶斯粗糙集的大数据频繁项挖掘技术,引入后缀项表的概念,通过后缀项表的构建,保留频繁项集的完整信息。构建FP-Tree,生成闭频繁项集,计算样本的密度,并抽取高密度区域的点集作为聚类中心集合,进行后缀项表的构造,按支持度分成若干集合,对各约简集内的属性集合进行融合,用变精度粗糙集的贝叶斯粗糙进行数据挖掘算法改进,仿真结果表明,算法不受可变参数的影响,鲁棒性较高,数据挖掘的准确度较高,运行时间较短。算法将在人工智能和数据挖掘领域具有更广的应用前景。  相似文献   

14.
传统的关联规则挖掘技术过于依赖数据之间的关联属性,造成挖掘算法在高冗余知识空间关联规则不明显或者较弱的情况下挖掘耗时。本文提出一种应用与高冗余知识空间的优化数据挖掘算法。该算法首先找出最大频繁项集和频繁1-项集进行区域分类,然后利用已有频繁项集找出所有的其它频繁项集,去除冗余关联环境,节省了计算频繁项集的时间,节约了存储空间,使算法的效率得到提高。仿真实验结果证明了改进算法的可行性和有效性。  相似文献   

15.
由于其内在的计算复杂性,在密集型数据序列数据库中挖掘全部频繁项集往往非常困难,解决方案之一是挖掘最大频繁序列。传统的序列模式方法对满足最小支持度阈值的序列同等对待,但在真实数据库中不同的序列往往具有不同的重要程度。为解决上述问题,提出了一种挖掘加权最大频繁序列的新算法。该算法利用频繁项目出现的频率来计算频繁序列的权重,给出了频繁加权序列的定义,该定义的引入不仅可以找出较为重要的最大频繁序列,而且可以使挖掘结果同样具有反单调性,从能够加速剪枝,提高算法效率。实验结果表明,加权最大频繁序列算法是有效的。  相似文献   

16.
分析工程建设监管平台特征,指出平台结构优化的必要性。考虑到不同路径对用户的重要性不同且平台流程复杂,难以统一支持度阈值,采用多最小支持度加权频繁模式算法构建挖掘模型,并根据权值大小对不同路径设置不同的支持度阈值,以尽可能挖掘用户感兴趣的路径集。最后对广西水利建设项目监管平台用户日志进行实验,找出用户频繁访问路径,为平台用户使用体验的优化提供决策支持。  相似文献   

17.
程立平 《大众科技》2005,(8):40-41,39
继Agrawal与Srickant提出关联规则的挖掘的Apriori算法后,数据挖掘进入实质性的实用阶段,并得到飞速发展,在实践应用中发挥重要作用.并随之掀起了海量数据挖掘、数据仓库、OLAP的深入研究.针对海量数据的挖掘,随着事务的增加,数据随之增长,对新增数据采取有效挖掘的研究就变得尤为必要.  相似文献   

18.
枚举搜索剪枝常见方法与技巧   总被引:1,自引:0,他引:1  
搜索是计算机解题中常用的方法,它实质上是枚举法的应用。由于它相当于枚举法,所以其效率是相当地的。因此,为了提高搜索的效率,人们想出了很多剪枝的方法,如分枝定界,启发式搜索等等。在竞赛中,我们不仅要熟练掌握这些方法,而且要因地制宜地运用一些技巧,以提高搜索的效率。  相似文献   

19.
为了适应黄土高原和丘陵山地农林发展需要,减轻农林修剪的劳动强度,设计了一种新型自动剪枝器。该剪枝器主要由移动电源(锂电池、蓄电池)、微型异步电机、固定机构、V型定位机构、伸缩杆、曲柄连杆机构和剪刀刀具组成。经实践证明该装置具有体积小、剪枝效率强、高低空作业等特点。  相似文献   

20.
挖掘最大频繁项目集是数据挖掘领域的一个重要的研究内容。Apriori算法作为一种挖掘频繁项目集的基本算法,其缺点是产生大量的候选项目集,算法的代价很大。本文在基于FP-Tree的基础上提出了挖掘最大频繁项目集的新算法FP-GDMA。该算法采用自顶向下和自底向上相结合的搜索策略有效减少了生产候选项目集的数目,有效提高了挖掘最大频繁项目集的效率。并通过实验比较FP-GDMA与DMFIA算法。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号