首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 140 毫秒
1.
提出了一种挖掘频繁项目集的有效算法——FFP-Growth,该算法采用自底向上的策略搜索频繁模式树,但不同于FP-Growth的是它无须生成条件模式基和频繁模式子树,且生成的频繁模式树较TD-FP-Growth生成的频繁模式树小,因而能提高关联规则的挖掘效率.类似于TD-FP-Growth的扩展TD-FP-Growth(M)和TD-FP-Growth(C),FFP-Growth很容易被扩展,以此来有效地减小搜索空间.实验结果表明本提出的算法是有效可行的.  相似文献   

2.
基于对数据挖掘,特别是关联规则挖掘的研究,提出了一种改进型遗传算法的关联规则提取算法,并从编码方法、适应度函数的构造和遗传算子的设计方面进行讨论分析。通过对早熟问题的分析并改进自适应算子,提高了算法的效率,使算法在相对稳定的动态种群规模中寻找优质解。  相似文献   

3.
Web日志挖掘是对用户与Web服务器在交互时产生的数据,采用数据挖掘技术发现隐含的规律性知识。首先对Web日志挖掘进行了概述,重点研究了关联规则算法中的Apriori算法,并对Apriori算法进行了改进,最后给出具体实例。  相似文献   

4.
关联规则挖掘的核心问题是算法的效率和伸缩性,这就产生了基于约束的关联规则挖掘方法。关联规则挖掘中除了支持度和信任度外的约束外,最基本的是项目约束。本文总结和归纳了含有项目约束的关联规则挖掘的分类,并在算法Apriori的基础上,介绍了基于项目约束的关联规则的挖掘算法D irect。  相似文献   

5.
随着计算机网络的快速发展,Web数据量呈快速增长,在海量的Web数据中发现有价值的数据和知识,是数据挖掘技术的重要应用.分析和研究Web数据挖掘的内容和过程,介绍Web数据挖掘的算法十分必要.  相似文献   

6.
设计了一种基于遗传算法的关联规则算法,该算法将遗传算法和关联规则相结合.对遗传算法的编码方法、适应度函数的构造、交叉算子和变异算子进行了分析,给出了所设计方法的具体步骤,并进行了试验.试验表明,改进后的算法的执行效率高于Apriori算法.  相似文献   

7.
介绍了关联规则的基本概念和分类方法,分析了典型的Apriori算法,并描述了Apriori算法的性能瓶颈与改进策略.最后展望了关联规则挖掘的进一步研究方向.  相似文献   

8.
基于空间数据的关联规则挖掘算法及实现   总被引:1,自引:0,他引:1  
空间数据挖掘就是从空间数据库中抽取隐含的知识,空间关系或是空间数据库中存储的其它的隐含的模式的过程。空间关联规则是空间数据挖掘的一个重要表现形式,利用空间关联规则把空间数据库中的数据转化为知识是一个很好的方法。本文给出了一种基于空间数据的关联规则挖倔算法,并给出了实例。  相似文献   

9.
针对现有基于数据挖掘的文件关联性复制算法无法有效提取文件关联性的问题,提出了基于极大频繁关联模式挖掘的分散群复制算法(Decentralized Replication strategy based on Maximal Frequent Correlated Patterns,DRMFCP)。DRMFCP算法通过二进制历史文件转换、极大频繁关联模式挖掘和复制,以实现极大减少复制模式数量、消除冗余以及优化复制的目的。数据分析与仿真结果表明,在不同存取模式下相较于无复制、DR2、PRA和PDDRA算法,DRMFCP算法提取文件关联性的效率更高,并能同时降低作业执行平均时间,为降低网格数据传输延迟提供新的解决方案。  相似文献   

10.
从大量事务记录中发现有意义的关联规则,可以帮助做出许多商务决策,如分类设计、交叉购物,从而提高销售额度和利润.一种基于链表族数据结构的关联规则挖掘的改进方法,性能明显优于Apriori算法.由于该方法只需访问数据库一次,时于挖掘海量数据其性能尤为明显.  相似文献   

11.
对数据挖掘中的关联规则和序列模式的概念和作用进行了探讨,对关联规则中寻找大项集的部分应用程序加以实现,同时对两种模式的实现过程用程序流程的方式加以说明,并讨论了几种不同的实现算法。  相似文献   

12.
Apriori算法是关联规则挖掘技术中的一个经典算法。笔者通过对该算法的思想和性能分析,认为它存在两方面的不足。本文提出了一种提高频繁项集挖掘算法效率的优化方法。实验表明,该优化算法对提高频繁项集挖掘算法的效率是有效的。  相似文献   

13.
关联规则挖掘是一种最有影响的数据挖掘技术。它在交易数据库或其他数据仓库项目集之中提取有意义的关联,频繁模式和关联。大多数现有的算法发现频繁模式都需要多次遍历数据库,导致大量的磁盘读取,造成了巨大的I/O负载。为了减少重复读盘,本文提出了一种新的自上而下的方法,即Apriori算法的改进版本,此算法大大降低了数据库的扫描次数,避免生成不必要的模式而减少了数据库的扫描,节省了大量的时间和空间。  相似文献   

14.
关联规则是数据挖掘领域的一个重要分支。随着大量数据的收集和存储,人们对于从数据库中挖掘关联规则越来越感兴趣,Apriori算法就是经典的关联挖掘算法。文章分析了Apriori的算法思想、算法描述及实际应用。  相似文献   

15.
为探究在线协作学习中基于问题解决讨论活动的群组交互行为模式,文章提出协作问题解决的协作讨论活动行为编码表,将协作问题解决中的重要行为特征进行分类编码。基于关联规则挖掘算法,自动化地挖掘协作问题解决中具有高转换率的行为序列。通过开展实证研究,探究影响协作质量的重要行为模式。研究结果表明,在协作过程中学生们修订观点、争论、采用证据以及良好的管理等行为对群组协作都具有积极意义。该研究为教育工作者构建基于问题解决的在线协作讨论活动提供了有利依据和重要参考。  相似文献   

16.
利用决策树数据挖掘技术对英语专业学生相关数据信息开展了实验研究,提出了基于实验数据集的决策树挖掘模型,并据此提取了英语专业学业影响因素的关联规则.  相似文献   

17.
数据挖掘应用极大地推动了人们掌握、处理信息的能力,本文主要介绍了数据挖掘中的关联规则,关联规则中的经典算法Apriori算法,以及Apriori算法存在的不足,提出了Apfiori算法的改进研究,  相似文献   

18.
分布式算法具有高度的适应性、可伸缩性、低性能损耗和容易连接等特性,可以作为挖掘关联规则的理想平台。分布式系统环境下实现高效分布式算法的方法。数据挖掘同关系数据库的关系,实现算法对数据库结构的要求,明确在实现中需要解决的几个核心问题。  相似文献   

19.
关联规则的数据挖掘系统结构及模型的研究   总被引:1,自引:0,他引:1  
数据挖掘是一种数据分析处理技术,其主要特点是对数据库、数据仓库或其它数据源中的数据进行抽取、转换、分析和其它模型化处理,从中提取辅助企业和科研决策的知识。关联规则挖掘是数据挖掘技术的一个重要研究方向。本文对基于关联规则的数据挖掘技术进行了研究,并提出了一个数据挖掘工具集原型。  相似文献   

20.
发现关联规则是数据挖掘技术的重要任务之一。之前提出的绝大多数算法需要多次遍历数据库才能产生频繁项集,造成巨大的CPU和内存开销。根据网上交易数据海量的特点,提出了一种基于频繁模式增长(FP-growth)的并行算法。该算法可以在不产生候选集的基础上并行的挖掘海量数据。试验证明该算法可以缓解了项目数量巨大而内存不足的矛盾,减少了算法的执行时间。利用该算法对网上交易进行关联规则挖掘,发现了有价值的决策支持信息。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号