首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
针对数据挖掘在网络游戏中的应用,提出了游戏访问模式挖掘的概念,并给出一种适用于挖掘游戏访问模式的Apriori_Trie_GAPM算法,该算法基于Apriori算法思想,采用trie树生成并存储频繁项集,trie树生成采用宽度优先策略,按游戏访问频繁度升序生成每层节点,节点支持度计算应用事务投影策略并结合了游戏使用时间.  相似文献   

2.
提出了一种挖掘频繁项目集的有效算法——FFP-Growth,该算法采用自底向上的策略搜索频繁模式树,但不同于FP-Growth的是它无须生成条件模式基和频繁模式子树,且生成的频繁模式树较TD-FP-Growth生成的频繁模式树小,因而能提高关联规则的挖掘效率.类似于TD-FP-Growth的扩展TD-FP-Growth(M)和TD-FP-Growth(C),FFP-Growth很容易被扩展,以此来有效地减小搜索空间.实验结果表明本提出的算法是有效可行的.  相似文献   

3.
为了解决频繁闭项目集挖掘中时间和存储开销大的问题,提出了一种基于FC-tree(频繁闭模式树)的频繁闭项目集挖掘算法max-FCIA(最大频繁闭项目集挖掘算法).该算法利用哈希表映射事务数据库,通过对哈希表进行操作从而得到所有频繁项目集的支持度,进而生成包含所有频繁项目的有序树.经过剪枝处理的有序树就是包含所有最小频繁闭项目集的FC-tree,最后用最小频繁闭项目集生成频繁闭项目集.实验结果表明,该算法通过映射事务数据库,减少了扫描数据库所浪费的时间,提高程序执行效率.另外,运用有效的剪枝策略,避免了不必要候选项目集的生成,节省了存储空间,实验证明该算法是有效的.  相似文献   

4.
为了解决频繁树模式挖掘中频繁子树的数目通常太大的问题,提出了频繁子树精简基的概念,精简基由相对于一系列支持度阈值的最大频繁子树组成,它是频繁子树的一个子集,可用来估计任一频繁子树的支持度,并能将误差控制在确定范围内.提出了一个在带标号的有根的有序树的数据库中挖掘这种子树精简基的算法,该算法采用最右扩展方法系统地生成所有的频繁有序有根子树.采用的剪枝技术能尽早地剪掉一些不可能生成最大频繁子树的分枝,还采用了启发式的技术来安排计算的次序以尽可能避免代价高的计算.实验结果表明该精简基的大小不到全集的10%,算法的性能也比挖掘全集的算法要高.  相似文献   

5.
大部分关联规则算法的提出是基于项目的频率值,若从成本、利润和用户的偏好考虑,传统的数据库挖掘频繁模式在现实世界中并不适合应用.本文基于FP-tree提出了一种高效用的模式树HUP-tree挖掘算法.该算法利用在数据库中基于向下封闭性产生压缩的树结构,以达到挖掘出高效用项的目的.实验表明该方法无论是在执行时间上,还是在生成的树的节点数量上,其性能均优于FP-tree.  相似文献   

6.
随着互联网的快速发展,频繁模式的挖掘从以往的频繁项集逐渐发展到了结构化的数据,主要包括频繁子树挖掘和频繁子图挖掘。介绍了频繁子树挖掘算法的基本概念及研究现状,对有序树挖掘算法和无序树挖掘算法进行分析,并实现树挖掘相关算法,比较算法的效率和有效性。  相似文献   

7.
针对传统基于ε-差分隐私模型的top-k关联规则挖掘算法在大规模数据环境下挖掘效率低下的问题,提出了一种并行差分隐私关联规则挖掘算法。算法利用Hadoop框架实现并行计算,利用负载均衡策略,使每一个节点分配到的数据量相当,利用指数机制挑选出k个频繁模式,采用拉普拉斯机制对这k个频繁模式添加噪音。通过实验对算法的频繁模式挖掘结果与同类算法进行比较分析,结果表明,该算法在保证挖掘结果具有可用性的前提下,在效率上较传统算法有所提升。  相似文献   

8.
分析了挖掘频繁访问模式的过程和当前Apriori算法的缺陷,提出了一种Apriori算法的改进算法:BLApriori算法.改进的算法采用不规则数组来保存项集信息,有效省去了扫描数据库所耗费的大量时间.将项集有序性引入到该数组上,减少了候选项集的个数.并采用二进制来表示1阶频繁访问模式,提高了模式匹配和连接的效率.试验结果表明,该改进算法能更有效地发现各种长度不同的访问模式.  相似文献   

9.
挖掘最大频繁项目集是多种数据挖掘应用中的关键问题,其挖掘过程的高花费要求对高效更新算法进行深入研究。为此,我们在改进频繁模式树(FP-Tree)的基础上提出了处理最小支持度和数据库都发生变化时的最大频繁项目集更新算法FUMFIA(Fast Updating Maximal Frequent Itemsets Algorithm)。通过对实验结果的分析可以看出,该算法在进行更新挖掘时具有很好的时空效率。  相似文献   

10.
本文考虑到节点度的代价问题 ,提出了广义最小生成树的概念 ,并分析了最小生成树在实际应用中的局限性 .针对一般遗传算法求解该问题的不足 ,提出了自调整的变异算子和混合选择策略 .通过仿真 ,证明了广义最小生成树模型的适用性 .最后将改进前后两种算法的仿真结果进行比较 ,证明了改进后遗传算法的有效性 .  相似文献   

11.
频繁项目集挖掘是数据挖掘应用研究的一个重要研究内容.文章在FP-Growth算法的基础上,提出了一种基于集合的频繁项目集挖掘算法,该算法直接对FP-tree进行挖掘,不需要产生节点的条件模式基,因此在挖掘频繁模式集时节省了空间和时间,提高了算法的执行效率.最后对该算法进行了实例分析.  相似文献   

12.
介绍了频繁模式挖掘的相关概念和基本定理,提出了基于事务模式树的分层挖掘算法。该算法首次提出并实现了可累加挖掘,并以实例分析进行了验证。  相似文献   

13.
该文构建了基于Web使用挖掘的个性化教育资源推荐系统原型,讨论了Web使用挖掘技术在教育资源网站中的应用.提出了改进的基于引用时长的事务识别方法。并采用改进的频繁访问路径挖掘算法挖掘用户热门访问路径,进一步主动推送用户感兴趣的资源,提高系统的个性化服务水平.  相似文献   

14.
将Web使用记录挖掘技术应用于电子商务网站中.以Web log文件作为数据源,通过聚类算法以及浏览兴趣模式算法实现对用户日志进行挖掘,得出用户浏览兴趣度模式,实现兴趣模式的表示,并最终提供电子商务网站个性化访问服务,很好地改进了电子商务网站的营销策略,有效地促进电子商务的发展.  相似文献   

15.
FP-growth算法是关联规则挖掘算法中的经典算法,用于挖掘频繁项目集。但它的时间和空间效率还不足够高。提出了一种新的频繁模式树构造方法,性能得以提高。  相似文献   

16.
量子遗传算法求解度约束最小生成树   总被引:1,自引:0,他引:1  
度约束最小生成树问题属于NP完全问题,但在现实中具有非常重要的应用价值.针对度约束最小生成树问题,采用量子遗传算法来求解该问题.并对基本的量子遗传算法进行改进.针对度约束最小生成树问题的特征,设计了一种新的量子编码方式,保证算法获得可行解;并与深度优先搜索的思想结合,保证得到树的连通性;通过数值试验验证新算法的可行性,并与其他算法进行比较.取得了良好的效果.  相似文献   

17.
介绍电子商务和Web数据挖掘的概念,并介绍Web使用挖掘中应用最多的技术——Web日志挖掘.重点阐述了日志挖掘算法——关联规则的有关知识,以及改进的频繁项目集生成算法Apriori和强关联规则生成算法,并结合实例进行了分析研究.  相似文献   

18.
提出了一种新的挖掘最大频繁集的深度优先算法GMPV。该算法利用集合枚举树,并用位置向量来表示项目子集,挖掘过程中使用了超集检测和基于支持度的剪枝技术,减少了某些项目子集的支持度计算。  相似文献   

19.
本文探索了一种新的Web日志挖掘算法,以便更有效地捕获用户访问模式.该算法首先把原始的用户访问序列转换为一个最长前向访问序列的集合,在转换中过滤掉了用户的回退操作;算法的第二步是根据第一步所得到的结果求得一个用户频繁访问模式.算法经实验模拟测试具有较为满意的时间复杂度和空间复杂度.  相似文献   

20.
关联规则的挖掘分为两步,首先找出满足最小支持度要求的频繁项目集,然后根据频繁项目集生成满足最小置信度要求的关联规则集.目前对关联规则挖掘的研究主要集中在频繁项集的生成上,然而,作为整个关联规则挖掘的一部分,由频繁项集生成关联规则的算法也有待进一步研究和改进.本文首先对传统的集合操作进行了扩展,然后在扩展集合操作的基础上,提出了由已挖掘出的最大频繁项集生成关联规则的算法ARD-ES,并对算法的复杂度作了理论和实验上的分析.实验表明,ARD-ES算法随着事务数据库容量的增大,时间占用的攀升基本上是线性的,空间占用在某一定值上下波动.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号