首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 93 毫秒
1.
对数据流频繁项挖掘的主要算法包括基于Hash的方法和基于抽样的方法,以及更为高效和动态性更强的算法等进行了分类论述和比较,讨论了存在的主要问题和未来研究方向。  相似文献   

2.
频繁项集挖掘算法研究   总被引:2,自引:0,他引:2  
在数据库中挖掘频繁项集是数据挖掘领域的最基本、最重要的问题。自从Agrawal的开创性工作以来,有关研究从未停止过。然而由于其内在的计算复杂性,这一问题并未完全解决。通过描述频繁项集挖掘的特点,并根据解空间的分类对已有各种频繁项集、闭频繁项集、最大闭频项集和不生成频繁项集的挖掘算法进行了分析和比较。  相似文献   

3.
针对企业工作效率日益提高的需求,根据现有企业工作流管理系统的不足,对Apriori算法进行优化,提出MWPMA工作流频繁模式挖掘算法。  相似文献   

4.
[目的/意义] 虽然移动政务系统资源的碎片化,功能的交互化以及服务的个性化程度越来越高,但是其被弃用和卸载的情形时有发生,究其原因是因为移动政务系统并没有为用户在合适的时间和合适的地点推送合适的信息,表现为其所提供服务的同质化现象较为严重。[方法/过程] 为此,采用最大频繁模式挖掘的方法对移动政务系统场景化服务进行深入研究,在对不同用户聚类的基础上挖掘不同类型用户频繁接入的场景,并基于挖掘出的规律为用户提供针对性的服务。[结果/结论] 移动政务系统的场景化服务既能为用户在任何时间、任何地点提供任何信息,也可以为用户在适当的时间和地点推送适当的信息,移动政务系统场景化服务就是要从满足用户的多元化和个性化服务的方式转向满足用户的场景化信息需求,由以用户为中心转向于以场景为中心,最终提升移动政务用户信息接受的愉悦度。  相似文献   

5.
针对频繁项集挖掘时间与空间效率低的问题,提出一种基于New FP-tree的高效频繁项集挖掘算法。此算法利用New FP-tree结构存储事务数据库中的频繁项集信息,无需递归构造条件模式树,仅需两次扫描数据库即可生成所有频繁项集。最后的实验证明了该算法的有效性。  相似文献   

6.
由于其内在的计算复杂性,在密集型数据序列数据库中挖掘全部频繁项集往往非常困难,解决方案之一是挖掘最大频繁序列。传统的序列模式方法对满足最小支持度阈值的序列同等对待,但在真实数据库中不同的序列往往具有不同的重要程度。为解决上述问题,提出了一种挖掘加权最大频繁序列的新算法。该算法利用频繁项目出现的频率来计算频繁序列的权重,给出了频繁加权序列的定义,该定义的引入不仅可以找出较为重要的最大频繁序列,而且可以使挖掘结果同样具有反单调性,从能够加速剪枝,提高算法效率。实验结果表明,加权最大频繁序列算法是有效的。  相似文献   

7.
分析工程建设监管平台特征,指出平台结构优化的必要性。考虑到不同路径对用户的重要性不同且平台流程复杂,难以统一支持度阈值,采用多最小支持度加权频繁模式算法构建挖掘模型,并根据权值大小对不同路径设置不同的支持度阈值,以尽可能挖掘用户感兴趣的路径集。最后对广西水利建设项目监管平台用户日志进行实验,找出用户频繁访问路径,为平台用户使用体验的优化提供决策支持。  相似文献   

8.
研究频繁项集模式挖掘优化问题。传统的挖掘算法常产生大规模的候选项集,并且反复扫描数据库,导致频繁项集挖掘时间过长,空间效率太低。为了改进频繁项集挖掘时时间与空间效率低的问题,提出一种高效频繁项集挖掘算法CPT-Mine。此算法利用编码模式树存储事务数据库中的频繁项集信息,构建FP数组,加快产生频繁项集,引入CPT-Mine算法,快速地挖掘数据库中所包含的频繁项集,无需递归构造条件模式树,只需两次扫描数据库即可生成所有频繁项集。最后的实验证明了该算法能缩短挖掘时间3~10 s,空间效率提高43%。  相似文献   

9.
谭峻松  首照宇 《大众科技》2010,(9):38-40,29
在分析与研究分布式数据挖掘和频繁闭项集挖掘的基础上,通过设计一个Unite_Tree算法构建全局FP-Tree树,并在全局FP-Tree树的基础上设计了一种分布式环境下动态频繁闭项集的挖掘算法D-MFCI。最后,通过仿真实验证明D-MFCI算法可以实现分布式数据库中关联规则的快速挖掘,减少生成规则的冗余度,提高规则的可读性。  相似文献   

10.
利用卷烟产品历史销售数据中蕴含的信息以制订更加合理的卷烟产品营销策略,采用比较高效的关联规则FP-Growth算法设计了卷烟产品销售决策支持系统,实践应用表明,该系统能快速地发现不同时期卷烟产品销售的关联关系,为营销人员及时掌握销售规律提供了有价值的参考。  相似文献   

11.
随着信息化进程的推进,在很多重要应用领域发现了大量的不确定性数据,概率是解决不确定信息的比较适用的方法。经典关系数据库处理不了具有概率的数据,所以要对此种数据库在这方面加以推广,也就是概率数据模型。在概率数据库中使用传统的查询方法会使查询结果出现偏差,不能满足用户的需求。因此,基于不确定数据的查询处理受到了越来越多的关注。对此进行了研究。  相似文献   

12.
在当今类似车载系统中常有需要我们在物体时空运动数据库中进行数据挖掘,然后根据得到的规则预测物体的运动趋势的需求。至今,对于由时空两方面描述的数据进行挖掘的研究还没有特别明确的方法。提出MINE_ALLFP算法来发现所有的频繁集。为了增加研究的可行性,去掉位置信息的连续性,提出将整个大空间分割为若干个小区域的方法,这里还引进一种好的剪枝算法。  相似文献   

13.
对大数据的频繁项集挖掘是关联规则挖掘的关键步骤,通过有效的频繁项挖掘提高大数据量数据库的访问效率。传统方法中对大数据的频繁项集挖掘采用FP-Growth的粗糙集挖掘算法,扩展性和容错性不好。提出一种基于贝叶斯粗糙集的大数据频繁项挖掘技术,引入后缀项表的概念,通过后缀项表的构建,保留频繁项集的完整信息。构建FP-Tree,生成闭频繁项集,计算样本的密度,并抽取高密度区域的点集作为聚类中心集合,进行后缀项表的构造,按支持度分成若干集合,对各约简集内的属性集合进行融合,用变精度粗糙集的贝叶斯粗糙进行数据挖掘算法改进,仿真结果表明,算法不受可变参数的影响,鲁棒性较高,数据挖掘的准确度较高,运行时间较短。算法将在人工智能和数据挖掘领域具有更广的应用前景。  相似文献   

14.
付淇  黎虹  李广振 《科技广场》2010,(1):237-240
流数据挖掘技术是数据挖掘领域的新研究方向之一,而聚类研究又是其重要的内容。本文介绍了流数据基本特点,在统一流聚类表示模型的基础上,对现有流数据聚类算法进行了总结,并进一步提出了流数据聚类技术的研究方向和前景。  相似文献   

15.
近年来,数据挖掘引起了信息产业界的极大关注,人们希望通过对数据的深入分析与研究,将数据转换成有用的信息和知识.本文讲解了在KDD过程模型中被采用率较高的CRISP-DM模型,对其生命周期进行分析,并在此基础上介绍了数据挖掘标准中的PMML预言模型标记语言,详细分析了PMML语言中的关联分析模型.  相似文献   

16.
国内数据挖掘工具研究综述   总被引:2,自引:0,他引:2  
在对国内数据挖掘工具的相关文献计量分析的基础上,综述了其三大研究主题:数据挖掘工具的分类、数据挖掘工具的介绍与开发、数据挖掘工具比较与评价,并归纳了数据挖掘工具研究的两个发展方向:专业领域数据挖掘工具的开发、数据挖掘工具的分类评价.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号