首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
通过研究已有的Apriori改进算法,本文对事务数据库进行了改造,在此基础上给出了事务粒的定义,从粒的角度阐述了事务与项集之间的关系.通过约定事务粒之间合成规则,本文设计了基于事务粒的Apriori改进算法,从而将粒计算理论有效地应用于关联规则的挖掘中.  相似文献   

2.
关联规则是数据挖掘的核心内容之一,通过关联规则的挖掘可以找到繁杂的数据中隐藏的有用信息。通过对已经成功就业的学生具备的知识和能力进行关联规则挖掘,可以挖掘出各个行业成功就业需要具备的知识和能力,从而有针对性地指导学生就业和择业。  相似文献   

3.
关联规则挖掘是数据挖掘研究领域中的一个重要任务,旨在挖掘事务数据库中有趣的关联。Apriori算法是关联规则挖掘中的经典算法。然而Apriori算法存在着产生候选项目集效率低和频繁扫描数据等缺点。提出了一种新的Apriori的改进算法,该算法在生成k(k>1)项频繁集时,不需要重新扫描数据库,只是在生成1项频集时,才需要扫描事务数据库,有效地减少了对事务数据库的读操作,在时间复杂度上较经典的Apriori算法有更加优越的性能。  相似文献   

4.
常浩 《太原大学学报》2013,14(2):127-130
数据挖掘是从事务数据库中抽取有用的知识和感兴趣的模式,而从事务数据库中发现关联规则是最常见的挖掘技术之一。提出一个遗传模糊关联规则挖掘框架和综合聚类、模糊和遗传概念的多最小支持度的遗传模糊关联规则挖掘算法。该算法从定量事务数据库中抽取合理的多最小支持度值、隶属函数和模糊关联规则,首先使用k—means聚类算法采集相似项目,然后初始化一个种群设定相同的支持度值,每一个染色体通过需求满足的标准和隶属函数的适应性来评估是否满足其适应度。  相似文献   

5.
关联规则挖掘算法是数据挖掘领域的主要研究方向之一。对几种经典的关联规则挖掘算法进行了分析、探讨和比较,给出了一种基于支持矩阵的、不需要产生候选项目集的算法设计思想。算法为事务数据库中的每个项目设置二进制向量,利用逻辑与运算构造支持矩阵来挖掘频繁项目集,极大地节省了存储空间,提高了算法运行效率。  相似文献   

6.
应用数据挖掘技术对高校就业数据进行了分析,介绍了就业数据预处理过程,并对处理好的数据应用Apriori算法进行关联挖掘,对实验结果进行了总结。  相似文献   

7.
关联规则挖掘是数据挖掘领域中的一个非常重要的研究内容,其主要目标就是发现数据库中一组对象之间某种关联。频繁项集挖掘是关联规则挖掘的关键步骤,它在很大程度上决定了关联规则挖掘的效率。介绍了Apriori算法及其算法改进。该改进算法对剪枝步进行了优化,提高了连接效率,并且不断减小数据库的规模,去掉无效事务,减少了每次扫描数据库所花费的时间,提高了算法效率。经过试验论证,性能比原有算法提高,具有一定的实用性。  相似文献   

8.
FP—Growth算法是关联规则挖掘的一个经典算法。本文提出一种基于事务一项矩阵的挖掘算法MFP—Growth算法,利用向量矩阵表示事务数据库,整个挖掘过程只扫描一遍数据库,通过构造各个频繁项的条件矩阵,利用条件矩阵的向量运算来进行频繁模式的挖掘,减少了算法占用的内存空间,提高了挖掘效率.实验结果表明,MFP—Growth算法是有效可行的.  相似文献   

9.
传统关联规则挖掘算法所讨论的只是一次事务内部的模式,但实际应用中随着时间的推移,事务之间会有某种联系或发展趋势,传统关联规则算法则无法揭示其中的规律。将在SPAM算法的基础上进行改进,加入通用时间约束,提出一个新算法——TSPAM算法。TSPAM算法采纳SPAM算法中的相关概念和方法,在SPAM算法的裁减部分和候选集的生成部分进行改进,对其加入时间约束。实验表明新算法对挖掘具有时间特征的序列模式是行之有效的。  相似文献   

10.
传统关联规则挖掘算法所讨论的只是一次事务内部的模式,但实际应用中随着时间的推移,事务之间会有某种联系或发展趋势,传统关联规则算法则无法揭示其中的规律。将在SPAM算法的基础上进行改进,加入通用时间约束,提出一个新算法——TSPAM算法。TSPAM算法采纳SPAM算法中的相关概念和方法,在SPAM算法的裁减部分和候选集的生成部分进行改进,对其加入时间约束。实验表明新算法对挖掘具有时间特征的序列模式是行之有效的。  相似文献   

11.
关联规则挖掘向来是数据挖掘的一个重要领域,挖掘算法也层出不穷。本文在深入分析FP树特性的基础上,改进了FP树的构造过程,通过一次扫描事务数据库即可生成FP树。从而缩短了关联规则挖掘时间,提高了效率,实验验证了其有效性。  相似文献   

12.
Apriori算法是关联规则挖掘中的经典算法。通过对Apriori算法的基本思想和性能的研究分析,提出了一种基于垂直事务列表的树形结构的挖掘算法,减少了候选频繁项集的数量,提高了挖掘算法的效率。实验结果表明新算法具有良好的性能。  相似文献   

13.
针对关联规则和序列模式中低支持度有用规则的挖掘,提出了基于相对支持度概念的挖掘方法。该方法通过使用分类和聚类分析来识别事务集中的隐含类别,并在识别出的类之上进行关联规则或序列模式分析。相对于传统的关联规则和序列模式分析,该方法能识别出低支持度的有用规则,同时限制了无用规则的产生。实验结果表明,同传统的分析方法相比较,该方法更为合理有效,具有较好的可行性。  相似文献   

14.
在FDM算法的基础上,提出了一种改进的并行关联规则挖掘算法FDM_DT,此算法利用DHP算法中的Hash表技术改进了2阶侯选项集的生成过程,并采用Apriori Tid算法中的Tid表技术对事务数据库中的事务数进行有效消减。因此,此算法在处理大规模数据时有较高的综合效率。  相似文献   

15.
关联规则的挖掘分为两步,首先找出满足最小支持度要求的频繁项目集,然后根据频繁项目集生成满足最小置信度要求的关联规则集.目前对关联规则挖掘的研究主要集中在频繁项集的生成上,然而,作为整个关联规则挖掘的一部分,由频繁项集生成关联规则的算法也有待进一步研究和改进.本文首先对传统的集合操作进行了扩展,然后在扩展集合操作的基础上,提出了由已挖掘出的最大频繁项集生成关联规则的算法ARD-ES,并对算法的复杂度作了理论和实验上的分析.实验表明,ARD-ES算法随着事务数据库容量的增大,时间占用的攀升基本上是线性的,空间占用在某一定值上下波动.  相似文献   

16.
字符串比较是计算机信息处理的重要方法之一。针对现有关联规则挖掘算法不能记忆及利用历史挖掘成果的局限性,提出了将事务数据库转化为项目数据库,构造项目的支持事务标识符有序序列方法。为提高挖掘效率,减少串处理效率较低的负面影响,给出了双序列串比较算法,以及针对串比较的大项目频繁集发现方法。  相似文献   

17.
关联规则挖掘可以发现大量数据中项集之间有趣的关联或相关联系,并已在许多领域得到了广泛的应用.Apriori算法是挖掘关联规则最基本,最核心的算法之一.但Apriori算法只考虑交易中项出现的频率,没有考虑事务集不同项及记录具有不同的重要性,挖掘出来的规则具有一定的局限性.针对这点不足本文提出一种记录加权关联规则挖掘,结合Apriori算法并加以改进,给出相应的New-Aproiri算法.  相似文献   

18.
计算机软件蕴含大量工作信息,有效挖掘软件数据信息之间的内在关联是信息时代对软件应用的潜在要求。针对经典Apriori算法挖掘数据效率低、复杂度高的问题,提出一种改进Apriori算法用于挖掘计算机软件数据的关联规则。为计算机软件算法设置双重支持度阈值,即频繁项集与非频繁项集支持度阈值,快速获得强关联的频繁项集;在此基础上基于映射规则重构事务数据库,压缩数据库规模,减少算法的剪枝操作,降低计算机软件数据关联规则挖掘复杂度。以人力资源类计算机软件数据为例展开关联分析测试,结果显示,该算法挖掘的关联信息与人力资源实际管理情况一致,相比经典Apriori算法其效率有所提升。  相似文献   

19.
关联规则是数据挖掘的重要内容之一.Apriori算法是关联规则挖掘的经典算法,本文对Apriori算法和改进后的FP-Growth算法进行了深入的研究,并以实际的案例进行了算法解析,通过对两种算法的比较与分析,选择FP-Growth算法应用到毕业生信息管理系统中,从大量的毕业生信息出发,找出就业信息与教育信息之间的关系,从而为决策者提供指导或数据支持,指导目前的专业建设、课程改革,促进学校的教学改革,提高人才培养质量.  相似文献   

20.
模糊关联规则的挖掘算法   总被引:2,自引:0,他引:2  
关联规则的挖掘是数据挖掘中的重要内容之一,关联规则包含了一组对象之间的特定关系.目前对关联规则的研究,仅限于用确定和精确的概念表示的确定关联规则.而现实生活中,数据之间的关系通常表现为模糊关系,用确定的关联规则不能表示数据之间的这种关系.为了拓广关联规则的表示和应用范围,本文讨论了模糊关联规则的概念,并提出了一种基于集合枚举树的模糊关联规则的挖掘算法FAAR.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号