首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
Apriori算法是一种挖掘布尔型关联规则的典型算法。该算法在生成频繁项集时会有频繁的数据库扫描操作,并且在由低维频繁项集连接生成高维候选项集时,如果频繁项集维数过大,笛卡尔积后就会产生大量的候选项集,从而影响算法的效率。针对上述2个方面对Apriori算法进行改进,并将改进后的算法应用在试卷分析系统中。经过系统测试,改进后的算法具有较高的效率和较强的稳定性。  相似文献   

2.
对数据挖掘技术关联分析Apriori算法做了介绍,并对Apriori算法做了分析,指出其在候选项集比较多的情况下效率低下的缺点,最后提出了利用建立临时数据库的方法来提高Apriori算法的效率。  相似文献   

3.
提出采用事务压缩和哈希技术相结合方式的改进算法.该算法通过备份数据库Dk生成候选项目集Ck,在生成Ck的同时计算支持度.针对生成频繁2-项目集L2的瓶颈,在生成L2的时候使用DHP算法.从时间复杂度上对Apriori算法和改进算法进行比较,说明改进算法在效率上优于Apriori算法.  相似文献   

4.
通过研究已有的Apriori改进算法,本文对事务数据库进行了改造,在此基础上给出了事务粒的定义,从粒的角度阐述了事务与项集之间的关系.通过约定事务粒之间合成规则,本文设计了基于事务粒的Apriori改进算法,从而将粒计算理论有效地应用于关联规则的挖掘中.  相似文献   

5.
为挖掘公司股东关联关系,选用数据挖掘中关联规则的经典Apriori算法,使用Python编程语言对金融行业公司股东进行关联分析.在支持度阈值为10%、置信度阈值为70%条件下,挖掘出12条强关联规则,如香港中央结算有限公司(陆股通)、中央汇金资产管理有限责任公司共同投资某金融企业时,中国证券金融股份有限公司投资可能性达...  相似文献   

6.
关联规则可在庞大的数据集中找出不同事务之间隐藏的关系,其中Apriori算法是关联规则分析中较为有效的办法。然而,Apriori算法产生候选项集的效率较低且扫描数据过于频繁,造成算法计算需要耗费较长时间。另外,初始定义的最小支持度与最小置信度也不足以过滤无用的关联规则。针对以上问题,利用概率理论与有效的参数设置,在原有Apriori算法基础上,提出一种基于概率事务压缩的关联规则改进算法。数值算例结果表明,新算法可在第二次迭代之后,大幅减少低效候选项集,从而提升经典Apriori算法效率。  相似文献   

7.
关联规则挖掘通过发现密切相关项集的方法已经在商业决策中被广泛使用.现针对关联规则挖掘的经典算法Apriori需要重复多次扫描整个数据库导致在空间和时间方面有很大负载的问题,提出了根据研究者所感兴趣的项集作为关联规则的结果,采用对数据库进行类标签压缩来减少迭代次数.通过实验显示该方法可以有效提高Apriori算法的效率.  相似文献   

8.
提出了一种新的Apriori改进算法,该算法在生成k项频繁集时,不需要多次扫描数据库,有效地减少了对事务数据库的读操作,较经典的Apriori算法有更加优越的性能。  相似文献   

9.
陈建辉 《宜春学院学报》2007,29(4):87-88,122
在对关联规则挖掘算法Apriori进行深入研究的基础上,提出了一种改进的算法SDA算法,在三个方面进行了改进:(1)频繁2-项集生成方法;(2)改进Apriori_gen算法(3)减少事务数据库.在实验数据集上所做的实验结果表明SDA算法是有效的.  相似文献   

10.
为衡量学生时知识的掌握程度、检查教学效果、不断提高教学质量,运用SPSS15.0对郑州航空工业管理学院2007级2008-2009学年第一学期2609名学生的<线性代数>期末考试试卷进行抽样,并对抽样结果进行统计分析.结果显示试卷的难度系数为0.78,区分度为0.398,信度0.79,质量良好,大部分学生对重点难点知识掌握较好,但还应注意适当增加试卷的难度.  相似文献   

11.
关联规则挖掘是数据挖掘研究领域中的一个重要任务,旨在挖掘事务数据库中有趣的关联。Apriori算法是关联规则挖掘中的经典算法。然而Apriori算法存在着产生候选项目集效率低和频繁扫描数据等缺点。提出了一种新的Apriori的改进算法,该算法在生成k(k>1)项频繁集时,不需要重新扫描数据库,只是在生成1项频集时,才需要扫描事务数据库,有效地减少了对事务数据库的读操作,在时间复杂度上较经典的Apriori算法有更加优越的性能。  相似文献   

12.
13.
针对经典的Ap606算法耗费大量的时间和空间的特点,提出基于模式矩阵的关联规则算法。该算法扫描数据库次数为一次,降低了挖掘的时间复杂度;扫描后的数据库以矩阵形式存放,减少空间复杂度。并应用具体事例进行验证,对效率进行了比较。  相似文献   

14.
介绍入侵检测系统的基本知识,提出了一个基于数据挖掘技术的入侵检测系统,该系统采用了关联规则中的Apriori算法挖掘入侵模式,实现了规则库的自动更新,极大地提高了系统的整体性能。另外对基本Apriori算法提出了改进算法,此改进算法提高了扫描入侵数据库过程中的信息获取率,缩减了项集的潜在规模,提高了入侵检测规则生成的效率。  相似文献   

15.
在数据挖掘算法中,Apriori算法是关联规则的经典算法。文章在分析经典Apriori算法的基础上,提出了改进型的Apriori算法。改进后的算法对事务数据库进行两次压缩,减少事务数据库的平均长度,提高了数据挖掘的效率,具有一定的实用性。  相似文献   

16.
Apriori关联规则挖掘算法分析与改进   总被引:1,自引:0,他引:1  
对数据挖掘及关联规则挖掘的定义及相关概念作了简单的介绍,对基于关联规则的Apriori算法基本思想及其核心算法作了深入剖析,提出了该算法的瓶颈问题,并就此问题提出了改进思路,同时对改进的Apriori算法进行了评价.  相似文献   

17.
研究实现了一种改进的Apriori算法,通过对事务集进行扫描、删除对k一项频繁集无意义的事务,降低事务处理过程中频繁的连接次数来提高算法的效率.对图书借阅相关性挖掘的实际应用表明,随着数据量的增大,改进Apriori算法的时间效率可以提高10%以上.  相似文献   

18.
本文在研究了多维关联规则数据挖掘的理论及方法的基础上,深入分析以往算法的优缺点并结合图书馆行业管理信息系统的特点,选择对Apriori算法结合数据立方体技术进行改进和优化,形成了适合利用多维关联规则对图书馆数据进行挖掘的新算法。  相似文献   

19.
关联规则挖掘是一种最有影响的数据挖掘技术。它在交易数据库或其他数据仓库项目集之中提取有意义的关联,频繁模式和关联。大多数现有的算法发现频繁模式都需要多次遍历数据库,导致大量的磁盘读取,造成了巨大的I/O负载。为了减少重复读盘,本文提出了一种新的自上而下的方法,即Apriori算法的改进版本,此算法大大降低了数据库的扫描次数,避免生成不必要的模式而减少了数据库的扫描,节省了大量的时间和空间。  相似文献   

20.
为了分析计算机专业课开设的学期是否合理,在深入研究Apriori关联规则算法的基础上,采用Apriori算法对大学四年的计算机专业课成绩进行了关联分析实验,实验结果表明该方法能够验证各门课程开设的顺序是否合理,取得了良好的应用效果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号