共查询到19条相似文献,搜索用时 241 毫秒
1.
2.
关联规则挖掘是数据挖掘领域中的一个非常重要的研究内容,其主要目标就是发现数据库中一组对象之间某种关联。频繁项集挖掘是关联规则挖掘的关键步骤,它在很大程度上决定了关联规则挖掘的效率。介绍了Apriori算法及其算法改进。该改进算法对剪枝步进行了优化,提高了连接效率,并且不断减小数据库的规模,去掉无效事务,减少了每次扫描数据库所花费的时间,提高了算法效率。经过试验论证,性能比原有算法提高,具有一定的实用性。 相似文献
3.
4.
关联规则是数据挖掘的重要研究方向之一,Apriori算法是利用关联规则进行数据挖掘中的一个最经典的算法。通过对Apriori算法进行研究分析,发现该算法具有产生大量候选项集和多次扫描数据库的缺点。提出了一种基于矩阵按位存储的改进型Apriori算法,该算法将数据库中的数据读入内存,用矩阵按位存储数据,使用按位运算计算项集的支持数,提高了支持数计数的效率,从而提高了关联规则挖掘的速度和效率。 相似文献
5.
6.
在FDM算法的基础上,提出了一种改进的并行关联规则挖掘算法FDM_DT,此算法利用DHP算法中的Hash表技术改进了2阶侯选项集的生成过程,并采用Apriori Tid算法中的Tid表技术对事务数据库中的事务数进行有效消减。因此,此算法在处理大规模数据时有较高的综合效率。 相似文献
7.
Apriori算法是关联规则挖掘中的经典算法。在Apriori算法中,使用频繁项集的先验知识,逐层搜索的迭代方法,通过扫描数据库,累积每个项的计数,并收集满足最小支持度的项,找每个Lk都需要扫描一次数据库。算法的效率随着数据量的增大,频繁项集的增多,算法的效率就非常的低,本文通过对Apriori算法分析,应用散列、事务压缩、划分、抽样等方法,最大可能的减少数据库扫描的次数,快速发现频繁项集,提高Apriori算法的效率。 相似文献
8.
关联规则在数据挖掘中扮演着十分重要的角色,而Apriori算法和FP-growth算法是当前关联规则中两大主要算法。其中Apriori算法的主要开支是产生大量候选项集和重复遍历数据库,FP-growth算法的主要开支是重复创建和遍历条件FP树。在介绍两种算法基础上,提出了一种新的算法,使Apriori算法产生的候选项集不是查找数据库而是查找FP-tree来确定是否为频繁项集。实际测试表明,在一定的条件下,新算法的效率高于原先的两种算法。 相似文献
9.
本文提出了一种改进的Apriori算法。解决经典的Apriori算法的瓶颈,通过对数据库中小于最小支持度的项集进行剪枝,减少数据库中的事物数量来提高下次扫描的效率,同时改变产生候选集的函数,生成连续的访问页面。改进算法提高了网上学习模型的智能性。 相似文献
10.
介绍了关联规则的相关概念及理论知识,然后针对关联规则的经典算法Apriori算法提出了改进,即Apriori-high算法,以及改进算法的好处,最后介绍了关联规则在图书馆中的应用,可以提高读者的效率,更好的为读者服务。 相似文献
11.
Apriori算法是关联规则挖掘中的经典算法。通过对Apriori算法的基本思想和性能的研究分析,提出了一种基于垂直事务列表的树形结构的挖掘算法,减少了候选频繁项集的数量,提高了挖掘算法的效率。实验结果表明新算法具有良好的性能。 相似文献
12.
基于改进特征提取及聚类的网络评论挖掘研究 总被引:1,自引:0,他引:1
[目的/意义]针对信息过载条件下中文网络产品评论中特征提取性能低以及特征聚类中初始中心点的选取问题。[方法/过程]本研究提出采用基于权重的改进Apriori算法产生候选产品特征集合,再根据独立支持度、频繁项名词非特征规则及基于网络搜索引擎的PMI算法对候选产品特征集合进行过滤。并以基于HowNet的语义相似度和特征观点共现作为衡量产品特征之间关联程度的特征,提出一种改进K-means聚类算法对产品特征进行聚类。[结果/结论]实验结果表明,在特征提取阶段,查准率为69%,查全率为92.64%,综合值达到79.07%。在特征聚类阶段,本文提出的改进K-means算法相对传统算法具有更优的挖掘性能。 相似文献
13.
关联规则挖掘算法是数据挖掘领域的主要研究方向之一。对几种经典的关联规则挖掘算法进行了分析、探讨和比较,给出了一种基于支持矩阵的、不需要产生候选项目集的算法设计思想。算法为事务数据库中的每个项目设置二进制向量,利用逻辑与运算构造支持矩阵来挖掘频繁项目集,极大地节省了存储空间,提高了算法运行效率。 相似文献
14.
15.
关联规则挖掘是从大量的数据中挖掘出有价值描述数据项之间相互联系的有关知识。本文对Apriori算法及其改进作了讨论。 相似文献
16.
关联规则的挖掘是数据挖掘的一个重要方面,本文介绍了关联规则挖掘的一般概念,探讨了数据仓库中关联规则的挖掘问题,提出一种基于矩阵的对L2进行改进的算法,并对其与Apriori算法进行了分析和比较。 相似文献
17.
基于实际电压暂降历史记录,利用传统关联规则算法Apriori算法思想作进一步改进,对电压暂降历史记录进行多维关联规则挖掘,探求符合真实规律的电压暂降强关联规则,并对得到的关联规则的价值进行分析.研究证明了关联规则在电压暂降研究分析领域有着良好的应用前景,为相关电力部门制定电压暂降预防或治理决策提供很多有重要价值的参考. 相似文献
18.
Apriori算法是关联规则挖掘的一个经典算法,本文在分析关联规则挖掘算法的基础上,提出利用矩阵的数据挖掘技术对经典Apriori算法进行改进,从而提高图书馆数据资源的利用率,提高图书馆服务层次。 相似文献