共查询到18条相似文献,搜索用时 78 毫秒
1.
陶荣 《内蒙古科技与经济》2008,(9):42-44
文章认为,数据挖掘就是从大量数据中提取出潜在的、有价值的知识的过程.关联规则挖掘是数据挖掘领域的一个重要研究方向.基于Apriori算法,用Visual Foxpro实现求1-3频繁项目集的方法,该方法扩展后具有一定的实用价值. 相似文献
2.
3.
关联规则的提取是数据挖掘中的重要研究内容,对关联规则提取中的Apriori算法进行了分析与研究,针对该算法的运算效率不高,对该算法进行了改进,提出了Apriori改进算法.Apriori改进算法采用二进制数据垂直表示方法,只用扫描事务数据库一次得到一阶大项集的二进制数据垂直表示.K阶候选项集的操作只要基于这个一阶大项集,而不需重复扫描数据库,从而提高了挖掘算法的效率. 相似文献
4.
关联规则研究目的是从大型数据集中发现隐藏的、属性间存在的有趣的关联或相关关系。当挖掘的数据不断更新时,如何高效即时的获得所需的结果,设计高效的算法来更新、维护和管理已挖掘出来的关联规则。该文提出了一种高效的增量更新算法,算法通过实例进行分析比较,证明了该算法有效的提高了挖掘的效率。 相似文献
5.
关联规则挖掘是数据挖掘领域中的一个非常重要的研究内容,其主要目标就是发现数据库中一组对象之间某种关联。频繁项集挖掘是关联规则挖掘的关键步骤,它在很大程度上决定了关联规则挖掘的效率。介绍了Apriori算法及其算法改进。该改进算法对剪枝步进行了优化,提高了连接效率,并且不断减小数据库的规模,去掉无效事务,减少了每次扫描数据库所花费的时间,提高了算法效率。经过试验论证,性能比原有算法提高,具有一定的实用性。 相似文献
6.
Apriori算法作为一种典型的关联规则算法,将其应用在CRM中,对于促进CRM进一步向智能化发展,提升CRM价值起到非常重要的作用。文章首先介绍Apriori算法的基本原则、方法,然后介绍兴趣关联规则的概念与实现方法,最后对用Apriori算法评估客户兴趣度进行了探讨。 相似文献
7.
本文提出了一种改进的Apriori算法。解决经典的Apriori算法的瓶颈,通过对数据库中小于最小支持度的项集进行剪枝,减少数据库中的事物数量来提高下次扫描的效率,同时改变产生候选集的函数,生成连续的访问页面。改进算法提高了网上学习模型的智能性。 相似文献
8.
基于矩阵方法优化Apriori算法 总被引:1,自引:0,他引:1
陈敏艳 《内蒙古科技与经济》2008,(16)
通过分析、研究该算法的基本思想,提出了算法的一些改进,并利用矩阵方法和数据库建立联系,更直观、更有效地提高关联规则的效率. 相似文献
9.
对关联规则中Apriori算法进行深入研究,基于修剪频繁集策略、连接优化策略及库结构优化策略等方法,提出Apri-ori改进算法。此方法能大量减少所需I/O次数和内存开销,提高运行的效率。将此算法运用到图书借阅数据中,挖掘图书之间的关联性,为领导决策和读者个性化服务提供参考依据。 相似文献
10.
基于关联规则的Apriori算法,对序列模式挖掘的规则类Apfiori算法的思想对性能进行了研究,给出了该算法的基本算法和扩展算法。 相似文献
11.
关联规则挖掘是从大量的数据中挖掘出有价值描述数据项之间相互联系的有关知识。本文对Apriori算法及其改进作了讨论。 相似文献
12.
13.
Apriori算法是关联规则挖掘中的经典算法。通过对Apriori算法的基本思想和性能的研究分析,提出了一种基于垂直事务列表的树形结构的挖掘算法,减少了候选频繁项集的数量,提高了挖掘算法的效率。实验结果表明新算法具有良好的性能。 相似文献
14.
为了提高物联网海量数据的分析处理能力,采用Apriori算法对物联网数据进行规则关联处理。首先对物联网数据进行样本划分,并采用矩阵的方式存储,接着对数据样本进行标准化处理,并得到模糊相似矩阵,最后采用Apriori算法根据频繁项集进行规则关联。本文采用基于物联网的数字图书馆作为仿真对象,对用户行为数据进行数据挖掘,实验证明,该方法完成的物联网数据规则关联,置信度高,具有一定的应用价值。 相似文献
15.
16.
针对传统的Apriori算法需要产生大量的候选项目集和多次扫描数据库的不足,提出了一种新的基于内积运算的频繁项集生成算法。该算法对事务数据库布尔化表示,通过内积运算搜寻矩阵行向量直接生成频繁项集,打破了频繁项集必须从低次到高次的局限,当频繁项集可能是大项集时,大大提高了搜索效率。 相似文献
17.
基于改进特征提取及聚类的网络评论挖掘研究 总被引:1,自引:0,他引:1
[目的/意义]针对信息过载条件下中文网络产品评论中特征提取性能低以及特征聚类中初始中心点的选取问题。[方法/过程]本研究提出采用基于权重的改进Apriori算法产生候选产品特征集合,再根据独立支持度、频繁项名词非特征规则及基于网络搜索引擎的PMI算法对候选产品特征集合进行过滤。并以基于HowNet的语义相似度和特征观点共现作为衡量产品特征之间关联程度的特征,提出一种改进K-means聚类算法对产品特征进行聚类。[结果/结论]实验结果表明,在特征提取阶段,查准率为69%,查全率为92.64%,综合值达到79.07%。在特征聚类阶段,本文提出的改进K-means算法相对传统算法具有更优的挖掘性能。 相似文献