首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 35 毫秒
1.
陈静 《大众科技》2012,(6):46-47
关联规则的提取是数据挖掘中的重要研究内容,对关联规则提取中的Apriori算法进行了分析与研究,针对该算法的运算效率不高,对该算法进行了改进,提出了Apriori改进算法.Apriori改进算法采用二进制数据垂直表示方法,只用扫描事务数据库一次得到一阶大项集的二进制数据垂直表示.K阶候选项集的操作只要基于这个一阶大项集,而不需重复扫描数据库,从而提高了挖掘算法的效率.  相似文献   

2.
关联规则挖掘是数据挖掘研究领域中的一个重要任务,旨在挖掘事务数据库中有趣的关联。Apriori算法是关联规则挖掘中的经典算法。然而Apriori算法存在着产生候选项目集效率低和频繁扫描数据等缺点。提出了一种新的Apriori的改进算法,该算法在生成k(k>1)项频繁集时,不需要重新扫描数据库,只是在生成1项频集时,才需要扫描事务数据库,有效地减少了对事务数据库的读操作,在时间复杂度上较经典的Apriori算法有更加优越的性能。  相似文献   

3.
关联规则是数据挖掘的重要研究方向之一,Apriori算法是利用关联规则进行数据挖掘中的一个最经典的算法。通过对Apriori算法进行研究分析,发现该算法具有产生大量候选项集和多次扫描数据库的缺点。提出了一种基于矩阵按位存储的改进型Apriori算法,该算法将数据库中的数据读入内存,用矩阵按位存储数据,使用按位运算计算项集的支持数,提高了支持数计数的效率,从而提高了关联规则挖掘的速度和效率。  相似文献   

4.
基于Web的数据挖掘技术   总被引:1,自引:0,他引:1  
Web数据挖掘有很多研究热点,其中关联规则挖掘是Web数据挖掘领域研究的一个重要方面.本文首先对数据挖掘、Web数据挖掘和Web数据预处理等相关知识进行了阐述;然后研究了关联规则基本理论及关联规则经典算法;最后为了解决现实数据库中每个项目的分配不均匀性和重要性差异,重点研究了加权关联规则挖掘算法.  相似文献   

5.
关联规则挖掘算法是数据挖掘领域的主要研究方向之一。对几种经典的关联规则挖掘算法进行了分析、探讨和比较,给出了一种基于支持矩阵的、不需要产生候选项目集的算法设计思想。算法为事务数据库中的每个项目设置二进制向量,利用逻辑与运算构造支持矩阵来挖掘频繁项目集,极大地节省了存储空间,提高了算法运行效率。  相似文献   

6.
传统的挖掘算法Apriori是依据统计学中的数据显著性挖掘关联规则,需多次扫描数据库,效率较低,且忽视了数据显著性与价值性不匹配的问题。针对"大数据"下容易产生数量繁多但无效的关联规则,通过采用基于布尔矩阵挖掘关联规则的算法,只扫描一次数据库,得出布尔矩阵及相应的利润矩阵,随后根据"二八法则"设定对客户最具吸引力的"最小价值度",最终挖掘出高价值的关联规则,从而提高规则挖掘的效率及价值。  相似文献   

7.
赵伟 《科技广场》2005,(10):8-12
关联规则挖掘算法为了发现事先未知的关联规则,需要用高效的方法计算出数据库中的大项目集。影响数据挖掘效率的两个因素,一个是数据库大小,另一个是算法的效率。本文算法通过将数据库进行高度压缩,使数据库中的数据量大大减少,同时算法采用逻辑运算方法计算项集的支持数,计算效率较高。  相似文献   

8.
在FDM算法的基础上,提出了一种改进的并行关联规则挖掘算法FDM_DT,此算法利用DHP算法中的Hash表技术改进了2阶侯选项集的生成过程,并采用Apriori Tid算法中的Tid表技术对事务数据库中的事务数进行有效消减。因此,此算法在处理大规模数据时有较高的综合效率。  相似文献   

9.
关联规则数据结构分布重排的数据库索引算法   总被引:1,自引:0,他引:1  
数据库优化索引是实现文本数据信息智能存储和调用的关键技术,网络信息文本数据具有较大的关联规则特性,造成了数据结构类间干扰,影响数据库索引精度。传统方法采用虚拟数据分布重组数据库索引技术,文本数据库扩展查询中会出现聚类特征不一致。提出一种基于关联规则数据结构分布重排的数据库索引算法。先构建网络信息文本数据库相对关联状态系统模型与关联规则关系图,在此基础上进行数据库规则信息流的结构分布重排,挖掘关联特征,实现数据库索引算法改进。仿真结果表明,采用该算法进行文本数据库索引,提高了特征匹配效率,降低执行时间,展示了优越性能。  相似文献   

10.
关联规则挖掘是数据挖掘领域中的一个非常重要的研究内容,其主要目标就是发现数据库中一组对象之间某种关联。频繁项集挖掘是关联规则挖掘的关键步骤,它在很大程度上决定了关联规则挖掘的效率。介绍了Apriori算法及其算法改进。该改进算法对剪枝步进行了优化,提高了连接效率,并且不断减小数据库的规模,去掉无效事务,减少了每次扫描数据库所花费的时间,提高了算法效率。经过试验论证,性能比原有算法提高,具有一定的实用性。  相似文献   

11.
李欣 《情报科学》2018,36(4):95-99
【目的/意义】关联数据发现与个性化信息推送是未来智慧图书馆建设的核心内容。大数据环境下,为了提 高图书馆推送信息的精准度,本文把适合个性化信息推送服务的强关联规则挖掘技术引入到高校图书馆智慧化信 息服务中,研究在图书馆集成管理系统的基础上实现图书的智能查询和个性化信息推送。【方法/过程】在具体的研 究中,由于经典关联规则挖掘需要多次扫描数据库,生成大量的冗余关联规则信息,因此需要重新定义领域内强关 联规则和频繁项目集,提出处理海量数据需要的强关联规则算法。【结果/结论】将改进的算法应用到图书借阅和信 息查询数据的分析中,以减少图书频繁项集的产生,避免冗余规则的挖掘和生成,从而实现关联图书信息的高效挖 掘和个性化推送。  相似文献   

12.
数据挖掘是目前信息领域和数据库技术领域的前沿研究课题,它涉及到数理统计、模糊理论、神经网络和人工智能等多种技术,技术含量比较高,实现难度也较大.本文研究了关联规则挖掘技术的基本概念、过程和算法等,为提高数据挖掘效率,提出了基于聚类划分的增量式关联规则挖掘算法.即运用快速聚类方法实现数据划分、运用改进的FP-growth算法实现关联规则的挖掘和运用增量FP-growth挖掘算法实现增量数据挖掘的关联规则挖掘算法.  相似文献   

13.
廖大强 《科技通报》2019,35(8):125-128
为了提高用户需求数据挖掘的时效性及准确性,提出基于径向基函数神经网络的数据关联挖掘算法。在对数据频繁项集约束性关联规则研究的条件下,通过约简计算,得到满足约束条件的候选数据集,并对用户需求数据频繁项集更新;利用径向基函数神经网络对候选数据集进行训练优化,通过上界剪枝法,获取用户需求数据,并实现其实时挖掘。实验结果表明,所提数据挖掘算法执行效率受数据规模变化的影响较小,挖掘效率更高,扩展性更好。  相似文献   

14.
关联规则挖掘是数据挖掘领域中的一项重要研究内容,由于数据库规模的不断动态扩展,迫切需要针对增量式关联规则挖掘的研究。在分析现有算法的基础上,分别从两个可改进的角度出发对算法进行优化:先在关联规则挖掘中,提出一个高效的搜索频繁项集算法,该算法只需扫描一次数据库即可完成所有频繁项集的搜索,然后利用此方法设计出一个新的增量式挖掘算法,在不影响准确率的情况下大大地提高了挖掘效率。  相似文献   

15.
在当前的复杂数据挖掘方法中,多是基于关联规则进行关联挖掘,一旦数据之间的关联性被大量的冗余关联打破,形成数据的无序性,就会出现挖掘耗时,挖掘错误较多的问题.为了解决这一问题,本文提出一种基于信誉兴趣区间划分的数据优化查询算法.在海量的数据中,针对错综复杂的数据关系,通过信誉兴趣函数对数据进行较为清晰地划分.尤其在关联规则较为混乱的情况下,这种方法能够得到更为准确的数据分类区间.实验结果表明,这种数据挖掘方法针对大型数据库中的海量数据挖掘效果更佳,且挖掘算法速度更快,效率更高.  相似文献   

16.
Apriori算法是关联规则挖掘的一个经典算法,针对Apriori算法的不足,提出了基于邻接矩阵的算法,该算法首先用邻接矩阵将事务数据库表示出来,然后基于邻接矩阵生成频繁k_项集。以高校图书馆借阅历史数据的挖掘为例,详细描述了事务数据库相应的邻接矩阵生成算法、k_项集生成算法以及相应的数据结构设计,算法均采用C语言描述。  相似文献   

17.
王世运 《科技通报》2015,(3):184-187
联合数据库的入侵和普通入侵不同,其无显著的行为特征,入侵数据属性差异较大,很难形成统一的约束规范,导致传统的入侵检测方法,由于通过提取入侵行为特征进行入侵检测,无法有效且准确地完成联合数据库的入侵检测,提出一种弱关联规则下的联合数据库入侵检测方法,通过弱关联模式在联合数据库中支持程度与联合数据库记录总量的比求出弱关联模式的支持度,获取频繁弱关联模式集,采用改进的双置信度算法对频繁弱关联模式集的置信度进行计算,获取弱关联规则,依据弱关联规则,通过原始联合数据库对分类超平面进行计算,采用该超平面完成联合数据库的整体分类,采用主成分分析方法对联合数据库中的操作数据进行降维处理,通过差异分类方法,对联合数据库中的操作数据特征进行分类操作,实现弱关联规则下联合数据库的有效入侵检测。实验表明,所提方法具有很高的准确性及有效性。  相似文献   

18.
关联规则是数据挖掘领域的一个重要分支。随着数据库的不断变化,关联规则的增量更新变得尤为重要。为了更好地对关联规则进行有效的更新,对已经提出的经典的关联规则更新算法FUP和IUA算法进行分析,指出其优缺点;提出了一个改进的关联规则算法PFUP。该算法减少了候选项集数目,从而减少扫描数据库D的次数,提高了效率。  相似文献   

19.
为解决关系国计民生重要行业事后审计的弊端,本文针对PNARC算法在审计数据关联规则挖掘时存在的置信度约束无效、挖掘精度不高等问题,提出了一种最小相关度优化PNARC算法的审计数据关联规则挖掘模型。首先对置信度进行阈值双重优化,以提高负关联规则的程度,减少不相关的关联规则,然后对最小相关度进行概率分析,降低无关规则的产生几率。仿真实验结果表明,无论在挖掘精度还是算法运行时间上,都具有比PNARC算法更优异的性能。  相似文献   

20.
卫俭 《科技通报》2013,(1):147-149,160
大型数据库中的数据的属性种类很多。大规模的计算频繁数据集会造成数据运算量巨大。没有形成很好的数据约束规则,随着数据种类的增加,会使得查询较为耗时。为了解决此问题,提出一种基于关联约束最优模型的数据库优化查询算法,设计一种关联分辨器的功能,对数据进行关联数据集划分,运用数据约束技术,排除频繁集项过于复杂的干扰,对数据库的查询过程进行优化。实验表明,该方法能够较好的完成数据的关联,提高了查询的效率。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号