首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
作为一种传统关联规则挖掘算法,Apriori算法存在许多可以改进的地方。比如它需要反复读取数据库,并且读取次数由项目集合中的项目的个数n来决定,I/O负载与最大频繁集中的项目个数成正相关。为改善这种状况,本文提出一种只读取一次数据库便可挖掘出关联规则的改进算法。  相似文献   

2.
谭学清  罗琳  周洞汝 《情报科学》2007,25(1):129-133,160
数据挖掘作为一项从海量数据中提取知识的信息技术引起了国内外学术界和产业界的广泛关注,基于数据仓库的联机分析挖掘系统的应用已成为数据挖掘技术的发展趋势,本文结合联机分析挖掘的思想和基于目标属性关联规则挖掘算法,提出并构建了数据立方体上的基于约束的关联规则挖掘算法。最后的算例证明了该算法的有效性。  相似文献   

3.
在数字化信息系统中,将大量网络计算资源、存储资源与软件资源等多源信息资源进行多层次异构存储,对信息资源的调度和检索成为难题。传统的多源信息检索方法采用概念格差异融合算法,无法有效识别差异化网络数据的语义特征,检索性能不好。提出一种基于概念格特征分区的多源信息检索优化算法。概念格的生成是进行数据分析、关联分析和挖掘关联规则的前提,首先给出概念格的构造模型,进行概念格特征分区,得到数据库集合的特征概率函数密度,构建满足约束条件的无冗余概念格,计算多源信息的两种相似度系数,挖掘约束关联规则,提高信息检索精度。仿真实验表明,该算法实现多源信息检索性能优越,无偏性好,精度较高。  相似文献   

4.
基于Web的数据挖掘技术   总被引:1,自引:0,他引:1  
Web数据挖掘有很多研究热点,其中关联规则挖掘是Web数据挖掘领域研究的一个重要方面.本文首先对数据挖掘、Web数据挖掘和Web数据预处理等相关知识进行了阐述;然后研究了关联规则基本理论及关联规则经典算法;最后为了解决现实数据库中每个项目的分配不均匀性和重要性差异,重点研究了加权关联规则挖掘算法.  相似文献   

5.
针对传统关联规则挖掘在处理高维大型数据时运行效率不高的问题,提出一种基于多策略二进制粒子群优化算法的关联规则挖掘方法。该方法使用二进制粒子群优化算法搜索关联规则,无需人为指定支持度、置信度等阈值,同时引入反向学习策略、细粒度惯性权重及V型函数,降低算法陷入局部最优的概率,提高算法的收敛精度。实验结果表明,改进后的算法收敛速度较快,且平衡了可靠性、相关性及可理解性等多个指标,能挖掘出更为有效的关联规则。  相似文献   

6.
Web信息检索技术中关联规则挖掘算法应用研究   总被引:4,自引:0,他引:4  
针对Web信息检索系统在海量数据下的服务质量和效率问题,讨论了数据挖掘技术在Internet信息检索中的运用,在经典的关联规则算法研究基础上,通过引入多维链表结构,提出了利用事务集合匹配运算和链表操作高效地挖掘关联规则的算法ARMLL用于提高Web信息检索质量。实验结果表明该算法是可行的,有较高的效率。  相似文献   

7.
针对航空航天图像建立了基于空间关联规则的挖掘模型.以机场航拍图片为例,在包含空间对象关系数据和情报信息数据的数据库中进行挖掘.采用概念层、多层多雏挖掘技术优化挖掘时间,结合项目编码技术,使多层多维挖掘扁平化.  相似文献   

8.
关联规则挖掘算法是数据挖掘领域的主要研究方向之一。对几种经典的关联规则挖掘算法进行了分析、探讨和比较,给出了一种基于支持矩阵的、不需要产生候选项目集的算法设计思想。算法为事务数据库中的每个项目设置二进制向量,利用逻辑与运算构造支持矩阵来挖掘频繁项目集,极大地节省了存储空间,提高了算法运行效率。  相似文献   

9.
空间关联规则是空间数据挖掘所要发现的一种重要知识。一般的空间关联规则研究是基于传统的关联规则,然而这些方法在处理空间关系时是不适用的。同位规则问题的提出,很好的解决了挖掘正确有效的空间关联规则的需要。在介绍空间多维分类数据同位规则挖掘算法的基础上,对该算法进行了一点改进,使其能更好的针对不同的实际数据进行处理。  相似文献   

10.
关联规则是数据挖掘领域中研究最早的一个方向,随着挖掘算法的不断完善,其挖掘速度越来越快,应用也越来越广泛,然而由于关联规则忽略了规则之间的关系和影响,所以在比较复杂的领域应用还存在着很大的限制.贝叶斯网络是用来表示变量集合的联合概率分布的图形模式.提出了一种基于贝叶斯网的关联规则表示方法,实验表明这种方法生成的贝叶斯网不仅能够有效地表示出原有的关联规则的含义,而且表现了关联规则之间的联系,从而扩展了关联规则的应用.  相似文献   

11.
为解决关系国计民生重要行业事后审计的弊端,本文针对PNARC算法在审计数据关联规则挖掘时存在的置信度约束无效、挖掘精度不高等问题,提出了一种最小相关度优化PNARC算法的审计数据关联规则挖掘模型。首先对置信度进行阈值双重优化,以提高负关联规则的程度,减少不相关的关联规则,然后对最小相关度进行概率分析,降低无关规则的产生几率。仿真实验结果表明,无论在挖掘精度还是算法运行时间上,都具有比PNARC算法更优异的性能。  相似文献   

12.
关联规则挖掘是数据挖掘研究领域中的一个重要任务,旨在挖掘事务数据库中有趣的关联。Apriori算法是关联规则挖掘中的经典算法。然而Apriori算法存在着产生候选项目集效率低和频繁扫描数据等缺点。提出了一种新的Apriori的改进算法,该算法在生成k(k>1)项频繁集时,不需要重新扫描数据库,只是在生成1项频集时,才需要扫描事务数据库,有效地减少了对事务数据库的读操作,在时间复杂度上较经典的Apriori算法有更加优越的性能。  相似文献   

13.
空间关联规则是空间数据挖掘所要发现的一种重要知识。一般的空间关联规则研究是基于传统的关联规则,然而这些方法在处理空间关系时是不适用的。同住规则问题的提出,很好的解决了挖掘正确有效的空间关联规则的需要。在介绍空间多维分类数据同住规则挖掘算法的基础上,对该算法进行了一点改进,使其能更好的针对不同的实际数据进行处理。  相似文献   

14.
引入模糊关联集合概念,提出了一种基于模糊关联集合的图像去噪算法,并用该算法做了两组实验,通过对比两种噪声在采用均值滤波器、中值滤波器及基于模糊关联集合的图像去噪方法处理后的图片,得出了后者优于前两者的结论。  相似文献   

15.
目前大多都是针对两种类型数据发现对照模式来获取相关信息,在多类数据中发现对照模式进行数据挖掘还具有很大的挑战性。现有的关联规则挖掘技术的瓶颈在于需要产生大量的规则,其中有很多都是冗余规则,而已存在的非冗余规则挖掘算法虽然去掉了冗余规则,但还是有很多规则对于特定的应用领域兴趣度太低或不感兴趣,因此给出了一种有效的多类医疗数据挖掘算法。该算法基于统计方法定义了诱因模式和安全模式,实现了在多类医疗数据中发现这两类模式,并在仿真实验中给出了仿真医疗数据清晰直观的因果关系图,而根据新算法产生的规则得出的分类器也验证了新算法的高效性和实用性,且新算法产生的规则提供了精确而且非常有用的信息,可被实际应用在医疗研究以及其它领域中。  相似文献   

16.
关联规则是数据挖掘的重要研究方向之一,Apriori算法是利用关联规则进行数据挖掘中的一个最经典的算法。通过对Apriori算法进行研究分析,发现该算法具有产生大量候选项集和多次扫描数据库的缺点。提出了一种基于矩阵按位存储的改进型Apriori算法,该算法将数据库中的数据读入内存,用矩阵按位存储数据,使用按位运算计算项集的支持数,提高了支持数计数的效率,从而提高了关联规则挖掘的速度和效率。  相似文献   

17.
股票交易系统积累了大量数据。对这些数据进行有效的分析处理,以发现在股票交易数据间的内在相互联系,对指导投资决策具有重要的意义。本文在经典Apriori算法的基础上,提出了一种考虑时间因素的关联规则挖掘算法,将其应用于股票市场,对各支股票间的关联规则进行了有效的挖掘和探讨,提高了挖掘过程的效率。  相似文献   

18.
关联规则研究目的是从大型数据集中发现隐藏的、属性间存在的有趣的关联或相关关系。当挖掘的数据不断更新时,如何高效即时的获得所需的结果,设计高效的算法来更新、维护和管理已挖掘出来的关联规则。该文提出了一种高效的增量更新算法,算法通过实例进行分析比较,证明了该算法有效的提高了挖掘的效率。  相似文献   

19.
提供了一种关联规则挖掘经典算法-Apriori算法的优化算法,并结合实例探讨了如何把关系数据库的关联规则转化为单维、布尔关联规则,优化了算法的实施,探讨了关联规则的输出等问题。  相似文献   

20.
在当前的复杂数据挖掘方法中,多是基于关联规则进行关联挖掘,一旦数据之间的关联性被大量的冗余关联打破,形成数据的无序性,就会出现挖掘耗时,挖掘错误较多的问题.为了解决这一问题,本文提出一种基于信誉兴趣区间划分的数据优化查询算法.在海量的数据中,针对错综复杂的数据关系,通过信誉兴趣函数对数据进行较为清晰地划分.尤其在关联规则较为混乱的情况下,这种方法能够得到更为准确的数据分类区间.实验结果表明,这种数据挖掘方法针对大型数据库中的海量数据挖掘效果更佳,且挖掘算法速度更快,效率更高.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号