首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
对Apriori算法在数据库扫描和产生的候选项集的问题进行分析,提出一种基于矩阵的关联规则算法,该算法将事务数据库转换为向量矩阵,并通过向量矩阵的运算得到较少的候选项集,提高算法的运行效率.该算法在高校教学评价的应用上取得良好效果.  相似文献   

2.
关联规则可在庞大的数据集中找出不同事务之间隐藏的关系,其中Apriori算法是关联规则分析中较为有效的办法。然而,Apriori算法产生候选项集的效率较低且扫描数据过于频繁,造成算法计算需要耗费较长时间。另外,初始定义的最小支持度与最小置信度也不足以过滤无用的关联规则。针对以上问题,利用概率理论与有效的参数设置,在原有Apriori算法基础上,提出一种基于概率事务压缩的关联规则改进算法。数值算例结果表明,新算法可在第二次迭代之后,大幅减少低效候选项集,从而提升经典Apriori算法效率。  相似文献   

3.
提出采用事务压缩和哈希技术相结合方式的改进算法.该算法通过备份数据库Dk生成候选项目集Ck,在生成Ck的同时计算支持度.针对生成频繁2-项目集L2的瓶颈,在生成L2的时候使用DHP算法.从时间复杂度上对Apriori算法和改进算法进行比较,说明改进算法在效率上优于Apriori算法.  相似文献   

4.
一种改进的Apriori算法在web日志挖掘中的应用   总被引:1,自引:0,他引:1  
在对web日志挖掘的处理流程以及难点深入分析的基础上,为了达到更快挖掘频繁访问页面组的目标,提出一种改进的Apriori算法,主要通过减少候选项集和对事务数据库的压缩来实现性能的提高.候选项集的减少是通过对频繁项集的缩减间接来实现,事务数据库的压缩则通过一系列预先定义的规则来实现.实验数据表明,无论对于短事务集,还是长事务集,算法的性能都得到了提升,更好地满足了实际应用的需要.  相似文献   

5.
在FDM算法的基础上,提出了一种改进的并行关联规则挖掘算法FDM_DT,此算法利用DHP算法中的Hash表技术改进了2阶侯选项集的生成过程,并采用Apriori Tid算法中的Tid表技术对事务数据库中的事务数进行有效消减。因此,此算法在处理大规模数据时有较高的综合效率。  相似文献   

6.
连续属性的离散化是粗糙集理论研究的一个重要内容,对后继阶段的知识获取过程具有重要的意义。选取用于离散化的断点一般分为两步,即候选断点的选择和结果断点的确定。文中提出一种新的候选断点选取算法,可以在第一步中有效减少候选断点的数目;在第二步中采用自顶向下的方式确定候选断点的重要性,在此基础上给出了一种确定结果断点的启发式算法。仿真实验结果表明该算法是有效的。  相似文献   

7.
为了改善传统地图匹配算法在基于低采样率GPS浮动车的高速公路交通流状态监测系统中的应用性能,提出了一种基于Oracle空间数据模型的地图匹配算法.该算法选取Oracle道路网络模型对海量GPS位置数据和高速道路网之间的空间关系进行分析,建立了一种可有效寻找GPS位置点之间合理候选行驶路径的N-最短路模型,并用逻辑模糊模型进行最终路径匹配的判断.采用美国洛杉矶市高速公路的实际调查数据对模型进行计算和验证,得到所提算法的计算速度约为每秒135条GPS位置数据,准确率为98.9%.结果表明,所提算法可以高效准确地将海量GPS位置数据匹配到具有复杂几何特征的高速公路网上.  相似文献   

8.
为了提高软件的执行效能及提高WMB(WebSphere Message Broker)上大数据消息数据处理的速度,首先定义了单笔柜面交易、硬件标尺、程序执行效率等概念.建立了企业服务总线上的软件执行高效算法(称为WMB*),算法主要解决了在WMB上提高各应用级系统对大数据消息数据及通讯协议的处理和转换速度,以达到提高软件的执行效率.在银行数据集上对不改变大数据消息数据结构和改变大数据消息数据结构的情况做了大量的实验,结果表明,在WMB上,用ESQL语言比JAVA语言在处理消息数据的速度快0.1个数量级,而在CPU占用率(ms/msg)上,用ESQL语言比JAVA语言低得多.WMB*算法适合在大数据上对银行交易数据进行挖掘.  相似文献   

9.
为了解决MINWAL(O)算法存在的重复扫描数据库、挖掘出的加权频繁项集可能包含多个权值较低的项目等问题,提出一种新的加权关联规则算法.该算法定义了新的加权关联规则模型,提出最小支持期望的概念用于候选项集的修剪,挖掘出感兴趣的加权频繁项集.测试结果证明该算法有较高的时间效率.  相似文献   

10.
Apriori算法是一种挖掘布尔型关联规则的典型算法。该算法在生成频繁项集时会有频繁的数据库扫描操作,并且在由低维频繁项集连接生成高维候选项集时,如果频繁项集维数过大,笛卡尔积后就会产生大量的候选项集,从而影响算法的效率。针对上述2个方面对Apriori算法进行改进,并将改进后的算法应用在试卷分析系统中。经过系统测试,改进后的算法具有较高的效率和较强的稳定性。  相似文献   

11.
计算机软件蕴含大量工作信息,有效挖掘软件数据信息之间的内在关联是信息时代对软件应用的潜在要求。针对经典Apriori算法挖掘数据效率低、复杂度高的问题,提出一种改进Apriori算法用于挖掘计算机软件数据的关联规则。为计算机软件算法设置双重支持度阈值,即频繁项集与非频繁项集支持度阈值,快速获得强关联的频繁项集;在此基础上基于映射规则重构事务数据库,压缩数据库规模,减少算法的剪枝操作,降低计算机软件数据关联规则挖掘复杂度。以人力资源类计算机软件数据为例展开关联分析测试,结果显示,该算法挖掘的关联信息与人力资源实际管理情况一致,相比经典Apriori算法其效率有所提升。  相似文献   

12.
研究淘宝网和百度有啊这两个国内有代表性的C2C电子商务平台上的销售记录及其用户信息的抽取.针对两个网站上的店铺销售数据,设计一个基于JerichoHtmlParser的、以Html数据标签为地标的Web数据抽取算法;针对两个网站上的用户信息,设计一个基于正则表达式的Web数据抽取算法.设计实现了一个Web抽取系统,可以按不同的抽取规则实现对不同站点上数据的抽取.最后通过对上述2个平台上实际数据的抽取,验证了设计方案的有效性,实验证实了所设计的原型系统具有较高查全率和准确率.  相似文献   

13.
物化视图的选择是数据仓库设计重要的决策之一.探讨在一定维护代价约束条件下,在检索过程中总检索成本最优化的问题,并提出新的动态算法一最小/最大侯选变换算法.该算法的关键是基于最小有效的极大基数配比技术和通过构建索引而设计的代价计算模型来获得最大候选集.实验结果显示这个算法是高效的、动态的、近似最优的.  相似文献   

14.
一种基于二进制编码的频繁项集查找算法   总被引:1,自引:0,他引:1  
在数据挖掘中频繁项集的查找时间是影响挖掘关联规则效率的关键因素,Apriori算法是用来找出频繁项集的典型算法,本文针对Apriori算法需反复扫描数据库、产生大量候选项集的不足,提出一种效率更高的基于二进制编码的频繁项集查找算法,该算法找出频繁项集只需一次数据库扫描,不产生候选项集,与Apriori算法相比,算法效率更高.  相似文献   

15.
针对机器人快速运动时视觉里程计精度严重下降问题,提出基于点线特征的帧间匹配流视觉里程计(PL-FM)算法,以提高机器人在快速运动情形下的定位精度。PL-FM 算法通过对图像的预处理去噪,在特征点提取时引入灰度值权重,从而降低快速运动时光照的影响。将特征点匹配问题转化为向量计算,从而减少匹配时间,在帧间匹配流则采用衰减关键帧计算位姿,从而提高关键帧利用率。通过4 组实验对比,证明 PL-FM 算法误差精度提高 70%,时间效率提高 75%,保证了移动机器人的定位实时性,实现了低误匹配率及较高的定位精度。  相似文献   

16.
提出了一种基于小波分解和混合环形投影特征的具有旋转不变性的图像匹配算法。首先在小波变换后的低频图上利用混合环形特征相似性算法得到一系列候选匹配点,然后对候选点在原图像对应的区域内作精确相关匹配得出准确匹配位置。混合环形投影特征值结合了均值投影和方差投影的优点,能有效反映图像的旋转不变性特征。实验证明该算法保持匹配精度的同时减少了匹配计算量,而且对图像的旋转不敏感。  相似文献   

17.
用数学方法定义了图书馆,深入仔细地研究了图书馆的数据结构和事务。在LDS(Library Data Structure)上,用4GL实现了图书馆事务算法。图书馆事务算法LTA(Library Transaction Algorithm)是开发LIS(Library Information System)的重要基础。  相似文献   

18.
关联交易作为一种经济现象应属于中性范畴,其存在有其必然性和一定合理性。但是不正当关联交易的客观存在严重损害了中小股东和债权人的权益,必须运用各种法律手段予以规制。  相似文献   

19.
文章探讨了一种用极坐标表示和K—L变换来减少匹配运算量、以改进遗传算法作为搜索策略来提高匹配速度和定位精度的快速有效的旋转图像匹配算法.实验结果表明这种算法计算速度快、匹配概率高、匹配误差小、鲁棒性好.  相似文献   

20.
项目加权关联规则挖掘中,权值反映了数据的重要程度,权值对项目支持度有加强或减弱作用.通过比较M INWAL(O)、M INWAL(W)等加权关联规则挖掘模型,分析了权值对加权关联规则挖掘产生的影响,并针对M INWAL(W)模型在加权候选频繁项目集剪枝方面存在的不足,利用支持度下界对剪枝策略进行了改进,从而有效地减少挖掘过程的计算量.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号