首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
叶萌 《黑龙江科技信息》2011,(30):40+39-40,39
关联规则是数据挖掘领域的一个重要分支,它反映了一个事物与其他事物之间互相依赖的关系。提出了一种简易而有效的频繁模式挖掘算法作为基础,利用频繁模式树对大型原始事务数据库进行压缩存储,并且给出了具体实现算法。与传统的算法比较,避免了反复进行候选集的生成与测试,大大提高了算法效率。  相似文献   

2.
数据流挖掘是目前新一代数据挖掘研究中的热点,而数据流频繁模式是影响数据流挖掘算法效率的决定性因素.虽然目前有许多工作针对数据流频繁模式挖掘算法进行了研究,但是仍然存在许多不足.本文详细讨论了数据流频繁模式挖掘的四种主流算法,最后提出了未来的研究方向.  相似文献   

3.
数据挖掘是一种重要的数据分析方法,旨在发现庞大的数据中隐藏着的、先前未知的并潜在有用的模式和信息,以帮助人们正确理解和认识数据,进行科学决策。关联挖掘是数据挖掘中研究最早也是最活跃的领域,其中,频繁模式挖掘是关联挖掘的核心和基础。对关联挖掘算法的研究和发展进行综述,分析挖掘算法面临的主要挑战,概括最新研究进展。  相似文献   

4.
对大数据的频繁项集挖掘是关联规则挖掘的关键步骤,通过有效的频繁项挖掘提高大数据量数据库的访问效率。传统方法中对大数据的频繁项集挖掘采用FP-Growth的粗糙集挖掘算法,扩展性和容错性不好。提出一种基于贝叶斯粗糙集的大数据频繁项挖掘技术,引入后缀项表的概念,通过后缀项表的构建,保留频繁项集的完整信息。构建FP-Tree,生成闭频繁项集,计算样本的密度,并抽取高密度区域的点集作为聚类中心集合,进行后缀项表的构造,按支持度分成若干集合,对各约简集内的属性集合进行融合,用变精度粗糙集的贝叶斯粗糙进行数据挖掘算法改进,仿真结果表明,算法不受可变参数的影响,鲁棒性较高,数据挖掘的准确度较高,运行时间较短。算法将在人工智能和数据挖掘领域具有更广的应用前景。  相似文献   

5.
研究频繁项集模式挖掘优化问题。传统的挖掘算法常产生大规模的候选项集,并且反复扫描数据库,导致频繁项集挖掘时间过长,空间效率太低。为了改进频繁项集挖掘时时间与空间效率低的问题,提出一种高效频繁项集挖掘算法CPT-Mine。此算法利用编码模式树存储事务数据库中的频繁项集信息,构建FP数组,加快产生频繁项集,引入CPT-Mine算法,快速地挖掘数据库中所包含的频繁项集,无需递归构造条件模式树,只需两次扫描数据库即可生成所有频繁项集。最后的实验证明了该算法能缩短挖掘时间3~10 s,空间效率提高43%。  相似文献   

6.
李丹  车国海 《大众科技》2008,15(4):13-15
在现有的网格和数据挖掘技术基础上,研究OGSA面向服务的体系结构,建立了网格平台下的分布式数据挖掘系统模型。基于该模型。对经典关联规则算法FP—tree算法作了改进,提出分布式频繁模式挖掘算法,并对该模型和算法进行了分析、测试、和评估。  相似文献   

7.
由于其内在的计算复杂性,在密集型数据序列数据库中挖掘全部频繁项集往往非常困难,解决方案之一是挖掘最大频繁序列。传统的序列模式方法对满足最小支持度阈值的序列同等对待,但在真实数据库中不同的序列往往具有不同的重要程度。为解决上述问题,提出了一种挖掘加权最大频繁序列的新算法。该算法利用频繁项目出现的频率来计算频繁序列的权重,给出了频繁加权序列的定义,该定义的引入不仅可以找出较为重要的最大频繁序列,而且可以使挖掘结果同样具有反单调性,从能够加速剪枝,提高算法效率。实验结果表明,加权最大频繁序列算法是有效的。  相似文献   

8.
水利信息化的建设积累了大量历史水情数据,对这些数据进行挖掘,找到与给定时间段相似的水文过程,为城市防汛提供指导。针对水文数据维度高、周期性强、短期波动频繁等特点,采用分段聚合近似方法进行有效压缩,把握水文时间序列模式的变化特征,在此基础上采用最大特征点优先匹配的动态时间弯曲距离算法比较两个水文时间序列的相似性,并以杭州市水位监测站采集到的历史水位和降雨量信息为样本进行了验证,结果有效。  相似文献   

9.
频繁项集挖掘算法研究   总被引:2,自引:0,他引:2  
在数据库中挖掘频繁项集是数据挖掘领域的最基本、最重要的问题。自从Agrawal的开创性工作以来,有关研究从未停止过。然而由于其内在的计算复杂性,这一问题并未完全解决。通过描述频繁项集挖掘的特点,并根据解空间的分类对已有各种频繁项集、闭频繁项集、最大闭频项集和不生成频繁项集的挖掘算法进行了分析和比较。  相似文献   

10.
针对目前网络攻击越来越频繁,现有的IDS系统检测分析不够精准,IDS系统数据库的防御已经无法满足入侵防御需求的现状。采用数据挖掘技术中的C4.5算法和序列模式挖掘算法,对系统的获取的数据包进行数据挖掘,其中C4.5算法针对的是描述系统缺陷和已知攻击方法的数据,而序列模式挖掘算法针对的是系统调用序列数据,提高数据分析的准确性。实验表明,本文对IDS系统数据规则库的改进,大大提高了系统对入侵数据分析的准确性。  相似文献   

11.
李勇男  梅建明 《情报科学》2017,35(9):141-145
【目的/意义】利用数据挖掘技术在海量数据中快速、准确、有效的发现涉恐线索并及时处置是反恐工作的 重要手段之一。【方法/过程】本文研究如何利用频繁模式树对涉恐基础数据进行挖掘,提取涉恐特征的频繁项集。 首先通过对数据库中的涉恐人员信息进行涉恐特征计数排序并建立频繁模式树,然后在树结构中递归遍历发现满 足最小支持度阈值的频繁项集。【结果/结论】文中的方法可以快速发现大量基础数据中的涉恐关联属性,有利于在 系统中自动搜索重点涉恐人员,为反恐预警系统提供决策参考。通过与其他产生关联规则的方法结合使用,还可 以发现暴恐活动中不同因素的因果关系。  相似文献   

12.
传统的关联规则挖掘技术过于依赖数据之间的关联属性,造成挖掘算法在高冗余知识空间关联规则不明显或者较弱的情况下挖掘耗时。本文提出一种应用与高冗余知识空间的优化数据挖掘算法。该算法首先找出最大频繁项集和频繁1-项集进行区域分类,然后利用已有频繁项集找出所有的其它频繁项集,去除冗余关联环境,节省了计算频繁项集的时间,节约了存储空间,使算法的效率得到提高。仿真实验结果证明了改进算法的可行性和有效性。  相似文献   

13.
针对企业工作效率日益提高的需求,根据现有企业工作流管理系统的不足,对Apriori算法进行优化,提出MWPMA工作流频繁模式挖掘算法。  相似文献   

14.
李勇男 《情报杂志》2021,40(2):90-94,68
[目的/意义]对多源异构时空数据进行同现模式挖掘可以发现涉恐人员、涉恐物资、涉恐活动在邻近地点同时段共同出现的规律,为反恐工作提供包含时间特征和空间特征的情报信息。[方法/过程]在同位模式挖掘的基础上提出预先确定目标情报类别从而确定涉恐人员分类方式,使用概念层次树对涉恐物资和涉恐活动进行数据预处理,使得目标同现模式覆盖更多情报信息。[结果/结论]该方法与同位模式挖掘、频繁时间序列模式挖掘以及各种时空轨迹模式挖掘可以相互补充,覆盖多种不同的反恐情报信息,完善反恐预警机制,为反恐决策提供客观依据。  相似文献   

15.
基于关联的聚类分析在个性化服务中的应用   总被引:2,自引:0,他引:2  
运用关联规则,确定用户频繁访问模式,使用页面相似聚类分析对用户频繁访问集分类,挖掘具有相似访问兴趣的网络用户的浏览模式,并对相关算法作了改进,从满足用户个性化信息服务出发,给出一种基于关联的用户访问模式聚类方法.实践证明,将基于关联的聚类分析方法应用到个性信息服务中是有效的.  相似文献   

16.
陈守强  李东 《情报杂志》2006,25(12):75-76,79
阐述了知识元定义及知识元挖掘技术概念和算法,对知识元挖掘技术在军事信息处理中的应用模式与框架进行了探讨。  相似文献   

17.
从知识运转模式论知识挖掘   总被引:2,自引:0,他引:2  
张瑞玲  贾燕 《情报杂志》2005,24(9):21-23,26
从组织中知识管理和知识的转化出发,给出了知识运转模式,并指出了知识挖掘技术在从内隐到外显的知识转化过程中所起的重要作用,阐明了知识挖掘的概念。从Lotus OA系统构架出发对知识挖掘所涉及的主要技术进行了剖析。  相似文献   

18.
针对频繁项集挖掘时间与空间效率低的问题,提出一种基于New FP-tree的高效频繁项集挖掘算法。此算法利用New FP-tree结构存储事务数据库中的频繁项集信息,无需递归构造条件模式树,仅需两次扫描数据库即可生成所有频繁项集。最后的实验证明了该算法的有效性。  相似文献   

19.
针对当前树木病虫害防治总是先发现,后治理,被动防治以及难以准确预测外来物种虫害爆发的问题,提出基于大数据进行关联分析,首先使用网络爬虫对文章标题,摘要进行爬取并存入数据库中,根据虫害文章摘要提取相关害虫和树种的关键词,使用FP-growth算法通过建立频繁模式树FP-tree,挖掘并输出频繁模式,从而得到害虫和树种以及树种和树种之间的潜在关系,进而达到树木病虫害的初步预测,为后续的防治提供了大致的方向,实现对树种相关的某几种害虫的针对防治。  相似文献   

20.
针对SNS用户行为存在序列性这个特点,文章提出了一种SNS用户行为分析模型。模型以SNS群体用户为研究对象,引入序列模式挖掘的方法实现用户行为分析,最终获得用户的频繁行为序列模式。文章应用实例对该模型进行了可行性验证,并对未来研究进行展望。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号