共查询到20条相似文献,搜索用时 15 毫秒
1.
关联规则是数据挖掘领域的一个重要分支,它反映了一个事物与其他事物之间互相依赖的关系。提出了一种简易而有效的频繁模式挖掘算法作为基础,利用频繁模式树对大型原始事务数据库进行压缩存储,并且给出了具体实现算法。与传统的算法比较,避免了反复进行候选集的生成与测试,大大提高了算法效率。 相似文献
2.
数据流挖掘是目前新一代数据挖掘研究中的热点,而数据流频繁模式是影响数据流挖掘算法效率的决定性因素.虽然目前有许多工作针对数据流频繁模式挖掘算法进行了研究,但是仍然存在许多不足.本文详细讨论了数据流频繁模式挖掘的四种主流算法,最后提出了未来的研究方向. 相似文献
3.
4.
对大数据的频繁项集挖掘是关联规则挖掘的关键步骤,通过有效的频繁项挖掘提高大数据量数据库的访问效率。传统方法中对大数据的频繁项集挖掘采用FP-Growth的粗糙集挖掘算法,扩展性和容错性不好。提出一种基于贝叶斯粗糙集的大数据频繁项挖掘技术,引入后缀项表的概念,通过后缀项表的构建,保留频繁项集的完整信息。构建FP-Tree,生成闭频繁项集,计算样本的密度,并抽取高密度区域的点集作为聚类中心集合,进行后缀项表的构造,按支持度分成若干集合,对各约简集内的属性集合进行融合,用变精度粗糙集的贝叶斯粗糙进行数据挖掘算法改进,仿真结果表明,算法不受可变参数的影响,鲁棒性较高,数据挖掘的准确度较高,运行时间较短。算法将在人工智能和数据挖掘领域具有更广的应用前景。 相似文献
5.
研究频繁项集模式挖掘优化问题。传统的挖掘算法常产生大规模的候选项集,并且反复扫描数据库,导致频繁项集挖掘时间过长,空间效率太低。为了改进频繁项集挖掘时时间与空间效率低的问题,提出一种高效频繁项集挖掘算法CPT-Mine。此算法利用编码模式树存储事务数据库中的频繁项集信息,构建FP数组,加快产生频繁项集,引入CPT-Mine算法,快速地挖掘数据库中所包含的频繁项集,无需递归构造条件模式树,只需两次扫描数据库即可生成所有频繁项集。最后的实验证明了该算法能缩短挖掘时间3~10 s,空间效率提高43%。 相似文献
6.
在现有的网格和数据挖掘技术基础上,研究OGSA面向服务的体系结构,建立了网格平台下的分布式数据挖掘系统模型。基于该模型。对经典关联规则算法FP—tree算法作了改进,提出分布式频繁模式挖掘算法,并对该模型和算法进行了分析、测试、和评估。 相似文献
7.
由于其内在的计算复杂性,在密集型数据序列数据库中挖掘全部频繁项集往往非常困难,解决方案之一是挖掘最大频繁序列。传统的序列模式方法对满足最小支持度阈值的序列同等对待,但在真实数据库中不同的序列往往具有不同的重要程度。为解决上述问题,提出了一种挖掘加权最大频繁序列的新算法。该算法利用频繁项目出现的频率来计算频繁序列的权重,给出了频繁加权序列的定义,该定义的引入不仅可以找出较为重要的最大频繁序列,而且可以使挖掘结果同样具有反单调性,从能够加速剪枝,提高算法效率。实验结果表明,加权最大频繁序列算法是有效的。 相似文献
8.
9.
10.
11.
【目的/意义】利用数据挖掘技术在海量数据中快速、准确、有效的发现涉恐线索并及时处置是反恐工作的
重要手段之一。【方法/过程】本文研究如何利用频繁模式树对涉恐基础数据进行挖掘,提取涉恐特征的频繁项集。
首先通过对数据库中的涉恐人员信息进行涉恐特征计数排序并建立频繁模式树,然后在树结构中递归遍历发现满
足最小支持度阈值的频繁项集。【结果/结论】文中的方法可以快速发现大量基础数据中的涉恐关联属性,有利于在
系统中自动搜索重点涉恐人员,为反恐预警系统提供决策参考。通过与其他产生关联规则的方法结合使用,还可
以发现暴恐活动中不同因素的因果关系。 相似文献
12.
传统的关联规则挖掘技术过于依赖数据之间的关联属性,造成挖掘算法在高冗余知识空间关联规则不明显或者较弱的情况下挖掘耗时。本文提出一种应用与高冗余知识空间的优化数据挖掘算法。该算法首先找出最大频繁项集和频繁1-项集进行区域分类,然后利用已有频繁项集找出所有的其它频繁项集,去除冗余关联环境,节省了计算频繁项集的时间,节约了存储空间,使算法的效率得到提高。仿真实验结果证明了改进算法的可行性和有效性。 相似文献
13.
针对企业工作效率日益提高的需求,根据现有企业工作流管理系统的不足,对Apriori算法进行优化,提出MWPMA工作流频繁模式挖掘算法。 相似文献
14.
[目的/意义]对多源异构时空数据进行同现模式挖掘可以发现涉恐人员、涉恐物资、涉恐活动在邻近地点同时段共同出现的规律,为反恐工作提供包含时间特征和空间特征的情报信息。[方法/过程]在同位模式挖掘的基础上提出预先确定目标情报类别从而确定涉恐人员分类方式,使用概念层次树对涉恐物资和涉恐活动进行数据预处理,使得目标同现模式覆盖更多情报信息。[结果/结论]该方法与同位模式挖掘、频繁时间序列模式挖掘以及各种时空轨迹模式挖掘可以相互补充,覆盖多种不同的反恐情报信息,完善反恐预警机制,为反恐决策提供客观依据。 相似文献
15.
基于关联的聚类分析在个性化服务中的应用 总被引:2,自引:0,他引:2
运用关联规则,确定用户频繁访问模式,使用页面相似聚类分析对用户频繁访问集分类,挖掘具有相似访问兴趣的网络用户的浏览模式,并对相关算法作了改进,从满足用户个性化信息服务出发,给出一种基于关联的用户访问模式聚类方法.实践证明,将基于关联的聚类分析方法应用到个性信息服务中是有效的. 相似文献
16.
阐述了知识元定义及知识元挖掘技术概念和算法,对知识元挖掘技术在军事信息处理中的应用模式与框架进行了探讨。 相似文献
17.
从知识运转模式论知识挖掘 总被引:2,自引:0,他引:2
从组织中知识管理和知识的转化出发,给出了知识运转模式,并指出了知识挖掘技术在从内隐到外显的知识转化过程中所起的重要作用,阐明了知识挖掘的概念。从Lotus OA系统构架出发对知识挖掘所涉及的主要技术进行了剖析。 相似文献
18.
针对频繁项集挖掘时间与空间效率低的问题,提出一种基于New FP-tree的高效频繁项集挖掘算法。此算法利用New FP-tree结构存储事务数据库中的频繁项集信息,无需递归构造条件模式树,仅需两次扫描数据库即可生成所有频繁项集。最后的实验证明了该算法的有效性。 相似文献
19.