共查询到10条相似文献,搜索用时 31 毫秒
1.
由于其内在的计算复杂性,在密集型数据序列数据库中挖掘全部频繁项集往往非常困难,解决方案之一是挖掘最大频繁序列。传统的序列模式方法对满足最小支持度阈值的序列同等对待,但在真实数据库中不同的序列往往具有不同的重要程度。为解决上述问题,提出了一种挖掘加权最大频繁序列的新算法。该算法利用频繁项目出现的频率来计算频繁序列的权重,给出了频繁加权序列的定义,该定义的引入不仅可以找出较为重要的最大频繁序列,而且可以使挖掘结果同样具有反单调性,从能够加速剪枝,提高算法效率。实验结果表明,加权最大频繁序列算法是有效的。 相似文献
2.
3.
4.
Web日志挖掘预处理中复杂问题的解决方法 总被引:1,自引:0,他引:1
随着网络的日益普及和信息技术的进步,Web日志挖掘的数据收集和原始数据处理工作变得越来越复杂,使得预处理技术也要进行相应的提高.本文通过对预处理中出现的复杂问题,进行了详细的分析,并列出了目前比较成熟的算法. 相似文献
5.
采用传统方法对电力设备缺失数据进行筛查时,由于计算强度较大,存在运行时间长、筛查效果差的问题,提出基于增长模型的电力设备缺失数据筛查算法。在考虑数据缺失机制的条件下运用主成分分析方法对电力设备各项数据进行挖掘,根据挖掘结果构建增长模型,运用该模型对电力设备数据的法向矢量进行估算以及调整;在此基础上通过贝叶斯理论实现对电力设备缺失数据的有效提取,最终完成对电力设备缺失数据的准确筛查。分析实验结果可知,与传统方法相比,所提算法能够有效减少数据筛查用时,并且筛查精准度较高,说明该算法具有有效性,可以为相关研究提供一定的理论与实践基础。 相似文献
6.
基于Web的数据挖掘技术 总被引:1,自引:0,他引:1
Web数据挖掘有很多研究热点,其中关联规则挖掘是Web数据挖掘领域研究的一个重要方面.本文首先对数据挖掘、Web数据挖掘和Web数据预处理等相关知识进行了阐述;然后研究了关联规则基本理论及关联规则经典算法;最后为了解决现实数据库中每个项目的分配不均匀性和重要性差异,重点研究了加权关联规则挖掘算法. 相似文献
7.
8.
挖掘合适的气象因素处理方法是提高预测精度的关键,Fisher信息理论为此类问题的解决提供了一种新途径,该方法用于解决大数据环境下短期负荷预测中实时气象因素的建模问题。针对气象变量,Fisher信息计算问题首先被解决,据此给出了基于Fisher信息的气象因素建模方法。 相似文献
9.
提出一种抗浪涌电压干扰的电力设备故障挖掘算法,针对故障数据集合中的数据敏感性下降问题,运用故障类间数据的相似性,计算故障之间的类间相似特征。将相似度较高的数据分配到同一个类簇,在运用遗传算法进行特征分类寻优,保证最优解的唯一性,排除故障数据受到干扰造成的检测弊端。实验证明,该方法可以很好的解决浪涌干扰下的电力设备故障挖掘效率,与引入前相比,挖掘的结果更加准确,鲁棒性较强。 相似文献
10.
基于FP-Growth树算法的项目约束挖掘的一个具体仿真实现,设计出了系统的体系结构,根据挖掘流程与项目约束挖掘的过程,将系统分成三个功能模块:数据预处理模块功能,数据库排序功能模块与规则挖掘功能模块。使用真实数据对系统进行应用,对挖掘结果进行分析总结,最终确定了基于FP-Growth树的项目约束挖掘算法的可行性。 相似文献