期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

崔巍安海忠武森《情报杂志》2009,28(10)

由于其内在的计算复杂性,在密集型数据序列数据库中挖掘全部频繁项集往往非常困难,解决方案之一是挖掘最大频繁序列。传统的序列模式方法对满足最小支持度阈值的序列同等对待,但在真实数据库中不同的序列往往具有不同的重要程度。为解决上述问题,提出了一种挖掘加权最大频繁序列的新算法。该算法利用频繁项目出现的频率来计算频繁序列的权重,给出了频繁加权序列的定义,该定义的引入不仅可以找出较为重要的最大频繁序列,而且可以使挖掘结果同样具有反单调性,从能够加速剪枝,提高算法效率。实验结果表明,加权最大频繁序列算法是有效的。相似文献

2.

数据密集型网格示范站点建设与应用取得良好效果 总被引：1，自引：0，他引：1

下载免费PDF全文

茹加王晓辉《中国科学院院刊》2012,27(4):504-505

近年来,随着科学研究规模的日益扩大,科学家需要采集海量数据用于研究和解决复杂的科学问题,而科学数据呈数量级增长对计算技术提出了更大的挑战。数据密集型网格平台建立在网格技术基础上,是一种对海量数据进行高效分相似文献

3.

基于Kalman滤波的Web数据流抗干扰挖掘算法

《科技通报》2015,(12)

提出一种基于变维Kalman滤波的Web海量数据流抗干扰挖掘算法。构建Web环境下的海量数据挖掘数据流信息模型和噪声干扰模型,结合现代信号处理方法,设计变维Kalman滤波算法进行海量数据流信号滤波预处理,把Web海量数据流映射为一组非线性宽带调频信号模型,采用信号检测算法实现Web海量数据的抗干扰挖掘。仿真结果表明,采用该算法进行Web海量数据信息的抗干扰挖掘,具有较高的数据检测精度和准确挖掘性能,具有较高的抗干扰性和鲁棒性。相似文献

4.

Web日志挖掘预处理中复杂问题的解决方法 总被引：1，自引：0，他引：1

徐志玮《现代情报》2008,28(6):79-81

随着网络的日益普及和信息技术的进步,Web日志挖掘的数据收集和原始数据处理工作变得越来越复杂,使得预处理技术也要进行相应的提高.本文通过对预处理中出现的复杂问题,进行了详细的分析,并列出了目前比较成熟的算法. 相似文献

5.

基于增长模型的电力设备缺失数据筛查算法研究

罗清雷高宝琪魏伟马捍超《科技通报》2019,35(8):182-185,215

采用传统方法对电力设备缺失数据进行筛查时,由于计算强度较大,存在运行时间长、筛查效果差的问题,提出基于增长模型的电力设备缺失数据筛查算法。在考虑数据缺失机制的条件下运用主成分分析方法对电力设备各项数据进行挖掘,根据挖掘结果构建增长模型,运用该模型对电力设备数据的法向矢量进行估算以及调整;在此基础上通过贝叶斯理论实现对电力设备缺失数据的有效提取,最终完成对电力设备缺失数据的准确筛查。分析实验结果可知,与传统方法相比,所提算法能够有效减少数据筛查用时,并且筛查精准度较高,说明该算法具有有效性,可以为相关研究提供一定的理论与实践基础。相似文献

6.

基于Web的数据挖掘技术 总被引：1，自引：0，他引：1

冯敬益《中国科技信息》2009,(18):92-93

Web数据挖掘有很多研究热点,其中关联规则挖掘是Web数据挖掘领域研究的一个重要方面.本文首先对数据挖掘、Web数据挖掘和Web数据预处理等相关知识进行了阐述;然后研究了关联规则基本理论及关联规则经典算法;最后为了解决现实数据库中每个项目的分配不均匀性和重要性差异,重点研究了加权关联规则挖掘算法. 相似文献

7.

并行关联规则挖掘算法比较研究

朱红霞许凌云李媛《科技风》2015,(8)

怎样从大量的数据中挖掘数据的关联性已经成为数据挖掘领域的一个重要问题。由于处理时间与空间的不足,大多数平行关联规则挖掘算法必须扫描数据库至少两次,因此原有的处理方法基本上很难完成挖掘任务,所以需要一个并行算法来解决这些问题。而只扫描一次的平行算法(SO算法)已经超过了共享内存多处理算法,因为它只扫描一次数据库。相似文献

8.

短期负荷预测中气象因素的Fisher信息建模方法

蔡舒平孙华辰《黑龙江科技信息》2018,(17)

挖掘合适的气象因素处理方法是提高预测精度的关键,Fisher信息理论为此类问题的解决提供了一种新途径,该方法用于解决大数据环境下短期负荷预测中实时气象因素的建模问题。针对气象变量,Fisher信息计算问题首先被解决,据此给出了基于Fisher信息的气象因素建模方法。相似文献

9.

抗外界浪涌干扰设备故障信号挖掘算法

陈效军杨章琼《科技通报》2014,(2)

提出一种抗浪涌电压干扰的电力设备故障挖掘算法,针对故障数据集合中的数据敏感性下降问题,运用故障类间数据的相似性,计算故障之间的类间相似特征。将相似度较高的数据分配到同一个类簇,在运用遗传算法进行特征分类寻优,保证最优解的唯一性,排除故障数据受到干扰造成的检测弊端。实验证明,该方法可以很好的解决浪涌干扰下的电力设备故障挖掘效率,与引入前相比,挖掘的结果更加准确,鲁棒性较强。相似文献

10.

基于FP-Growth树项目约束挖掘算法的仿真实现

程堃《黑龙江科技信息》2012,(18):70

基于FP-Growth树算法的项目约束挖掘的一个具体仿真实现,设计出了系统的体系结构,根据挖掘流程与项目约束挖掘的过程,将系统分成三个功能模块:数据预处理模块功能,数据库排序功能模块与规则挖掘功能模块。使用真实数据对系统进行应用,对挖掘结果进行分析总结,最终确定了基于FP-Growth树的项目约束挖掘算法的可行性。相似文献