首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
对大数据的频繁项集挖掘是关联规则挖掘的关键步骤,通过有效的频繁项挖掘提高大数据量数据库的访问效率。传统方法中对大数据的频繁项集挖掘采用FP-Growth的粗糙集挖掘算法,扩展性和容错性不好。提出一种基于贝叶斯粗糙集的大数据频繁项挖掘技术,引入后缀项表的概念,通过后缀项表的构建,保留频繁项集的完整信息。构建FP-Tree,生成闭频繁项集,计算样本的密度,并抽取高密度区域的点集作为聚类中心集合,进行后缀项表的构造,按支持度分成若干集合,对各约简集内的属性集合进行融合,用变精度粗糙集的贝叶斯粗糙进行数据挖掘算法改进,仿真结果表明,算法不受可变参数的影响,鲁棒性较高,数据挖掘的准确度较高,运行时间较短。算法将在人工智能和数据挖掘领域具有更广的应用前景。  相似文献   

2.
构建云计算网络下的安全等级评估模型,提出一种基于模糊集和粗糙集数据挖掘的云计算网络下安全等级评估算法,实现对云计算和云存储的安全综合评估和预测。结果表明,采用该安全等级评估模型,具有较好的数据监测和挖掘能力,有效实现对云计算网络的危险数据和病毒检测,性能较好,保证了网络安全。  相似文献   

3.
在大型流媒体数据库数据集中,交叉性数据的鲁棒性挖掘结构建立是实现对数据库差异属性分类和数据访问的基础。传统方法对大型数据库中的交叉性数据的鲁棒性挖掘结构建模采用基于遗传算法的数据集聚调度方法,存在较大的路径损耗,数据挖掘的鲁棒性不好。提出改进的基于局部离群点检测遗传进化的大型数据库交叉型数据挖掘模型,构建基于遗传算法的大型流媒体数据库挖掘结构,进行大型流媒体数据库中交叉型数据信息流特征预处理,结合交叉性型数据的离群因子概念,调整流媒体数据调度的位置变换策略,实现交叉性数据的鲁棒性挖掘算法改进。仿真实验结果表明,该算法能有效数据挖掘的a最大匹配率和局部离群点检测性能,保证了数据挖掘的鲁棒性,各项参数指标优于传统方法,展示了较好的应用价值。  相似文献   

4.
在软件故障测试和数据库访问中,对非显著特征数据的挖掘是难点,通过对非显著特征数据的挖掘,处理数据分布比较稀疏且呈现模式分布不规则的数据访问问题。提出一种基于链距离估计的非显著特征数据挖掘算法,在时域上对链距离估计模型进行平移处理,给出非显著特征数据的离群因子概念,提取关联度主特征量,基于链距离估计结果,得到有效特征挖掘概率密度值,实现对非显著特征数据挖掘算法改进。仿真实验表明,该算法使得无论是不同密度的点簇相互靠近还是出现模式偏离的情况,都能有效的挖掘出非显著特征点,从而增强了数据挖掘算法的有效性和通用性,采用该法能有效提高非显著特征数据的挖掘性能,数据挖掘的命中率较高,在数据库访问和软件故障测试等领域具有应用价值。  相似文献   

5.
提出一种基于变维Kalman滤波的Web海量数据流抗干扰挖掘算法。构建Web环境下的海量数据挖掘数据流信息模型和噪声干扰模型,结合现代信号处理方法,设计变维Kalman滤波算法进行海量数据流信号滤波预处理,把Web海量数据流映射为一组非线性宽带调频信号模型,采用信号检测算法实现Web海量数据的抗干扰挖掘。仿真结果表明,采用该算法进行Web海量数据信息的抗干扰挖掘,具有较高的数据检测精度和准确挖掘性能,具有较高的抗干扰性和鲁棒性。  相似文献   

6.
随着大数据信息技术的发展,数据在线监测和数据挖掘成为计算机信息领域研究的热点。通过对Web热点数据分割挖掘,提高信息热点追踪和Web数据分类能力。传统算法采用非结构化数据挖掘算法,无法有效对Web热点数据进行准确定位和分层挖掘。提出一种基于半结构化分割的Web热点数据挖掘算法。采用半结构化数据进行特征分割,基于优秀基因位进行差分进化,使寻优曲线不断趋于平缓,在多个节点上并行的运行比较脚本,采用半结构化分割,使得Web热点特征挖掘实现自适应寻优,得到Web热点数据的分配因子,提高了挖掘性能。仿真结果表明,该算法获得了良好的效率和精度,提高了Web热点数据挖掘的自适应寻优能力。  相似文献   

7.
在CStor云数据库访问中,细粒度云存储数据的信息特征存在个体较大差异,访问路径产生多频偏移,数据访问调度性能受限。传统方法中采用PSO局部搜索方法进行访问路径修正,搜索效率低,个体更新较慢。提出一种基于细粒度云存储数据迭代恢复匹配的云数据库访问路径偏移修正算法,以PSO多信息融合Pareto支配集为指导,构建多信息融合细粒度数据的主特征模型,采用迭代恢复匹配方法增加了局部搜索提高搜索到全局最优解的几率,实现路径偏移修正。仿真实验采用3组测试集对CStor云数据库进行访问调度和路径偏移修正,结果表明采用该算法,实现对访问路径的动态实时修正,收敛距离较小,提高了CStor云数据库访问和数据挖掘性能。  相似文献   

8.
提出一种基于最大熵功率谱估计的Hadoop云平台下网络音视频数据特征挖掘方法,实现对数据信息的高速访问。构建数据挖掘Hadoop云平台和数据挖掘访问模型,设计最大熵功率谱特征提取算法,采用分段思想将同一时间段的视音频数据进行群体分割,分段提取最大熵功率谱特征。将提取的特征信息进行维度匹配分箱和溯源处理,实现信息恢复,最终完成高速数据访问。仿真测试表明,该算法能有效地实现对网络音视频数据的特征挖掘,提高访问效率,访问响应时间较当前方法缩短明显。  相似文献   

9.
通过分析Pawlak粗糙集模型在数据挖掘中应用的局限性,提出了一种基于变精度粗糙集模型的数据挖掘方法。在数据挖掘中采用变精度粗糙集方法对胶合板缺陷数据进行属性约简和规则提取,并将所得规则用于分类。结果表明:变精度粗糙集改进了Pawlak粗糙集的不足,具有更高的可靠性和鲁棒性。  相似文献   

10.
罗蓉 《科技通报》2014,(4):137-139
对网络隐晦词汇的挖掘是从网络平台上成功提取先进信息的重要方法,传统的网络隐晦词汇挖掘方法采用基于词频和访问次数统计分析的方法,在小数据量时可以很好的实现挖掘,但数据量大时,效果很差。提出一种基于异层迭代算法的网络隐晦词汇深挖技术,首先对所有的网络词汇进行分层,对于分层结果,每层单独进行数据挖掘,在层数据挖掘的基础上,通过层与层之间的迭代方法,实现全局的隐晦词汇挖掘。最后采用一组热门加隐晦的词汇及进行测试实验,结果显示,采用基于异层迭代算法的网络隐晦词汇深挖技术,隐晦词汇被很好的挖掘出来,具有很好的应用价值。  相似文献   

11.
对电磁脉冲信号相位特征的准确挖掘和参量估计可以有效准确地确定信号源的方位,实现对识别目标的准确定位。传统的相位特征挖掘算法采用贝叶斯估计算法,算法在受到脉冲干扰时估计性能不好。提出一种基于机器学习的电磁脉冲信号相位特征挖掘算法,实现对相位估计精度的改进提高。首先构建电磁脉冲信号的模型,得到相位特征挖掘模型原始模型,求解相位模糊数搜索结合解得到两个阵列输出数据的相位差。计算电磁脉冲信号参数相位补偿项,采用机器学习算法进行电磁脉冲信号相位特征挖掘,构建调频信号作为估计目标方位角的载波信号,采用最小二乘拟合求斜率最终实现相位特征等相关信息的挖掘。仿真实验表明,该算法能准确估计出电磁脉冲信号辐射源的相位等参数信息,相位特征挖掘性能较好,展示了优越的数据挖掘和目标检测定位性能。  相似文献   

12.
基于J2EE的Web数据挖掘系统框架评价体系研究   总被引:1,自引:0,他引:1  
邢国春  翟云波 《情报科学》2007,25(7):1066-1068,1079
本文简要介绍了Web挖掘的概念以及数据挖掘技术与算法,阐述数据挖掘系统结构,并对其框架及实现方法进行了探讨,讨论基于J2EE平台的MVC设计框架下Web数据挖掘系统体系结构。最后将对系统进行评价分析。  相似文献   

13.
随着信息化时代的来临,数据量呈现直线上升,如何从这海量数据中提取有效信息是信息化发展必须解决的问题。传统数据结构设计采用数组、链表或者关联容器的数据结构设计方法,无法解决数据海量时带来的空间离散性和数据关联性问题,数据分析效率低。为此提出一种基于数据挖掘的点线面多层数据结构设计方法,采用K-means算法对数据进行挖掘,提取数据特征,然后设计了点、线、面多层数据结构,最后采用反距离插值的方法对数据的空间性能进行分析,并以实际空间离散数据为对象进行分析。结果显示,采用新设计的数据结构后,数据分析耗费时间更短,性能更加优越。  相似文献   

14.
提出一种基于随机近场混叠谱分析的网络攻击数据散布特征挖掘算法,实现对衰落噪声干扰下的网络攻击信号的准确检测。采用自适应陷波器对衰落干扰噪声进行滤波降噪预处理,提高了待检测信号的纯度,进行随机近场混叠谱分析,采用时频分析方法进行攻击信号的时延估计,提取随机近场混叠谱特征,实现网络攻击数据散布特征挖掘优化。仿真实验表明,采用该算法能有效提取在强衰落噪声干扰下的网络攻击数据时频散布特征点,特征聚焦性能明显,提高了对网络攻击数据的检测性能。  相似文献   

15.
Web网络中存在海量文本,需要进行合理高效的文本抽取,实现Web文本数据挖掘。由于Web文本数据的高维特性,文本抽取过程中自动分类配对困难。提出一种基于RBF神经网络隐节点共振致密配对的Web数据文本抽取算法,进行Web数据文本特征采样与关联主特征挖掘,在每次移动中形成RBF隐节点共振致密配对,得到最优文本特征选择的路径,建立RBF神经网络分类器,实现基于蚁群算法的特征抽取算法改进。实验结果表明,该算法能有效实现对隐节点的共振致密配对,特征挖掘跟踪性能较好,保障了挖掘性能,系统所提取的特征分量与其他模糊分量差距较小,文本正确抽取召回率高于传统方法,在Web网络数据文本抽取中具有优越可靠的应用价值。  相似文献   

16.
郭玲 《科技通报》2015,(3):216-219
对可产生潜在威胁的网络数据进行挖掘的过程中,采用传统关联规则方法无法运算潜在威胁数据的关联性,降低潜在威胁数据挖掘的准确性,提出一种基于区域频繁扩展树的支持向量机回归算法,用于挖掘网络潜在威胁数据,构建潜在威胁下网络数据的区域频繁扩展树,获取潜在威胁下网络数据间的关联性,依据潜威胁下网络数据的关联性塑造基于支持向量机回归网络潜在威胁数据挖掘模型,模型利用支持向量回归估计模型分析数据回归曲线的平稳度,对比回归预测值同真实值间残差,对检测数据中的潜在威胁数据进行识别,完成潜在威胁下网络数据的准确挖掘。实验结果说明,采用所提方法对不同复杂度潜在威胁下的网络数据进行挖掘,具有较高精确度。  相似文献   

17.
基于多因素方差分析的文本向量特征挖掘算法   总被引:2,自引:0,他引:2  
文本向量特征挖掘应用于信息资源组织和管理领域,在大数据挖掘领域具有较大应用价值,传统算法精度不好。提出一种基于多因素方差分析的文本向量特征挖掘算法。使用多因素方差分析方法得到多种语料库的特征挖掘规律,结合蚁群算法,根据蚁群适应度概率正则训练迁移法则,得到种群进化最近时刻获得的数据集有效特征概率最大值,基于最优划分的K-means初始聚类中心选取算法,先对数据样本进行划分,然后根据样本分布特点来确定初始聚类中心,提高文本特征挖掘性能。仿真结果表明,该算法提高了文本向量特征的聚类效果,进而提高了特征挖掘性能,具有较高的数据特征召回率和检测率,时间耗时较少,在数据挖掘等领域应用价值较大。  相似文献   

18.
刘云枫  柯林 《情报杂志》2008,27(5):55-57
提出一种数据挖掘算法,在数据挖掘的同时进行数据预处理,这种算法保证了数据的真实性,省略了数据预处理环节,规避了粗糙集算法对数据规范性的严格要求.  相似文献   

19.
在浓雾环境下采集的视觉图像出现突兀点,需要进行平滑处理,提高对浓雾环境下的图像成像和识别能力。传统方法中采用差频控制的浓雾图像突兀点平滑处理算法,图像采集出现视觉偏移时平滑处理效果不好。提出一种基于视觉偏移修正的浓雾图像突兀点平滑处理算法,基于浓雾天气条件下单色大气散射模型,物体表面的反射光由于大气粒子的散射而损失,得到雾点散射损失,采用视觉偏移修正的算法,提高对浓雾图像的视觉偏移修正能力,由于起点坐标和视线方向出现视觉偏移,采用去雾滤波算法提高突兀点的平滑性能,得到浓雾图像的去雾滤波系统函数,通过边缘检测得到图像的突兀点平滑结构,进行Hough变换直线检测,实现视觉偏移修正和突兀点平滑改进。仿真结果表明,该算法具有较好的突兀点平滑处理性能,无论是细节还是浓雾图像的色彩都恢复得比较自然和清晰,去雾效果较好,平滑处理的图像有较高的配准率,展示了该算法的优越性能。  相似文献   

20.
在当前的复杂数据挖掘方法中,多是基于关联规则进行关联挖掘,一旦数据之间的关联性被大量的冗余关联打破,形成数据的无序性,就会出现挖掘耗时,挖掘错误较多的问题.为了解决这一问题,本文提出一种基于信誉兴趣区间划分的数据优化查询算法.在海量的数据中,针对错综复杂的数据关系,通过信誉兴趣函数对数据进行较为清晰地划分.尤其在关联规则较为混乱的情况下,这种方法能够得到更为准确的数据分类区间.实验结果表明,这种数据挖掘方法针对大型数据库中的海量数据挖掘效果更佳,且挖掘算法速度更快,效率更高.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号