首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 468 毫秒
1.
为有效精确地挖掘海量数据流特征,提出采用数据集中位分割和冗余数据碎片合并的方法设计决策树并构建云平台数据特征挖掘模型。传统的云平台下数据挖掘中对碎片信息不做处理,使文本碎片成几何级增长,导致有用信息的丢失。通过挖掘冗余信息中符合挖掘条件的碎片特征,使用KD树进行数据挖掘索引,在迭代过程中,对数据进行层进中位分割,并结合碎片合并技术,构建数据挖掘云平台模型,对中位数进行维度匹配分箱,使数据的挖掘和传输率最大限度地得到利用。仿真实验证明了采用碎片合并的方法能有效提取冗余碎片中的有用特征信息,数据挖掘性能得到大幅度提升,在数据信息提取和管理中具有很好的推广意义。  相似文献   

2.
为有效定位识别和提取网络流量序列的暂态性异常特征,针对网络异常流量特征扰动性和暂态性特点,提出一种基于小波分解的二叉分类回归决策树主分量特征优化跟踪特征提取算法。利用训练集建立决策树模型,采用二叉分类回归决策树模型进行主分量特征优化跟踪建模,利用双正交提升小波分解得到的各层细节信号对暂态性扰动特征的敏感性,实现网络流量异常特征的定位提取和识别。仿真实验表明,改进算法的抗干扰能力和分辨率提高显著,暂态性异常特征谱图分辨能力提高,异常特征分布谱清晰可见,展示了较好的特征提取和状态识别性能。  相似文献   

3.
内容中心网络中,Internet用户通常更加关心移动终端的数据内容,需要对此进行有效挖掘,传统的内容中心网络移动终端数据挖掘模型采用关联性辅助挖掘算法,由于内容中心网络的数据之间的关联性是自反的和传递的,导致挖掘效果不好。提出一种基于压缩频谱联合特征识别的内容中心网络移动终端数据优化挖掘模型。构建网络模型和数据挖掘结构模型,进行移动终端数据提取预处理,该内容块被划分成多个分片,把特征数据并行化地存储到不同的存储服务器中,实现对移动终端数据的压缩频谱联合特征识别,达到数据挖掘的目的。仿真实验表明,采用该模型进行数据挖掘,具有较大数据挖掘吞吐量,使得数据存储对象数目有明显提升,数据挖掘精度和收敛性能得到提高。  相似文献   

4.
在软件故障测试和数据库访问中,对非显著特征数据的挖掘是难点,通过对非显著特征数据的挖掘,处理数据分布比较稀疏且呈现模式分布不规则的数据访问问题。提出一种基于链距离估计的非显著特征数据挖掘算法,在时域上对链距离估计模型进行平移处理,给出非显著特征数据的离群因子概念,提取关联度主特征量,基于链距离估计结果,得到有效特征挖掘概率密度值,实现对非显著特征数据挖掘算法改进。仿真实验表明,该算法使得无论是不同密度的点簇相互靠近还是出现模式偏离的情况,都能有效的挖掘出非显著特征点,从而增强了数据挖掘算法的有效性和通用性,采用该法能有效提高非显著特征数据的挖掘性能,数据挖掘的命中率较高,在数据库访问和软件故障测试等领域具有应用价值。  相似文献   

5.
为了提高对网络异常流量监测模型的置信度和准确性,降低虚警概率,防止漏报。需要对异常网络流量预测概率置信度区间进行优化设计。提出一种基于预测流量数据主特征建模与广域子空间重构的异常网络流量预测算法,提高预测概率置信度。把主特征建模投影到广域子空间中,获取网络异常流量数量的对偶子梯度预测结果,其表现为一组尺度,分析网络预测流量的概率置信度的伸缩变化,选用极大似然法对网络流量的预测概率置信度进行特征建模,得到概率置信度区间。提高预测置信度和精度。实验结果表明,该算法能有效提高异常网络流量的预测精度,通过在广域子空间中特征建模,保证了预测的概率置信度,减少预测误差,性能优越。  相似文献   

6.
提出一种基于协方差特征爬虫的网页语义概念树构建方法,引入语义概念决策树算法进行主特征建模,根据语义三叉特征决策树概率正则训练迁移法则,得到决策树网络节点最近时刻获得的数据集有效特征概率,采用协方差特征网页爬虫进行网页语义概念树构建算法的改进。通过协方差特征爬虫,进行自相关成分的独立快速分离,得到语义自相关检索编码,实现网页语义概念树构建指导信息检索。仿真结果表明,该算法能有效进行数据挖掘和网页语义概念树的构建,为信息定位提供了最优分叉路径,从而实现对主题热点信息的准确检索和定位,算法具有较好的网页召回和定位检索性能,数据召回率提高明显,展示了较好的应用价值。  相似文献   

7.
随着大数据信息技术的发展,数据在线监测和数据挖掘成为计算机信息领域研究的热点。通过对Web热点数据分割挖掘,提高信息热点追踪和Web数据分类能力。传统算法采用非结构化数据挖掘算法,无法有效对Web热点数据进行准确定位和分层挖掘。提出一种基于半结构化分割的Web热点数据挖掘算法。采用半结构化数据进行特征分割,基于优秀基因位进行差分进化,使寻优曲线不断趋于平缓,在多个节点上并行的运行比较脚本,采用半结构化分割,使得Web热点特征挖掘实现自适应寻优,得到Web热点数据的分配因子,提高了挖掘性能。仿真结果表明,该算法获得了良好的效率和精度,提高了Web热点数据挖掘的自适应寻优能力。  相似文献   

8.
引入或然状态指数矩阵,对网络文本特征进行指数分离处理和挖掘优化导向性控制,提出一种引入或然状态指数矩阵优化控制的网络文本特征导向性挖掘新技术。对具有或然性的文本数据进行分离修补导向性挖掘聚类,在文本数据择取过程中,将不同文本分量元素进行初始化倾向性分类处理,由指数矩阵确定元素属性类别概率,从而确定多个导向性聚类中心,从而实现了对或然网络文本特征的准确挖掘。仿真实验表明,新的挖掘技术能有效提取到模凌两可的或然性弱聚类导向性分类特征,数据挖掘准确率达到99.97%,而传统方法是根本无法对这类文本特征进行有效挖掘,展示了算法的优越模糊数据处理价值。  相似文献   

9.
决策树算法是数据挖掘系统中一个重要的分类算法,选择合理而有效的测试属性以及对决策树进行适当的修剪是决策树算法的关键内容之一。将决策树算法引入教务管理挖掘系统,并对决策树测试属性的选择算法以及预剪枝算法进行改进。以九江学院学生四级考试信息为例,结果表明改进的决策树算法对于数据挖掘更具可靠性和有效性。  相似文献   

10.
通过对网络流量的准确预测提高对网络的调控和监测水平,避免网络拥堵,确保网络畅通。传统的网络流量预测算法采用粒子群算法,在处理大规模的流量数据时,容易导致信息发散和易陷入局部极值点,流量预测准确度不高。提出一种基于多标记学习混合差分粒子群进化的网络流量预测算法。构建多分簇的无线网络流量数据传输模型,对网络流量进行时间序列分析,采用粒子群优化算法分别比较网络信息流中的频率波动是否相同,对相同的进行合并,基于自回归移动平均算法,进行粒子群信息链特征优选准则设计,采用多标记学习混合差分粒子群进化算法,把网络流量数据嵌入到内核空间的超球体中,进行离线阶段的网络流量预测优化。仿真结果表明,该算法对网络流量预测的精度较高,误差减少,具有较好的应用价值。  相似文献   

11.
对网络流量进行均衡处理,防止网络数据通信过程中产生数据波动,提高网络通信的稳定性,传统的网络流量均衡技术采用自适应信道均衡方法,算法对网络流量的初始频率具有较大的依赖性。提出一种基于反馈校验的网络流量均衡技术。构建网络流量时间序列分析模型,采用决策树模型方法对网络流量均衡信道进行模型构建,对网络流量中的波动振荡数据进行反馈校验,以流量自适应特征的度评价流量的波动振幅,消除波动特征,实现流量均衡。仿真结果表明,采用该算法具有较好的网络流量数据波动抑制性能,收敛性较好,保证了网络流量数据的稳定性通信传输。  相似文献   

12.
针对传统的异常信息流检测方法的不足,设计了一个异常信息流检测模型,该模型采用了数据挖掘中的决策树算法对信息流进行归纳分类,采用信息增益作为分类属性选择标准来构造规则决策树,针对网络流量进行分析,能提高检测速度.开辟了一条检测异常信息流的新途径.  相似文献   

13.
持续性实时监测数据的挖掘和调度常用在战场监控、森林火警监测等领域。在对持续性实时监测数据调度和挖掘中,因为战场监控、森林火警等持续性实时监测数据的挖掘中存在物理干扰,会产生时间延迟等风险,需要对其进行无偏估计和风险转化,提高数据的挖掘和实时监测性能。提出一种基于聚集树的持续性实时监测数据的无偏风险挖掘算法,并进行仿真实现。构建持续性实时监测数据的采集和预处理模型,进行监测数据的聚集树关联性分析,求得数据无偏相位特征,得到数据挖掘的最短无偏时延估计值,求得持续性实时监测数据的无偏风险挖掘最优路径无偏估计值。实验结果表明,该算法能有效避免数据挖掘过程中产生的时间延迟风险,通过无偏估计和风险转化,提高数据的挖掘和实时监测性能。  相似文献   

14.
姜楠  许维胜 《大众科技》2015,(1):26-28,39
校园一卡通系统通过对各种信息、资源的有效集成、整合和优化,能够实现学校对信息的有效配置和充分利用。文章采用数据挖掘技术针对学生校园消费活动的管理分析方面进行深入研究,首先通过数据预处理技术提取相关消费特征,并采用一种优化的K-means聚类算法,将学生分为几类,分析行为特征,以便高校学生工作人员分门别类的进行学生管理,最后将聚类结果输入决策树分类模型进行评估,以评价聚类结果。  相似文献   

15.
提出一种基于最大熵功率谱估计的Hadoop云平台下网络音视频数据特征挖掘方法,实现对数据信息的高速访问。构建数据挖掘Hadoop云平台和数据挖掘访问模型,设计最大熵功率谱特征提取算法,采用分段思想将同一时间段的视音频数据进行群体分割,分段提取最大熵功率谱特征。将提取的特征信息进行维度匹配分箱和溯源处理,实现信息恢复,最终完成高速数据访问。仿真测试表明,该算法能有效地实现对网络音视频数据的特征挖掘,提高访问效率,访问响应时间较当前方法缩短明显。  相似文献   

16.
Web网络中存在海量文本,需要进行合理高效的文本抽取,实现Web文本数据挖掘。由于Web文本数据的高维特性,文本抽取过程中自动分类配对困难。提出一种基于RBF神经网络隐节点共振致密配对的Web数据文本抽取算法,进行Web数据文本特征采样与关联主特征挖掘,在每次移动中形成RBF隐节点共振致密配对,得到最优文本特征选择的路径,建立RBF神经网络分类器,实现基于蚁群算法的特征抽取算法改进。实验结果表明,该算法能有效实现对隐节点的共振致密配对,特征挖掘跟踪性能较好,保障了挖掘性能,系统所提取的特征分量与其他模糊分量差距较小,文本正确抽取召回率高于传统方法,在Web网络数据文本抽取中具有优越可靠的应用价值。  相似文献   

17.
《科技风》2020,(5)
网络是把双刃剑,对学生来说有利也有弊。为了制定合理的管理措施,督促大学生及时规范自己的网络行为。该研究重点研究了数据挖掘算法的选择,最后选择决策树、关联规则、预测分析对学生上网行为中的重要数据进行挖掘,实现大数据网络行为属性与学生学习成绩之间相关属性分析。结果显示,在"流量数据"中,"上网时间长度长"无疑是导致在校学生正常学习水平差的罪魁祸首。研究结果:相当差的算法是逻辑关联回归,相对比逻辑回归好一点的是决策树挖掘算法,最优秀的数逻辑关联性和规则数据挖掘算法。  相似文献   

18.
石东贤 《科技风》2012,(2):277-278
旅游景点信用评估是一种典型的分类问题,本文概述了粗糙集和决策树的理论,基于这两种理论,提出了一个基于数据挖掘粗糙集理论与决策树分类技术相结合的信用评估方法来建立旅行景点的信用评估模型,利用粗糙集的知识约简的概念,对样本数据进行预处理,去除冗余属性对分类模型的影响,然后用决策树方法建立分类模型。最后通过Pawlak重要度的属性约简算法和ID3决策树算法实现了该模型。  相似文献   

19.
决策树算法是数据挖掘领域的核心分类算法之一,ID3算法则是最为经典的决策树算法。本文以ID3数据挖掘算法在债务管理中的应用为例,验证了算法的性能。  相似文献   

20.
随着信息技术的迅猛发展,大型数据库中的数据正在呈几何级数增长,冗余分类技术已经成为信息组织的重要手段。在总结归纳已有的冗余分类算法弊端的基础上,参考决策树算法提出了一种新的基于数据库抽样的海量数据冗余分类算法。算法引入宽度优先扩展思路,并给出了算法的基本思想和具体实现过程,探讨了并行环境下进行计算的优化步骤。在与SPRINT算法的比较实验中,新算法展现了良好的性能和分类效率。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号