决策树下引入残差数据合并的冗余数据挖掘 |
| |
引用本文: | 王倩.决策树下引入残差数据合并的冗余数据挖掘[J].科技通报,2014(6). |
| |
作者姓名: | 王倩 |
| |
作者单位: | 天津职业大学网络中心; |
| |
基金项目: | 天津市教育科学“十二五”规划课题(VE4035) |
| |
摘 要: | 提出采用残差数据合并技术的冗余数据优化挖掘算法,利用训练集建立决策树模型,引入C4.5决策树模型进行冗余数据主特征建模,在主分量特征决策树下,引入残差数据合并技术,设定数据残差特征伴随追踪模式,把传统方法中用于滤除的数据信息进行拼接伴随追踪定位,实现了冗余数据特征的优化挖掘。把方法应用到网络流量时间序列数据处理中实现网络异常监测,仿真实验表明,新的数据挖掘算法能有效提取到冗余数据特征作为有用检测特征,数据挖掘效率大幅提高,有效促进了海量数据隐藏特征的挖掘和应用,设计的网络流量监测软件能提高网络管理和监测实效性。
|
关 键 词: | 决策树 残差数据 数据挖掘 网络流量 |
本文献已被 CNKI 等数据库收录! |
|