基于中位分割碎片合并的特征挖掘云平台设计 |
| |
引用本文: | 廉文武.基于中位分割碎片合并的特征挖掘云平台设计[J].科技通报,2014(6). |
| |
作者姓名: | 廉文武 |
| |
作者单位: | 玉林师范学院计算机科学与工程学院; |
| |
基金项目: | 国家自然科学基金项目(61364020);校级青年课题重点项目(2012YJQN06) |
| |
摘 要: | 为有效精确地挖掘海量数据流特征,提出采用数据集中位分割和冗余数据碎片合并的方法设计决策树并构建云平台数据特征挖掘模型。传统的云平台下数据挖掘中对碎片信息不做处理,使文本碎片成几何级增长,导致有用信息的丢失。通过挖掘冗余信息中符合挖掘条件的碎片特征,使用KD树进行数据挖掘索引,在迭代过程中,对数据进行层进中位分割,并结合碎片合并技术,构建数据挖掘云平台模型,对中位数进行维度匹配分箱,使数据的挖掘和传输率最大限度地得到利用。仿真实验证明了采用碎片合并的方法能有效提取冗余碎片中的有用特征信息,数据挖掘性能得到大幅度提升,在数据信息提取和管理中具有很好的推广意义。
|
关 键 词: | 中位分割 碎片合并 特征挖掘 云平台 |
本文献已被 CNKI 等数据库收录! |
|