首页 | 本学科首页   官方微博 | 高级检索  
     

一个在数据流上快速建立决策树的算法
引用本文:刘丽. 一个在数据流上快速建立决策树的算法[J]. 连云港职业技术学院学报, 2005, 18(2): 61-64
作者姓名:刘丽
作者单位:连云港职业技术学院,江苏,连云港,222006
摘    要:决策树分类器是一个重要的数据挖掘问题,在数据流上建立决策树的关键问题是如何计算内部节点的最佳分裂标准。现有的算法有的不能处理数值型的属性,有的计算代价太高。本文采用将数值型的属性值分成适当的区间,根据它们gini index值的特殊性质,确定具有最大gini indes梯度的区间,因而可以快速地计算最佳分裂点,实现在流数据上快速地建立决策树。

关 键 词:决策树 流数据 Gini Indes梯度 最佳分裂标准
文章编号:1009-4318(2005)02-0061-04
收稿时间:2005-04-28
修稿时间:2005-04-28

An Algorithm for Rapidly Constructing the Decision Tree on Data Streams
LIU Li. An Algorithm for Rapidly Constructing the Decision Tree on Data Streams[J]. Journal of Lianyungang Technical College, 2005, 18(2): 61-64
Authors:LIU Li
Abstract:Decision tree classifier is an important data mining problem. The key issue in constructing the decision tree on data streams is to derive the best criterion of internal nodes, The existing algorithrms either cannot handle numerical attributes or have high computation cost. The paper divides the attribute value into proper intervals and identifies the interval with the maximum gini index gradient so as to determine the best splitdng point and make it true to construct decision tree on streaming data.
Keywords:decision tree   streaming data   Gini Index   gradient   the best splitting criterion
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号