首页 | 本学科首页   官方微博 | 高级检索  
     检索      

一种基于信息熵的可伸缩决策树算法
引用本文:耿焱.一种基于信息熵的可伸缩决策树算法[J].中国科技信息,2005(24):15.
作者姓名:耿焱
作者单位:南京审计学院信息科学学院
摘    要:提出了一种基于信息熵的可伸缩决策树生成算法SDT(AAScalableDecisionTreeAlgorithm)。与SPRINT算法不同,该算法使用基于信息熵增益的思想分割训练样本集,引入了新的数据结构:基于类别的属性表。该表记录存储了计算分割属性的所有信息,并且该表的大小不会随样本集的增大而增大,可以常贮主存。与SLIQ算法相比,SDTA算法彻底摆脱了主存容量对算法效率的限制。实验表明,SDTA算法能生成正确的决策树,而且具有良好的可伸缩性。

关 键 词:分类  决策树  可伸缩
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号