一种基于信息熵的可伸缩决策树算法 |
| |
引用本文: | 耿焱.一种基于信息熵的可伸缩决策树算法[J].中国科技信息,2005(24):15. |
| |
作者姓名: | 耿焱 |
| |
作者单位: | 南京审计学院信息科学学院 |
| |
摘 要: | 提出了一种基于信息熵的可伸缩决策树生成算法SDT(AAScalableDecisionTreeAlgorithm)。与SPRINT算法不同,该算法使用基于信息熵增益的思想分割训练样本集,引入了新的数据结构:基于类别的属性表。该表记录存储了计算分割属性的所有信息,并且该表的大小不会随样本集的增大而增大,可以常贮主存。与SLIQ算法相比,SDTA算法彻底摆脱了主存容量对算法效率的限制。实验表明,SDTA算法能生成正确的决策树,而且具有良好的可伸缩性。
|
关 键 词: | 分类 决策树 可伸缩 |
本文献已被 CNKI 万方数据 等数据库收录! |
|