首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 78 毫秒
1.
决策树算法是数据挖掘系统中一个重要的分类算法,选择合理而有效的测试属性以及对决策树进行适当的修剪是决策树算法的关键内容之一。将决策树算法引入教务管理挖掘系统,并对决策树测试属性的选择算法以及预剪枝算法进行改进。以九江学院学生四级考试信息为例,结果表明改进的决策树算法对于数据挖掘更具可靠性和有效性。  相似文献   

2.
对海量数据的处理能力是数据挖掘最关注的问题。决策树作为一种分类器,是数据挖掘中用到的一种基本方法之一。基于C4.5的决策树改进算法,是在一些典型的决策树分类算法的基础上提出的,基本思想是在建树过程中,用属性依赖度替代信息增益率来确定划分条件属性的顺序。该算法借鉴MedGen算法的阈值设定方法,在简化决策树剪枝和优化过程的同时,可优化C4.5算法中使用信息熵率的时间复杂度,避免了使用信息熵带来的不当划分。简述了该改进算法的执行过程,证明了算法的正确性。  相似文献   

3.
α-β剪枝算法是博弈树搜索算法中成熟而重要的一枝。本文给出其各种改进策略及实现技术,并给出实验结果分析。B*算法是α-β剪枝算法的挑战者,它给我们以新的视角看待博弈树搜索,并能克服α-β剪枝算法的一些缺陷。  相似文献   

4.
蔡琬琰 《情报探索》2011,(6):99-101
研究了基于数据挖掘的高校图书馆服务评价系统的设计,并利用新乡学院的图书馆服务评价数据,完成了从数据采集、数据预处理,到决策树生成、展示、剪枝,生成分类规则的完整过程,最终得出系统结论。  相似文献   

5.
针对不确定对象的最近邻反向查询没有考虑多种特征类型而不能满足复杂的应用场景的问题,提出了基于限界剪枝和概率剪枝的多类型概率最近邻反向(Multiple types probabilistic nearest neighbor reverse,MTPNNR)查询算法。限界剪枝利用最小耗费来修剪不可行解或者非最优解对象;概率剪枝是基于概率分布模型和不确定对象分解的策略,根据概率各个阀值和剪枝的深度来控制需要剪枝的精度。与原始基于定义的算法相比较,MTPNNR查询算法在CPU资源开销方面有比较大的优势,能够完成在较大数据复杂等环境下的查询。基于实验结果显示,MTPNNR算法在离散型的数据集和不确定数据集上有比较好的查询效率。  相似文献   

6.
决策树分类算法是数据挖掘中一个重要的内容,而ID3算法又是决策树分类算法中的一种重要方法且被广泛应用。然而在实际应用过程中,现存的决策树算法也存在着很多不足之处,如计算效率低下、多值偏向等。为了解决这些问题,提出了一种基于ID3算法的加权简化信息熵算法,它提高了决策树的构建速度,减少了算法的计算运行时间,同时也克服了ID3算法往往偏向于选择取值较多的属性作为测试属性的缺陷。并且随着数据规模的增大,决策树的分类性能表现得越好。  相似文献   

7.
本文详细介绍机器学习分类算法中的决策树算法,并详解如何构造,表示,保存决策树,以及如何使用决策树进行分类问题。  相似文献   

8.
决策树算法是数据挖掘中一个重要的内容,但是在实际应用过程中,现存的多种决策树算法也存在着很多不足之处。本文总结并分析了近年来数据挖掘技术在决策树算法方面的研究,探讨了进一步的研究发展方向。  相似文献   

9.
决策树算法是数据挖掘领域的核心分类算法之一,ID3算法则是最为经典的决策树算法。本文以ID3数据挖掘算法在债务管理中的应用为例,验证了算法的性能。  相似文献   

10.
决策树分类算法研究综述   总被引:4,自引:0,他引:4  
本文基于决策树分类算法的研究现状,重点介绍了一些极具代表性的算法,包括ID3、C4.5等,对各种决策树分类算法的基本思想进行阐述,分析比较各种典型算法的优点和不足,并对决策树分类算法所面临的问题进行了简要的阐述,为数据分类研究者提供借鉴。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号