首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 156 毫秒
1.
通过学习训练数据集来构造分类树的策略可能无法达到最好的泛化性能。随机噪声和某些决策仅基于少量训练数据的情况都会导致决策树的分类精度下降,并且过度拟合训练数据集。避免过度拟合主要是通过对树的剪枝来实现,包括预剪枝和后剪枝。后剪枝方法有很多种,主要从计算复杂性、误差估计和算法理论基础角度分析其中的REP、MEP和规则后剪枝算法。  相似文献   

2.
决策树后剪枝算法的研究   总被引:2,自引:0,他引:2  
决策树学习策略广泛应用于模式识别和机器学习等领域,用来解决与分类相关的问题。决策树剪枝的作用是简化决策树,提高决策树的泛化能力,避免对训练集的过适应,是决策树学习中的重要研究内容。本详细描述了常用的四种后剪枝算法,分析了后剪枝技术的研究与发展现状,为具体应用中选择剪枝算法提供了一定的理论基础。  相似文献   

3.
刘冲  杨磊  李娜 《教育技术导刊》2016,15(12):33-34
分类是数据挖掘的一个重要课题。分类的目的是建立一个分类模型,该模型能把数据库中的数据项映射到给定类别中的某一个利用该模型形成分类规则并预测未来数据趋势。决策树归纳是经典的分类算法,构建决策树模型算法中最有影响力的方法是ID3算法。针对ID3算法缺点,使用预剪枝和后剪枝相结合的办法处理决策树中的过学习情况,可生成一个更简单、更精确的决策树。  相似文献   

4.
针对决策树算法C4.5在处理数据挖掘分类问题中出现的算法低效以及过拟合问题,提出一种改进的TM-C4.5算法。该算法主要改进了C4.5算法的分支和剪枝策略。首先,将升序排序后的属性按照边界定理,得出分割类别可能分布的切点,比较各点的信息增益和通过贝叶斯分类器得到的概率,使用条件判断确定最佳分割阈值;其次,使用简化的CCP(Cost-Complexity Pruning)方法和评价标准,对已生成决策树的子树根节点计算其表面误差率增益值和S值,从而判断是否删除决策树节点和分支。实验结果表明,用该算法生成的决策树进行分类更为精确、合理,表明TM-C4.5算法有效。  相似文献   

5.
利用数据挖掘技术研究高职院校学生成绩的影响因素,对高职学生成绩管理具有重要意义。决策树法是数据挖掘的主要技术和方法,利用决策树C4.5算法系统研究了我校信息工程学院二年级学生成绩影响因素,建立了影响学生成绩的决策树模型,使学校有针对性的开展学生管理工作。  相似文献   

6.
利用数据挖掘技术中的决策树算法,通过决策树ID3算法中的信息增益方法确定属性从而生成决策树,分析出学生成绩优良与学生自身的五个因素有关,通过分析,找出影响学生成绩优秀的潜在因素。以加强学生成绩科学化、规范化管理,提高考试的优秀率。  相似文献   

7.
决策树ID3算法在学生成绩中的应用   总被引:2,自引:0,他引:2  
介绍了数据挖掘中决策树的分类方法和概念,以及著名的ID3算法,同时也介绍了ID3算法在学生成绩中的应用.  相似文献   

8.
应用数据挖掘中的K-means算法对学生成绩数据表进行分类,得到成绩的定性评价,并对分类后的结果使用ID3算法建立决策树分析,得到影响成绩的关键因素是上课出勤次数,其他各种因素对成绩的影响相对较小。通过数据挖掘可将藏匿于海量数据中的有用信息挖掘出来,将其应用于成绩影响因素分析,能够促进学校教学工作的进一步提升。  相似文献   

9.
文章主要采用数据挖掘技术中的决策树C4.5算法,对本校学生成绩中的大量数据进行处理,从中选取决策属性,构造决策树,并提取分类规则,从而获取不同类型的学生与成绩之间的关系.试验结果表明,C4.5算法能够将数据进行准确分类和预测,最终得到有价值的结论,供教师决策分析.  相似文献   

10.
分类回归树是一种优良的决策树算法,有广泛的应用。本文探讨了分类回归树算法及应用,首先回顾了分类回归树的起源及应用,其次分析了分类回归树在均匀成本和非均匀成本下的构造,接着讨论了分类回归树的剪枝和验证过程,最后我们对其进行了总结。  相似文献   

11.
决策树是归纳学习和数据挖掘的重要方法,通常用来形成分类器和预测模型。对网络课程知识点个性化设计中的大量数据,运用数据挖掘算法中的决策树C4.5算法对所给数据进行处理,选取决策属性,构造决策树,提取分类规则,获取每一个知识点与不同类型的学生之间的关系。通过实验仿真发现,C4.5决策树算法取得了较为理想的分类预测效果。  相似文献   

12.
决策树是数据挖掘中的一种重要分类方法.在此以粗糙集理论中的正域为启发式函数,设计了一种新的、有效的决策树构造方法.该算法具有较大的灵活性.能从测试属性空间逐次删除已使用过的属性.避免对这些属性进行重复测试,减少测试空间,降低了树的复杂性,从而提高了分类效率.最后,实例验证了算法的可行性与有效性.  相似文献   

13.
决策树通过对获取的样本数据属性使用信息论知识原理进行解析和归纳,最终形成类似于流程图的树型结构形式。ID3算法是典型采用贪心算法的归纳学习算法,其使用递归方式采用贪心算法来生成决策树。与其他分类技术算法比较,ID3算法有着自己的优势,但在实际应用中,采用决策树ID3算法进行分类时,需要先对数据进行一些处理或改进。  相似文献   

14.
社交网络的快速发展,微博成为主要的社交媒体平台,针对如何预测微博文本的未来互动数,对微博进行有效的分发控制的问题,提出一种基于并行决策树的微博互动数所属级数预测的方法。首先,对用户以往发表的微博进行用户特征和微博文本特征的处理;然后,使用并行决策树分类算法对训练数据进行分类模型的构建;最后使用得到的分类模型对新微博文本的互动数所属级数进行分类预测。通过对比算法的实验,验证了所提方法具有较高的分类精度和较好的可扩展性,能够对微博所属级数进行有效的分类预测。  相似文献   

15.
本文分析了基于正区域的决策树生成算法的不足,针对这些不足,提出了基于正区域及其分类纯度的决策树算法。该方法计算简单,易于理解,并用实例说明了该方法的优越性。  相似文献   

16.
决策树是分类的常用方法.该文针对一个局域网上模拟的入侵检测问题,描述了对利用决策树方法学习的一种优化实现.并且对怎样处理缺失数据、连续属性的离散化、怎样剪枝以及分类法的准确率评估及提高等关键技术进行了研究.实验证明,该方法可为入侵检测系统生成有效的决策树.  相似文献   

17.
针对智能监控中行人行为难于识别的问题,提出了一种基于改进支持向量机的行人行为分类的解决方法.针对背景建模和前景提取精确度的难题,把视频中有活动的部分表示成一组时空兴趣点;针对行动方式具有无固定方式和模糊特点的问题,先采用模糊聚类求每类行为样本聚类中心,再加入决策树思想,构建一种支持向量机决策树多值分离器进行行为分类.在国际上通用行为KTH数据库进行了实验,获得较高的识别率.  相似文献   

18.
随着教育市场化与信息化进程的推进,学生保持越来越受人关注了,而传统的学生资源管理方法已经很难适应新的教育环境。在此篇文章中我们简述了分类挖掘技术并分析了学生保持工程中的学生流失问题,在此基础上,我们将决策树分类模型运用到学生资源数据仓库的挖掘系统中,并取得了较好的效果。  相似文献   

19.
经典决策树算法不能处理树构建和分类过程中的不确定数据,针对这一局限,提出基于概率分布的方法,把决策树分类技术扩展到含有不确定数据的环境中。然后,针对软件外包评价中普遍存在着不确定数据,应用决策树分类方法,对软件外包公司进行客观评价。实验表明,本文提出的基于不确定数据的决策树分类算法能够实现对软件外包评价的定量研究。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号