首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
为了提高C4.5决策树算法的有效性,提出一种改进的C4.5决策树算法。结合粗糙集理论的属性约简算法和Fayyad边界点判定定理,对C4.5算法进行了改进,利用UCI数据集进行了实验。结果表明,改进的C4.5算法不仅提高了准确率,而且缩小了决策树规模,减少了分类时间。  相似文献   

2.
文章主要采用数据挖掘技术中的决策树C4.5算法,对本校学生成绩中的大量数据进行处理,从中选取决策属性,构造决策树,并提取分类规则,从而获取不同类型的学生与成绩之间的关系.试验结果表明,C4.5算法能够将数据进行准确分类和预测,最终得到有价值的结论,供教师决策分析.  相似文献   

3.
将数据挖掘中的C4.5算法应用于应用型本科院校的就业管理信息系统中,有利于发掘出应用型毕业生就业中隐藏的有用因素和内在联系,对促进学校进行教学改革,指导学生提高自身素质和知识结构,从而最大程度的提高毕业生的就业率。  相似文献   

4.
谢秋华 《三明学院学报》2012,29(4):34-39,100
介绍了一种C4.5算法的改进方法,即在计算属性信息增益率时只用到加减乘除运算,而不是像C4.5那样的大量用到对数运算。实验表明,改进的C4.5算法在不改变模型预测准确率的同时,减少了计算时间,提高了决策树的生成效率,而后将改进的C4.5算法作用于《大学计算机基础》课程的成绩分析,得到的分析结果用于辅助指导教师对《大学计算机基础》课程的教学工作,能够更好地促进教学,提高学生对此门课程的掌握程度和为普及计算机做出帮助。  相似文献   

5.
大数据时代,数据量呈现爆炸式增长,且在内容与形式上日益复杂化,造成数据质量下降、数据丢失等,即产生不完备数据。提出一种改进的C4.5算法,使其能更好地处理不完备数据。每次特征选择前对本次特征选择的数据子集使用子集匹配方法进行处理,通过比较数据清洗方法与子集匹配方法的结果,显示即便是在相同清洗规则下,子集匹配方法在算法分类准确率上也更有优势。实验结果证明,在利用C4.5算法进行特征选择时,在该数据子集上对不完备数据进行处理,可以得到较高的分类准确率,同时得到比数据清洗高的时间复杂度。  相似文献   

6.
决策树是归纳学习和数据挖掘的重要方法,通常用来形成分类器和预测模型。对网络课程知识点个性化设计中的大量数据,运用数据挖掘算法中的决策树C4.5算法对所给数据进行处理,选取决策属性,构造决策树,提取分类规则,获取每一个知识点与不同类型的学生之间的关系。通过实验仿真发现,C4.5决策树算法取得了较为理想的分类预测效果。  相似文献   

7.
本文采用C4.5算法构造决策树的方法,对学生的成绩进行分析并找出影响成绩的主要因素和规则,给教师调整教学环节提供参考,对学生管理工作提出意见,从而指导教育教学工作。  相似文献   

8.
C4.5 算法是数据分类的经典数据挖掘算法。整合并规范了临床确诊病例中的糖尿病并发症数据,同时进行了粗糙集约简,并运用C4.5算法实现了分类。研究表明,该方法能很好地实现决策分类,以辅助临床诊断。  相似文献   

9.
针对国内高职学生首次职业类型选择状况进行了研究,介绍了数据挖掘、决策树、C4.5算法,对高职学生职业类型选择数据进行预处理,应用 C4.5算法构造高职学生首次职业类型选择决策树并使用事后修剪法对其进行了修剪,从中抽取出高职学生首次职业类型选择与大学阶段习得的德、体、智、能和专五个方面能力之间的潜在规则并对其做了验证分析,挖掘出的规则为高职学生首次职业类型选择进行动态预测并对其就业提供指导。  相似文献   

10.
混合生产过程是一类典型的混杂系统,难以用准确的数学解析式来实现生产过程的优化与控制。提出了基于C4.5算法的混合生产过程优化与控制方法。首先利用混合整数线性规划求解混合生产过程最大值的数据集,然后采用C4.5决策树算法挖掘混合生产过程参数与最大生产值之间的关联规则,最后利用关联规则实现混合生产过程的优化与控制。实验结果表明了该方法的有效性。  相似文献   

11.
车辆加速性能是衡量驾驶员对车辆驾驶舒适性的一个标准。传统的车辆加速性能是通过判断加速踏板开度衡量的,加速踏板出厂时设置为不能自动调整。采用改进的C4.5算法对车辆加速性能分类,实现自动调整加速踏板开度。首先通过泰勒中值定理对C4.5算法进行简化,然后对车联网数据进行特征提取,生成判断加速性能的决策树分类规则,测试特征提取的并行化运行效率。通过特征提取后的数据集验证了改进的C4.5算法效率和准确率。测试结果表明,改进算法在不降低分类准确率的前提下,有效提高了分类效率。  相似文献   

12.
13.
分类技术中的决策树算法分析   总被引:6,自引:0,他引:6  
介绍了解决分类问题的常用方法——决策树。并对决策树的原理及Quinlan的ID3、C4.5两种主要的决策树算法进行了分析。通过分析它们的基本原理以及主要特点,提出了对决策树算法改进的展望。  相似文献   

14.
通过C4.5算法分析学生成绩,给出学生成绩数据挖掘的模型,实验结果证明该算法能够正确地给学生成绩分类,并能得到有价值的归纳结论,供教学管理者决策分析.  相似文献   

15.
介绍了数据挖掘技术的概况,对数据挖掘中的核心算法—决策树算法的原理进行了研究,特别说明了决策树属性的选择,给出了一个实例。  相似文献   

16.
针对高校教学评价系统中评教数据信息量大且复杂的问题,提出用决策树方法中的C4.5算法进行数据挖掘.构建教学评价系统。该系统利用决策树挖掘算法挖掘影响教学质量的关键因素,从而提取有用信息,更好地为管理者的决策分析提供科学依据。  相似文献   

17.
对海量数据的处理能力是数据挖掘最关注的问题。决策树作为一种分类器,是数据挖掘中用到的一种基本方法之一。基于C4.5的决策树改进算法,是在一些典型的决策树分类算法的基础上提出的,基本思想是在建树过程中,用属性依赖度替代信息增益率来确定划分条件属性的顺序。该算法借鉴MedGen算法的阈值设定方法,在简化决策树剪枝和优化过程的同时,可优化C4.5算法中使用信息熵率的时间复杂度,避免了使用信息熵带来的不当划分。简述了该改进算法的执行过程,证明了算法的正确性。  相似文献   

18.
介绍了一种一般情况下的C4.5数据挖掘算法的优化方法。原来的C4.5算法在计算属性信息增益率时需要大量用到对数运算,而优化后的C4.5算法计算属性信息增益率时只需用到加减乘除运算,在实现时不用频繁调用对数函数,优化后的算法不会改变属性信息增益率的排序,不改变生成的决策树。改进后的算法能做到在不改变准确率和不增加空间复杂度的情况下,减少时间复杂度,提高了决策树生成效率。  相似文献   

19.
根据淮河某流域连续三年来的水质监测数据,结合用户兴趣度和MID3算法对ID3决策树算法进行改进,并将改进的决策树算法运用于水质评价,建立了淮河某流域水质量评价模型,实现了对水环境质量的评估和决策支持。实验结果表明,改进算法所建立的决策树精确度高、树型结构简单,生成的规则简便、准确,更加符合实际情况,对水环境质量可以作出更为客观、合理的评价,具有一定的实用价值。  相似文献   

20.
随着高校生源质量的下降,提高高校考生的报到率是当务之急.分析影响报到率的条件,预测报到结果,能够为院校招生教学等工作提供有价值的参考依据.结合数据挖掘技术中决策树ID3算法建立决策树模型,并结合BMH模式匹配算法及朴素贝叶斯方法对ID3模型结论进行验证,对提高报到率具有一定的实用价值.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号