首页 | 本学科首页   官方微博 | 高级检索  
     

面向非平衡数据集的随机森林算法对学生学业问题的预测分析
作者单位:;1.中国民航大学空中交通管理学院
摘    要:由于数据集里类别分布不均,传统随机森林(Random Forest)分类器的性能受到一定程度制约,面对学业数据集中成绩较差人数占少数比例的非平衡性问题,为了在一定程度提高模型预测性能,提出SMOTEENN混合采样方式结合随机森林分类器的组合分类预测模型的方法(SER)对学生学业表现进行分类;同时基于10种非平衡性数据集采样方法,对比分析了包括随机森林在内的5种模型的性能.实验结果表明,使用SER方法对学生学业表现情况预测最优,分类器性能指标F1-Score和Recall的值分别为0.98和0.97,达到了预期目的.

关 键 词:学生学业问题  非平衡数据集  混合采样  随机森林  分类

Predictive Analysis and Research of Students Academic Problems Based on Random Forest Algorithm Under Imbalanced Data Sets
Abstract:
Keywords:
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号