改进Boruta算法在特征选择中的应用 |
| |
引用本文: | 陈逸杰,唐加山.改进Boruta算法在特征选择中的应用[J].教育技术导刊,2019,18(4):69-73. |
| |
作者姓名: | 陈逸杰 唐加山 |
| |
作者单位: | 南京邮电大学 理学院,江苏 南京 210023 |
| |
摘 要: | 特征选择在机器学习中运用广泛,Boruta算法是一种常见的特征选择方法,算法思想简单、易于操作,但样本复杂度较高。针对该问题提出改进Boruta算法,在原算法阴影特征样本建造中只对部分样本打乱重排序,降低了阴影特征样本的复杂度。实验结果表明,改进的Boruta算法在混合比例约为0.4~0.6时相比原算法,提取出的特征拟合模型预测性能略有提高。使用平均减少不纯度(mean decrease impurity)和随机Lasso这两种传统方法选择同样数量的特征建立模型进行预测,发现改进的Boruta算法预测性能比上述两种方法更优,改进的Boruta算法在降低样本复杂度的同时提高了预测性能。
|
关 键 词: | 特征选择 Boruta 机器学习 阴影特征 混合比例 |
|
| 点击此处可从《教育技术导刊》浏览原始摘要信息 |
| 点击此处可从《教育技术导刊》下载免费的PDF全文 |
|