首页 | 本学科首页   官方微博 | 高级检索  
     

基于特征非规则离散化在线性回归中应用研究
作者姓名:梁律
作者单位:宁波职业技术学院
摘    要:特征离散化是线性回归算法在模型训练时必要步骤。特征的离散化通常包括两种方式即0-1归一化和均等区间归一化,这两种离散化方式是假设数据分布均匀的情况,在实际业务场景中数据分布具有很大的不确定性,以数据的分布趋势为区间划分标准进行特征离散化,将离散化后的特征数据应用于线性回归中,以今日头条新闻数据作为测试数据集,实验结果表明,新的特征离散化方法能够较为显著地提高模型预测AUC。

本文献已被 CNKI 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号