大数据下Logistic模型的最优子抽样算法研究 |
| |
引用本文: | 韩坤凌.大数据下Logistic模型的最优子抽样算法研究[J].德州学院学报,2023(4):1-4. |
| |
作者姓名: | 韩坤凌 |
| |
作者单位: | 德州学院数学与大数据学院 |
| |
摘 要: | 抽样方法在大数据研究中发挥着重要作用,子抽样作为其中之一可以非常高效地解决数据量大的问题,无论是线性回归模型还是Logistic回归模型都有相应的子抽样方法。本文使用大数据下基于二元Logistic模型的两种子抽样方法,分别是普通子抽样方法和两阶段最优子抽样方法,并利用实际数据评估了算法的优良性,得出以下结论:基于两阶段子抽样算法建立的Logistic回归模型在估计精度上优于基于普通子抽样建立的模型;基于L最优准则下的子抽样虽然比基于A最优准则下的子抽样估计精度略低,但耗费的运算时间更短。
|
关 键 词: | 最优子抽样 大数据 Logistic模型 |
|
|