排序方式: 共有2条查询结果,搜索用时 15 毫秒
1
1.
从机器学习算法出发,采用十折交叉验证和Grid Search网格搜索方法优化超参数.以Pima印第安人糖尿病数据集为研究对象,运用描述性统计、四分差法、特征重要性分析等方法处理数据集,分别使用逻辑回归、支持向量机(SVM)、Boosting、Bagging、Stacking集成学习方法构建糖尿病风险预测模型,并比较各个集成模型的评估指标.为验证模型在其他数据集上的有效性,运用浙江某医院体检数据集进行验证,从而评价各模型的预测效果.结果发现:Stacking集成模型在Pima印第安人数据集上的预测准确率最高,达83.74%,精确度也最好,达80.0%;Stacking集成模型同样适用于体检数据集,其准确率最高,达93.83%.可见,基于Stacking集成学习方法构建的预测模型的准确度更高、适用性较好. 相似文献
2.
从基础资源、创新能力、产业发展、行业应用、综合保障5个方面构建浙江省大数据发展水平评价指标体系,利用熵权TOPSIS法对2015-2021年浙江省各地市的大数据发展水平进行实证测度,并利用2021年的数据对各市进行聚类分析.结果表明,杭州市大数据发展水平最高,宁波市发展水平较高,金华市、温州市、嘉兴市、绍兴市、湖州市、台州市大数据发展水平中等,舟山市、衢州市、丽水市大数据发展水平欠佳.最后根据实证结果提出相应的对策建议. 相似文献
1