首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 359 毫秒
1.
针对传统基于模型的搜索引擎排序及特征获取慢、非数值特征处理复杂等问题,提出一种基于XGBoost的搜索结果智能排序模型。基于XGBoost算法构建排序模型,使用独热编码和Apriori算法对非数值特征进行处理和筛选,利用Redis对用户和商家特征数据进行缓存,通过并行预测的方式加快模型预测商家得分速度,最后利用XGBoost自带的模型评价函数对最终训练出来的模型进行评估,结果显示模型预测准确率为0.76,说明模型给符合用户偏好的商家打出了较高的分数。其中在训练集上的AUC为0.72,在测试集上的AUC为0.69,两者相差不大,表明模型没有出现明显的过拟合现象,而且准确率较高,可用于构建商家排序模型。  相似文献   

2.
分类问题一直是数据挖掘、模式识别等领域的重要研究内容,应用大数据技术处理与分析海量数据可实现预测分类。数据科学研究一般过于依赖LGBM和XGBoost,但在某些情况下,线性回归的效果比GBM树更好。采用机器学习中的logistics回归算法对足球比赛历史数据进行分析处理,从而挖掘数据之间的关联。通过对训练集的后视检验得到每种结果的概率,对足球比赛结果进行预测。对决策树和集成算法Adaboost建模,提高了预测准确率。该方法对预测世界杯足球比赛结果具有指导作用。  相似文献   

3.
为了提高南京某所某型雷达伺服系统故障诊断准确率,考虑到传统故障诊断算法的局限性,提出一种基于 Stacking 集成算法的雷达伺服系统故障诊断方法。针对某所某型雷达伺服系统的历史监测数据,首先采用孤立森林算法识别异常样本|然后基于原始数据构造出新的特征,使用卡方检验进行特征选择,并使用SMOTE 算法解决样本不平衡问题|最后,通过建立一种新颖、准确的基于 XGBoost、随机森林和 BP 神经网络的Stacking 集成模型进行故障诊断。实验结果表明,该方法在测试集上的诊断准确率达到了 96.2%,比传统方法诊断准确率提高了 1.8%,证明该方法能够很好地完成雷达伺服系统故障诊断任务。  相似文献   

4.
以Spark软件为工具,对电商网站用户行为分析预测系统进行探讨,在此基础上,对一家电商平台进行了一系列的预处理,包括在一定的时间段内,对用户的行为进行处理,提出时间序列规则处理原始数据动态滑动窗口。用户行为分析实验表明,XGBoost的训练模式表现最好,而决策树的学习效果最差。XGBoost模型无需对全部的训练进行集合,是通过XGBoost在每一个滑行窗口内使用XGBoost来输出最后的预测。XGBoost在预测结果正确率、稳定性方面均较好。Spark平台主要由数据读入、RDD的创建、用户行为预测计算三部分构。相比Hadoop平台,基于Spark平台系统效率提高了近8倍,系统运行速度降低幅度较大,减少了电商网站运营成本,Spark平台系统可靠性较高。  相似文献   

5.
作者重名消歧是一个重要又复杂的研究课题,在科技文献检索工作中,作者重名问题势必会降低文献检索的效率和准确性,影响工作进度。提出一种改进粒子群算法优化的BP(Back Propagation)神经网络算法,以解决作者重名消歧问题。首先引入Beta分布的动态惯性权重,提高算法全局搜索能力|其次利用改进粒子群算法优化的权值和阈值,作为BP神经网络的初始权值和阈值进行模型训练,以加快模型训练速度|最后通过特征评价函数过滤式选取排序较优的M维特征子集作为输入层特征向量训练模型,得到最终预测结果,从而精确区分重名的作者。实验研究表明,该模型对重名作者身份的预测准确率可达89.01%,证明了该算法的有效性。  相似文献   

6.
为提高肺癌患者存活性预测的准确率,提出一种基于Stacking集成学习的肺癌患者存活性预测模型.先对数据集进行预处理、特征选择、变量转换等,然后以XGBoost(eXtreme Gradient Boosting)、SVM(Support Vector Machine)和LR(Logistic Regression)3种算法为基学习器,以朴素贝叶斯为元学习器构造模型,再运用Grid Search网格搜索方法优化超参数,并利用交叉验证方法对SEER公开的肺癌数据集进行仿真实验.研究结果表明,该模型的预测准确率达85%,比单一模型高10%.该模型在肺癌患者存活性预测上有着更好的准确性和解释性,可以很好地为肺癌患者预后提供决策支持,以弥补经验的不足.  相似文献   

7.
针对提供的道路交通事故相关影响因子数据,构建了基于关联分析的灰色神经网络组合道路交通事故预测模型。结合实例,用所提出的模型给与了预测。结果表明,基于灰色关联分析神经网络预测模型充分发挥关联选优的优越性,比全输入神经网络预测模型有更好的预测精度,从而说明运用灰色关联分析方法对输入因子选择是有效可行的。基于灰色关联分析的神经网络组合交通事故预测模型充分发挥各单一模型的优点同时弱化了单一模型的缺点,比单一模型的预测结果更理想、精度更高。  相似文献   

8.
为了提升电信行业收入预测问题准确率,建立基于循环神经网络和长短时记忆网络相结合的收入预测模型。首先对数据作预处理,然后建立卷积层进行核心预测算法优化,再通过训练寻找最优参数,并将其应用于电信运营商收入预测。实验结果表明,该模型可以预测出未来一个月或者几个月的收入增减变化趋势,预测准确率比传统方法提高20%,算法收敛性也提高约15%。该模型预测结果对于电信行业制定营销方案具有较好指导作用。  相似文献   

9.
针对银行客户信用评估模型不健全不完善等问题,在对比随机森林(RF)、GBDT和XGBoost三种集成算法基础上,提出基于XGBoost算法的金融客户信用评估模型。从知名的UCI数据库中选取德国某银行客户信用数据集,在对数据进行缺失值、标准化等预处理后,分别对随机森林(RF)、GBDT算法和XGBoost三种集成算法建立个人信用评估模型,然后依据计算得到的相关多元评价指标对个人信用评估进行对比研究。实证结果表明,建立在XGBoost集成算法上的个人信用评估模型性能最优,在准确率指标上比随机森林(RF)高出6%,比GBDT算法高0.8%。  相似文献   

10.
为了提高个人信用评分模型算法预测精准率,受视觉领域数据增广思路启发,提出融合数据增广技术与机器学习算法的个人信用评分模型。该模型首先对原始个人信用数据进行数据增广处理,然后基于机器学习分类算法训练一个二分类个人信用评分模型,最后基于公开个人信用数据集,分别建立未经过数据增广和经过数据增广处理后的个人信用评分模型。对比准确率、精确率、召回率、F1 得分、AUC 值和 ROC 曲线等 6 个性能评价指标,结果显示,相较于仅基于机器学习算法的个人信用评分模型,融合了数据增广技术与机器学习算法的个人信用评分模型使得分类性能得到了一定提升,分类准确率平均高出 5%。  相似文献   

11.
在新能源汽车可缓解未来一系列环境、资源问题的重要背景下,对新能源汽车销售量准确预测有助于加速新能源汽车市场推广,降低相关生产研发企业运营成本。提取8个关键影响因素,应用灰色关联分析(GRA)验证各因素影响能力,然后构建基于果蝇算法优化灰色神经网络(FOA-GNN)预测模型的新能源汽车月度销售量预测模型。通过预测结果对比检验,验证该预测模型在预测新能源汽车销售量上有较高的预测精度。应用该模型对我国新能源汽车2019年月度销售量进行预测,结果表明,我国新能源汽车发展在2019年度依然可保持良好的增长态势。  相似文献   

12.
针对1981~2012年我国税收收入的相关数据,采用回归模型、指数平滑预测和ARIMA模型三种单项预测方法进行建模预测.并结合组合预测理论,采用基于IOWA算子的组合预测模型进行预测.结果表明,基于诱导有序加权算术平均算子的组合预测模型的预测精度明显高于三种单项预测方法,说明了该方法用于税收收入预测的可行性和有效性,并采用5种有效性评价指标,检验了组合预测模型的预测效果.既然该方法可以通过调整组合权重提高预测精度,因此,在此基础上对今后3年的税收收入作出预测,发现今后3年税收仍会分别以15.59%、16.89%和16.77%的增长率增长.  相似文献   

13.
在分析灰色预测模型GM(1,1)以及BP神经网络预测模型2种单一模型在电力消费量预测方面不足的基础上,提出灰色神经网络组合预测模型。以河北省电力消费量为基础,分别用3种模型进行预测,并加以比较分析。结果表明,灰色神经网络组合模型提高了关于河北省中长期电力消费量的预测精度,对河北省未来电力系统及能源需求规划具有一定参考价值。  相似文献   

14.
Effective and exact short-termforecastingof urban wa-ter consumptionis veryimportant to on-line simulation andoptimal schedulingin municipal water supply management .Almost all traditional short-termpredictions use time seriesmethods,such as multi linear …  相似文献   

15.
为提高预测精度,采用Elman神经网络对商品销售额进行预测.在分析样本数据特性基础上,采用Elman神经网络对商品销售额的预测进行建模,通过实例验证模型的有效性并对比分析BP神经网络的预测效果.研究结果表明,基于Elman神经网络的商品销售额预测能够较好地反映商品销售额的变化趋势且提高了预测精度,验证了该方法在商品销售额预测中的可行性.  相似文献   

16.
随着纯电动汽车市场的不断扩大,对销售量的精确预测成为人们当前关注的热点。提取影响销售量的7个关键因素以及2017~2019年9月的纯电动汽车销售量,首先利用BP神经网络模型对33个月的数据进行测试,并用训练好的模型预测2019年1~9月销售量,再利用马尔科夫(Markov)模型将BP神经网络模型预测的相对误差划分为6种状态,对预测结果进行修正。通过对BP神经网络模型与Markov-BP神经网络模型预测结果进行对比检验,发现Markov-BP神经网络的预测准确度更高,表明采用Markov-BP神经网络模型对纯电动汽车月度销售量进行预测具有一定现实意义。  相似文献   

17.
低压配电系统全局选择性保护对短路电流峰值预测提出了实时快速性特殊要求,以灰色预测理论为依据建立适合短路电流数据特征的传统预测模式的灰色预测模型存在理论上的缺陷,影响预测精确度。为此,在对传统灰色预测不足进行分析的基础上,通过调整初始迭代点,引入递推结构,选择合适的修正因子等方法对模型结构进行拓展,以相对误差均值最小为原则的目标函数动态选择参数,进一步优化灰色模型,将优化后的模型应用于低压配电系统,可实现短路电流峰值的快速、高精度预测。  相似文献   

18.
鉴于BP神经网络、RBF神经网络在城市供水量预测精度上的不足,利用粒子群算法优化两者相关参数,实现更高预测精度,并通过建立BP神经网络、RBF神经网络、PSO-BP神经网络、PSO-RBF神经网络分别对城市供水量数据进行仿真预测。最终测试样本统计结果显示:RBF神经网络比BP神经网络平均相对误差(MRE)低约1%,在拟合度(R2)上高约0.014;PSO-BP神经网络比BP神经网络在MRE上降低约1.25%,在R2上提高约0.05;PSO-RBF神经网络比RBF神经网络在MRE上降低约0.3%,在R2上提高约0.072。由此说明RBF神经网络比BP神经网络在城市供水量预测方面更有优势,并且利用粒子群算法优化神经网络模型参数可有效提升神经网络预测精度。  相似文献   

19.
以1992-2012年的安徽省城镇居民人均消费支出的数据,运用多元回归与时间序列结合的模型预测、ARIMA模型预测和灰色预测三种单项预测方法,以预测的误差平方和最小为准则,建立IOWA组合预测模型,并以安徽省城镇人均消费支出为例进行实证分析,发现组合预测模型在整体上都优于每一单项预测方法,对我国居民消费支出预测和研究城镇居民人均消费具有重大意义。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号