首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 437 毫秒
1.
个人信用作为社会信用体系建设的重要部分,将其结合现代计算机理论技术来构建个人信用评分模型一直是研究的热点。本文利用前人遗传算法筛选出来的个人信用相关重要属性,并从这些重要属性的3种分类中依类定性地取出部分属性,结合自适应神经模糊推理系统理论(ANFIS),建立基于遗传算法和AN-FIS的个人信用评分模型。对选取的数据实证分析,并与GA-SVM方法的结果作了比较,试验结果表明该模型只需少量重要属性变量就能够有较好的分类效果。  相似文献   

2.
利用爬虫技术从中国种业大数据平台获取小麦特征信息数据集,采用手工结合计算机程序的方式处理数据.对处理后的数据使用传统机器学习中的支持向量机、朴素贝叶斯和深度学习中的BP神经网络方法,分别构建小麦抗寒性模型.实验结果表明,与传统机器学习的模型相比,BP神经网络在小麦抗寒性分类效果预测上表现的效果优、预测准确率高.  相似文献   

3.
利用计算机视觉技术和机器学习技术对学生课堂行为进行自动识别,是过程性评价的一种新方法,近年来逐渐引起了研究者的关注。文章以监控设备拍摄的实际课堂教学视频为数据源,采集、标注了学生课堂行为数据,提取了学生的人体骨架信息。在此基础上,文章采用Boosting算法和卷积神经网络算法,对基于这两类不同机器学习算法的5种模型进行了学生课堂行为自动识别准确率实验。实验结果表明,在学校教室这种识别比较困难的场景,基于人体骨架信息提取的学生课堂行为自动识别可以达到较高的精度,其中基于Boosting算法的XGBoost模型识别准确率最高。文章的研究推动了计算机视觉技术和机器学习技术的进一步应用,有助于解决学生课堂行为自动识别难题,并助力教师优化教学策略、提高教学效率。  相似文献   

4.
针对传统无人机遥感图像信息提取与分类算法准确率低、稳定性差、无法有效应对大规模复杂遥感图像数据集等问题,提出一种基于RF-SVM的遥感图像处理算法。RF-SVM算法将RF数据集分类性能较强的优势与经典SVM算法数据降维能力相融合,引入随机变量和示性函数扩大样本集的边界,提升对复杂大规模数据集的处理能力,有效控制泛化误差。在对无人机遥感图像的预处理过程中,借助Brovey变换完成对光谱和高分辨率遥感图像的像素级融合,引入核函数并根据获取到的遥感图像特征和后验概率值,实现对遥感图像内部标的物的准确分类。实验结果显示,在RF-SVM算法下,无人机遥感图像信息提取准确率分类平均准确率达到99.81%,且在RF-SVM算法下的样本点感受性曲线稳定性更好。  相似文献   

5.
分类问题一直是数据挖掘、模式识别等领域的重要研究内容,应用大数据技术处理与分析海量数据可实现预测分类。数据科学研究一般过于依赖LGBM和XGBoost,但在某些情况下,线性回归的效果比GBM树更好。采用机器学习中的logistics回归算法对足球比赛历史数据进行分析处理,从而挖掘数据之间的关联。通过对训练集的后视检验得到每种结果的概率,对足球比赛结果进行预测。对决策树和集成算法Adaboost建模,提高了预测准确率。该方法对预测世界杯足球比赛结果具有指导作用。  相似文献   

6.
情感分析在业界被广泛应用于产品分析、商品推荐等方面,具有很高的商业价值。目前常用的研究方法主要基于机器学习算法和基于词典的方法,该类方法通常需依赖复杂的人工规则和特征工程。针对传统情感分类方法需要人工干预的问题,总结目前已有可用于情感分析的深度学习方法,提出将卷积神经网络(CNN)和双向长短时记忆网络(BLSTM)进行组合,并将融合后的特征添加至注意力机制,设计出CBLSTM-Attention模型。实验表明,该模型在中文数据集上准确率达0.965 0,在NLPCC英文数据集上准确率达0.942 2,证明该方法不仅可提高文本情感倾向性分析的准确率,而且可有效解决人工干预问题。  相似文献   

7.
针对银行客户信用评估模型不健全不完善等问题,在对比随机森林(RF)、GBDT和XGBoost三种集成算法基础上,提出基于XGBoost算法的金融客户信用评估模型。从知名的UCI数据库中选取德国某银行客户信用数据集,在对数据进行缺失值、标准化等预处理后,分别对随机森林(RF)、GBDT算法和XGBoost三种集成算法建立个人信用评估模型,然后依据计算得到的相关多元评价指标对个人信用评估进行对比研究。实证结果表明,建立在XGBoost集成算法上的个人信用评估模型性能最优,在准确率指标上比随机森林(RF)高出6%,比GBDT算法高0.8%。  相似文献   

8.
针对个人信用数据存在连续型和离散型交织并存以及类不平衡问题,为提高信用评估分类效果,提出一种结合代价敏感和集成算法的个人信用评估分类模型.通过集成信息价值、互信息、信息增益率和基尼指数特征,选择算法生成最优特征子集.结合代价敏感构建以L1-逻辑回归、弹性网-逻辑回归、贝叶斯、决策树和神经网络为基模型的集成模型,并辅之动...  相似文献   

9.
葡萄酒的化学成分是辨别葡萄酒品种的主要依据。考虑到常规检测方法复杂、繁琐,准确率低,选择机器学习方法识别葡萄酒种类。针对目前常用的K均值算法在葡萄酒识别中存在的问题,尝试使用支持向量机进行分类,并与K均值算法进行对比分析。结果表明,基于支持向量机的模型分类性能更好,准确率达到98.15%。  相似文献   

10.
为了改善传统ID3算法在分类属性选择上存在多值偏向性的不足,提出基于PCA的决策树优化算法。在普通基于PCA 的决策树改进算法中,存在数据经降维处理后代表性不强的问题,导致算法需经过多次数据运行后,准确率才能小幅提升。在ID3算法基础上,在分类前两次提取属性特征值,并计算了需要分类的数据量,也即对原始数据进行最重要的属性选择。在子树建立之后,再进行数据的降维合并选择。采用UCI数据库中的3个数据集对改进算法进行验证,结果表明改进算法的平均准确率达到94.6%,相比传统ID3算法与普通PCA决策树优化算法分别提升了1.6%和0.6%。因此,基于PCA的决策树算法能在一定程度上提升结果准确率,具备一定的应用价值。  相似文献   

11.
通过对分类树和支持向量机这两种方法在个人信用评估领域的适用性分析,提出了一种将分类树和支持向量机结合起来处理个人信用评估的新方法.用该方法处理含有混合数据的个人信用评估实例,结果表明,该方法有效地提高了整个模型的训练精度和测试精度.  相似文献   

12.
针对传统信用评价方法分类精度较低、数据集属性变量间存在相关性等问题,提出基于主成分分析的稀疏贝叶斯学习(PCA-SBL)算法。首先对数据集特征变量进行主成分分析,使降维后的变量无相关性|其次,对主成分分析后的数据进行稀疏贝叶斯分类|最后将 PCA-SBL 分类方法分类精度与传统分类方法精度进行比较。分析发现,在 German Credit Data 和 Australian Credit Data 上,与传统 KNN、朴素贝叶斯、SVM、随机森林、决策树相比,改进的 SBL 算法分类精度平均提高了 5.26%、4.65%、2.11%、2.125%、4.66%,与稀疏贝叶斯学习算法(SBL)相比,平均提高 0.965%,从而证明 PCA-SBL 算法具有更高的分类效果。  相似文献   

13.
对于银行、P2P等金融机构而言,如何在扩大业务规模的同时,有效控制并合理防范信用风险尤为重要。基于LightGBM算法,根据借款申请人提供的相关个人信息,建立分类预测模型,对借款人是否会逾期、是否该发放贷款进行预测研究。实验结果表明,相较于普通决策树算法,LightGBM预测精度提升了40.8%,且具有较好的鲁棒性,可满足信用评估要求。基于LightGBM的信用评估模型不仅拥有更快的训练速度和更高的训练效率,同时还占用更少的内存,具有支持数据并行处理能力。利用该模型可对用户信用风险进行较为准确的预测,对贷款机构风险管理有重要参考价值。  相似文献   

14.
为解决传统协同过滤推荐算法数据稀疏、可扩展性差等问题,采用改进预测评分矩阵的协同过滤算法。首先使用基于线性回归分析的加权Slope One算法,在传统Slope One算法中加入可信度,提高共同评分基数;然后采用网上标准数据集movielens作为测试数据,结合协同过滤算法进行top-N推荐。实验结果表明,使用改进预测评分矩阵的协同过滤算法的MEA较小,在近邻数大于25时达到0.74,表明该算法改善了传统协同过滤算法数据稀疏、扩展性差问题,降低了推荐误差,提高了推荐系统准确度。  相似文献   

15.
基于计算机视觉技术对道路交通视频中的运动目标进行分类。针对目标分割过程中的光线变换及分类效率问题,主要采用贝叶斯网络模型以及合适的前景提取模型以提高精度。提出一种改进的Vibe算法对运动目标进行检测,通过提取目标长宽比、Hu不变矩以及离散度特征等对目标进行分类。最终实验结果正确率在80%以上,说明该智能交通系统可以有效识别出运动目标,且具有较强的鲁棒性与适应性。  相似文献   

16.
为了实现教育领域的“个性化”,无论是自由组卷的个性化,还是试题推荐的个性化,都首先需要确定试题难易度。研究目标为寻找新的方法解决基于试题难易度的分类问题,提高分类准确率。以高中数学为例,采用2018年多套高考数学试题作为实验数据,对原始数据各个特征进行相关性分析,剔除影响较小的特征,再采用随机森林算法探索试题难易度分类问题,对参数进行改进优化,并与其它分类方法进行对比。实验结果证明,采用随机森林的高中数学试题分类准确率高达90%,而其它3种分类算法准确率分别为72%、74%、74%。因此得出结论,随机森林算法在高中数学试题难易度分类上有较好表现,能够大幅提高分类准确率。  相似文献   

17.
随着信用卡业务的蓬勃发展,信用风险成为金融风险的一项重要内容。在加强事后监控进行风险监控的理念下,基于个人信用卡消费分析建立了若干指标,可用于对持卡人的信用进行分类和授信控制。  相似文献   

18.
朴素贝叶斯文本分类模型是一种简单而高效的文本分类模型,但是它的独立性假设属性使其无法表示现实世界属性之间的依赖关系,从而影响它的分类性能。这里提出一种改进的基于贝叶斯定理的文本分类模型——“树桩网络(Stump Network)”,并将该方法与朴素贝叶斯文本分类器和TAN(Tree Augmented Naive Bayes)文本分类器进行实验比较,结果表明,在大多数数据集上该文本分类方法具有较高的分类正确率。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号