首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
从机器学习算法出发,采用十折交叉验证和Grid Search网格搜索方法优化超参数.以Pima印第安人糖尿病数据集为研究对象,运用描述性统计、四分差法、特征重要性分析等方法处理数据集,分别使用逻辑回归、支持向量机(SVM)、Boosting、Bagging、Stacking集成学习方法构建糖尿病风险预测模型,并比较各个集成模型的评估指标.为验证模型在其他数据集上的有效性,运用浙江某医院体检数据集进行验证,从而评价各模型的预测效果.结果发现:Stacking集成模型在Pima印第安人数据集上的预测准确率最高,达83.74%,精确度也最好,达80.0%;Stacking集成模型同样适用于体检数据集,其准确率最高,达93.83%.可见,基于Stacking集成学习方法构建的预测模型的准确度更高、适用性较好.  相似文献   

2.
对于癌症、心血管疾病等复杂疾病,采取组合用药克服耐药性和改善功效已成为标准治疗方案。鉴定药物组合标准的方法是进行体内或体外药物筛选实验,但这一过程很缓慢,代价高昂。各种高通量组学技术产生度量药物效应的各层次数据,使得从计算角度挖掘数据进而预测有效药物组合成为主流手段。针对有效药物组合的预测模型大多是利用单一机器学习模型建模。为获得更高的精度,提出一种新的有效药物组合预测方法。该方法充分利用5种不同层次的药物信息构建相似性特征,特别引入药物靶标的序列信息和功能信息,基于Stacking算法融合多个传统机器学习模型和最新的集成学习模型LightGBM。实验表明,该方法预测的AUC值为0.953,精度比单一机器学习模型有显著提升。  相似文献   

3.
为了提高个人信用评分模型算法预测精准率,受视觉领域数据增广思路启发,提出融合数据增广技术与机器学习算法的个人信用评分模型。该模型首先对原始个人信用数据进行数据增广处理,然后基于机器学习分类算法训练一个二分类个人信用评分模型,最后基于公开个人信用数据集,分别建立未经过数据增广和经过数据增广处理后的个人信用评分模型。对比准确率、精确率、召回率、F1 得分、AUC 值和 ROC 曲线等 6 个性能评价指标,结果显示,相较于仅基于机器学习算法的个人信用评分模型,融合了数据增广技术与机器学习算法的个人信用评分模型使得分类性能得到了一定提升,分类准确率平均高出 5%。  相似文献   

4.
为了提高南京某所某型雷达伺服系统故障诊断准确率,考虑到传统故障诊断算法的局限性,提出一种基于 Stacking 集成算法的雷达伺服系统故障诊断方法。针对某所某型雷达伺服系统的历史监测数据,首先采用孤立森林算法识别异常样本|然后基于原始数据构造出新的特征,使用卡方检验进行特征选择,并使用SMOTE 算法解决样本不平衡问题|最后,通过建立一种新颖、准确的基于 XGBoost、随机森林和 BP 神经网络的Stacking 集成模型进行故障诊断。实验结果表明,该方法在测试集上的诊断准确率达到了 96.2%,比传统方法诊断准确率提高了 1.8%,证明该方法能够很好地完成雷达伺服系统故障诊断任务。  相似文献   

5.
利用计算机视觉技术和机器学习技术对学生课堂行为进行自动识别,是过程性评价的一种新方法,近年来逐渐引起了研究者的关注。文章以监控设备拍摄的实际课堂教学视频为数据源,采集、标注了学生课堂行为数据,提取了学生的人体骨架信息。在此基础上,文章采用Boosting算法和卷积神经网络算法,对基于这两类不同机器学习算法的5种模型进行了学生课堂行为自动识别准确率实验。实验结果表明,在学校教室这种识别比较困难的场景,基于人体骨架信息提取的学生课堂行为自动识别可以达到较高的精度,其中基于Boosting算法的XGBoost模型识别准确率最高。文章的研究推动了计算机视觉技术和机器学习技术的进一步应用,有助于解决学生课堂行为自动识别难题,并助力教师优化教学策略、提高教学效率。  相似文献   

6.
设计了一个自追踪摄像头云台控制机器人实验。文章从人体的检测定位及云台控制方面阐述了系统的设计思路,利用机器视觉技术得到了人体目标在视角中的坐标,又对舵机进行了目标控制。追踪目标的过程最终以Mobile Net-SSD网络模型为基础,通过深度可分离的整合设计,改善了现有整合网络的复杂参数问题,从而优化了网络结构。后期将引导学生从改进本实验模型结构和图像预处理等方面提高最终算法的检测速度、检测准确率、识别准确率等。该实验设计涉及学科较为综合,功能扩展性好,实用性强,是机器人教学、机器学习实践与嵌入式系统相融合的创新实验项目。  相似文献   

7.
针对目前利用时空图卷积网络ST-GCN行为识别模型进行人体行为识别准确性有待提高和如何更好地学习骨骼数据中关节点和骨架边所表达的动作特征等问题,改进现有的时空图卷积网络(ST-GCN)行为识别模型。首先,使用有向图来表示关节点和骨骼边的信息以及它们之间的依赖关系,提取相邻帧的关节位置差异作为运动信息;其次,使用双流框架分别学习运动信息和空间信息,进行融合提高识别性能;最后,使用注意力权重矩阵让图的拓扑结构具有自适应性,增大节点的感受野,使网络能够学习到远端关节之间的语义信息,更好的捕捉动作特征。将所提出的方法在NTURGB+D数据集上进行实验。研究结果表明,采用基于时空图卷积网络改进的人体行为识别方法在数据集上达到了96%的准确率,与现有ST-GCN模型相比,准确率提高了。此方法可进一步促进人体行为识别技术在智能家居、智能监控安防、人机交互、基于内容的视频检索、智慧城市发展等领域的广泛应用。  相似文献   

8.
针对传统机器学习算法特征提取烦琐且普遍存在特征单一、识别准确率低的问题,采用能够自行提取图像特征的卷积神经网络模型,对指关节纹识别分类的任务进行实验研究.首先对指关节纹图像进行预处理;其次,设计并搭建了一个9层卷积神经网络模型,对网络模型进行编译、训练后,发现网络的过拟合现象严重,并针对过拟合,提出了优化网络结构方案,...  相似文献   

9.
随着互联网的迅猛发展,网上健康信息以几何速度增长,其中大量虚假健康信息给人们的生活带来了很大影响,但目前对虚假健康信息文本识别的研究非常缺乏,以往研究主要集中在识别微博上的谣言、伪造商品评论、垃圾邮件及虚假新闻等方面。鉴于此,采用基于词向量的深度神经网络模型和基于双向编码的语言表征模型,对互联网上流传广泛的健康信息文本进行自动分类,识别其中的虚假健康信息。实验中,深度网络模型比传统机器学习模型性能提高10%,融合Word2vec的深度神经网络模型比单独的CNN或Att-BiLSTM模型在分类性能上提高近7%。BERT模型表现最好,准确率高达88.1%。实验结果表明,深度学习可以有效识别虚假健康信息,并且通过大规模语料预训练获得的语言表征模型比基于词向量的深度神经网络模型性能更好。  相似文献   

10.
为提高肺癌患者存活性预测的准确率,提出一种基于Stacking集成学习的肺癌患者存活性预测模型.先对数据集进行预处理、特征选择、变量转换等,然后以XGBoost(eXtreme Gradient Boosting)、SVM(Support Vector Machine)和LR(Logistic Regression)3种算法为基学习器,以朴素贝叶斯为元学习器构造模型,再运用Grid Search网格搜索方法优化超参数,并利用交叉验证方法对SEER公开的肺癌数据集进行仿真实验.研究结果表明,该模型的预测准确率达85%,比单一模型高10%.该模型在肺癌患者存活性预测上有着更好的准确性和解释性,可以很好地为肺癌患者预后提供决策支持,以弥补经验的不足.  相似文献   

11.
网络课程学习过程评价形式单一的问题亟待解决。因此提出一种基于隐马尔可夫模型的多维评价方法,对学生学习事件进行持续跟踪和统计,运用隐马尔可夫模型识别隐含在学习事件序列中不同维度学习状态序列,将其作为网络课程学习过程多维度评价结果。实验表明,该评价方法准确率、精度和召回率分别平均达到 0.64、0.75 和 0.80。基于 HMM 模型的网络课程学习过程多维评价结果可有效反映学生学习状态过程性变化。  相似文献   

12.
为了提高数字媒体物联网(DMIoT)的数据库资源调度效率,提出一种基于机器学习的快速调度(MLS)方法.该方法利用数据融合技术,以实现用户体验质量的优化.MLS采用一种多模式数据融合方法,以建立不可控用户数据与可控网络相关因素之间的体验质量映射.MLS建立了融合结果的自动体验质量优化模型,能够自动调整与网络相关的系统数据,以实现最佳的用户满意度.仿真结果表明,MLS将大大提高体验质量水平,并适应动态网络变化.  相似文献   

13.
情感分析在业界被广泛应用于产品分析、商品推荐等方面,具有很高的商业价值。目前常用的研究方法主要基于机器学习算法和基于词典的方法,该类方法通常需依赖复杂的人工规则和特征工程。针对传统情感分类方法需要人工干预的问题,总结目前已有可用于情感分析的深度学习方法,提出将卷积神经网络(CNN)和双向长短时记忆网络(BLSTM)进行组合,并将融合后的特征添加至注意力机制,设计出CBLSTM-Attention模型。实验表明,该模型在中文数据集上准确率达0.965 0,在NLPCC英文数据集上准确率达0.942 2,证明该方法不仅可提高文本情感倾向性分析的准确率,而且可有效解决人工干预问题。  相似文献   

14.
在大数据环境下对网络上的不良内容进行识别是实现网络侦查和信息监管的重要手段。当前主要采用人工识别方法,效率低下,可靠性差。提出一种基于奇异特征提取和聚类的大数据环境下不良网络内容识别技术,构建大数据环境下网络不良内容的存储和数据传输模型,对不良内容进行信号模型构建,采用奇异特征提取方法对内容进行特征提取,以此为数据基础进行数据聚类分析,以实现对不良内容的准确识别。仿真实验表明,采用该算法对不良网络内容进行识别准确率较高,可有效实现网络信息的监管和跟踪。  相似文献   

15.
针对唇语识别过程中唇部特征提取和时序关系存在的问题,提出一种卷积神经网络(CNN)和双向长短时记忆网络(Bi-LSTM)相结合的深度学习模型。利用CNN学习唇部特征,并将学习到的唇部特征送入Bi-LSTM进行时序编码,通过Softmax进行分类。建立NUMBER DATASET和PHRACE DATASET两个大型汉语数据集以解决汉语唇语数据缺失问题。将该模型与传统的唇语识别方法在两个数据集上进行实验对比,发现在NUMBER DATASET上识别准确率为81.3%,比传统方法提高了8.1%,在PHRACE DATASET上识别准确率为83.5%,比传统方法提高了9%。实验结果表明该模型能有效提高唇语识别的准确率。  相似文献   

16.
卷积神经网络(CNN)在脱机手写汉字识别领域取得了杰出的研究成果。采用更深层卷积神经网络可取得更高识别准确率,但是模型容量和计算复杂度也会增加,将模型部署到存储资源和计算力有限的移动设备上变得更加困难。为解决上述问题,提出一种基于深度可分离卷积的残差卷积神经网络。深度可分离卷积将标准卷积操作分离成特征提取和特征融合,逐深度卷积被用于特征提取,特征融合采用逐点卷积实现。使用深度可分离卷积改进残差网络,实现较深层的残差网络。模型使用联合的中心损失函数和softmax损失函数进行监督训练,可使模型学习具有判别性特征,提高了模型识别准确率。采用CASIA-HWDB数据集进行实验,结果表明该方法具有较低的模型容量和计算复杂度,能够达到96.50%的主流识别率。  相似文献   

17.
睡眠呼吸暂停、低通气等异常生理事件严重影响着人们的睡眠质量与生命健康,准确高效地检测此类事件是预防及诊断睡眠相关疾病的基础。本文基于双向长短时记忆网络,组合使用口鼻气流、胸部活动和腹部活动三种生理信号,构建多输入睡眠呼吸事件检测模型。模型的训练和测试在都柏林大学学院睡眠呼吸暂停数据集(UCD)和美国国家睡眠研究资源数据集(HeartBEAT)上进行。实验结果显示,本文构建的多输入模型可有效识别睡眠呼吸事件,在UCD数据集上的准确率达87.98%,ROC曲线下面积达0.964;在HeartBEAT上的准确率达88.49%,ROC曲线下面积达0.963。此外,本文发现腹部活动信号在模型构建中具有较高的贡献度,表明了将腹部活动信号用于睡眠呼吸事件检测的必要性,为进一步开发睡眠呼吸疾病的自动筛查工具提供了参考。  相似文献   

18.
针对传统图像文字识别技术采用模板匹配法和几何特征抽取法存在识别速度慢、准确率低的缺点,提出一种基于深度学习的图像文字识别技术,使用开源、灵活的Tensor Flow框架以及LeNet-5网络训练数据模型,并将训练好的模型应用于特定场景印刷体文字识别。实验结果表明,识别模型的top 1与top 5准确率分别达到了99.8%和99.9%。该技术不仅可快速有效地处理大量图片文件,而且能综合提高图像文字识别性能,节省大量时间。  相似文献   

19.
基于统计的传统无监督机器学习识别分类技术虽经持续改进对于高分遥感图像效果仍不佳,深度学习具备仿人类神经网络多层抽象能力和无监督自学习特点,具有从大量无标签高光谱遥感数据中自主学习和构建其特征的能力,再结合常用分类算法进行识别分类,比传统方法具有相对更高的准确率.  相似文献   

20.
基于信息融合技术的结构损伤诊断方法   总被引:1,自引:0,他引:1  
为提高结构损伤识别的准确率,将多源信息融合技术引入到结构损伤诊断中.在介绍多源信息融合技术的基本理论、功能模型、级别分类和数学方法的基础上,将2种或多种结构损伤识别方法提取的损伤特征向量进行特征级融合,建立了基于信息融合的结构损伤诊断方法.在钢筋混凝土板损伤试验中测试其模态信息,利用基于信息融合的结构损伤诊断方法进行裂缝位置识别,并与单独使用模态应变能法和柔度法进行损伤识别的结果进行对比.结果显示基于特征级信息融合的结构损伤诊断方法能够准确识别单一损伤识别方法无法识别的结构损伤,对于多位置损伤识别亦有效果.基于信息融合的结构损伤诊断方法具有良好的损伤敏感性.不同的信息融合算法有不同的适用范围,在实际结构健康监测中,要通过详细分析选择合适的多源信息融合算法.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号