首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
针对复杂非线性多通道时变信号模式分类问题,提出了一种集成卷积神经网络(CNN)与随机森林(RF)相融合的方法。该方法以CNN为基学习器,自动提取信号样本的抽样特征,同时省去降维与人工选择特征的过程,以RF为次级学习器,增加样本扰动,同时增加属性扰动。为增强样本多样性,使得该模型尽可能充分利用信息,在训练集中随机抽取7份子训练集,再利用7份子训练集训练出7个不同的学习器;最后通过投票法和学习法建立集成模型,提高了识别精度。实验结果表明,在测量区间上,该方法对3种ECG信号类别的平均分类精度达94.60%,提高了1.1%,取得了良好结果,验证了模型和算法的有效性。  相似文献   

2.
王鹏  葛红 《教育技术导刊》2013,12(5):139-141
提出了一种人脸关键点检测方法,该方法用了少量的正面图像,不用归一化人脸图像,而传统的人脸关键点检测方法需要对图像进行严格预处理。随机森林是一种分类器融合算法,可以很好地解决多类分类问题,虽然LBP特征简单,但其可以包含大量的纹理信息。利用改进的LBP特征与随机森林相结合,构成一种对人脸关键点检测的方法。通过高斯平滑图像的LBP特征的提取,对每个点生成特征,计算出有用的特征作为正例,并且与反例集合变为训练集。通过随机森林分类器进行分类,误差率较低,仅在10%左右。  相似文献   

3.
针对银行客户信用评估模型不健全不完善等问题,在对比随机森林(RF)、GBDT和XGBoost三种集成算法基础上,提出基于XGBoost算法的金融客户信用评估模型。从知名的UCI数据库中选取德国某银行客户信用数据集,在对数据进行缺失值、标准化等预处理后,分别对随机森林(RF)、GBDT算法和XGBoost三种集成算法建立个人信用评估模型,然后依据计算得到的相关多元评价指标对个人信用评估进行对比研究。实证结果表明,建立在XGBoost集成算法上的个人信用评估模型性能最优,在准确率指标上比随机森林(RF)高出6%,比GBDT算法高0.8%。  相似文献   

4.
为实现文本的自动化分级,引入当前自然语言处理领域中流行的神经网络语言模型进行文本难易度指标研究。通过采用长短期记忆单元所组成的循环神经网络和语文教材文本训练集构建语言模型,得到测试集的平均语句复杂度指标。最终对所得到的指标与文本难度等级进行相关性分析,以研究其对文本难易度的描述能力。实验结果表明:该指标与文本难度等级存在着很强的相关性,语句复杂度对于文本难度等级有着很强的指导性价值,同时语句复杂度对于文本可读性评估任务来说是一个拥有良好指向性的指标。  相似文献   

5.
传统的文本分类算法存在:忽视训练集的相对固定特征与新文献主题不断交化之间的矛盾,类间没有层次关系从而导致分类不太准确、效率低等问题,对此设计并实现了一种增量式的半监督文本分类算法-IC-Rocchio算法,实验结果表明,该算法能有效地改进这两方面的问题.  相似文献   

6.
为了提高南京某所某型雷达伺服系统故障诊断准确率,考虑到传统故障诊断算法的局限性,提出一种基于 Stacking 集成算法的雷达伺服系统故障诊断方法。针对某所某型雷达伺服系统的历史监测数据,首先采用孤立森林算法识别异常样本|然后基于原始数据构造出新的特征,使用卡方检验进行特征选择,并使用SMOTE 算法解决样本不平衡问题|最后,通过建立一种新颖、准确的基于 XGBoost、随机森林和 BP 神经网络的Stacking 集成模型进行故障诊断。实验结果表明,该方法在测试集上的诊断准确率达到了 96.2%,比传统方法诊断准确率提高了 1.8%,证明该方法能够很好地完成雷达伺服系统故障诊断任务。  相似文献   

7.
目的:针对现有信息安全评估算法的准确性和鲁棒性不足,以及评估效率的低下,本文提出一种新型带门限回归单元的循环神经网络(GRU-RNN)信息安全评估算法.方法:该算法首先提取信息安全评估中的内外安全态势特征,然后将特征应用至GRU-RNN时间序列分析网络中,通过对该时间序列分析网络模型的训练和交叉验证,完成对网络信息安全的评估.结果:在林肯实验室的DARPA数据集上进行仿真实验,相比于传统网络安全评估算法,本文提出算法获得了更高的评估准确率和鲁棒性.尽管GRU-RNN模型需要更多的训练时间,但是能够保证更好的评估结果,并且适合不稳定的信息安全数据评估.结论:本文提出的内外安全态势特征能够很好的描述时间序列数据中的信息安全特性,并且应用GRU-RNN模型能够应对非平稳数据,同时提升了信息安全评估的准确率与鲁棒性.  相似文献   

8.
《嘉应学院学报》2016,(5):16-20
针对传统Android恶意应用检测方法在处理大规模样本时存在的训练时间长、存储空间消耗大的问题,提出一种基于增量学习SVM的Android恶意应用检测方法.该方法提取Android应用的权限申请和API函数调用特征,利用增量学习SVM理论将训练样本集随机划分为初始样本集和若干个增量样本集,利用循环迭代方法训练SVM分类器,每次新的训练仅保留上一轮训练得到的支持向量集并合并到新增样本集中,舍弃大量对分类结果不产生影响的样本以提高分类器学习效率,同时产生新的支持向量集,并最终得到一个高精度的SVM分类器.通过将增量学习SVM算法与基本SVM算法进行对比实验,结果表明,该算法可以有效降低分类器学习时间,减少样本存储的空间占用,同时随着样本规模的积累逐步提高分类精度.  相似文献   

9.
KNN算法是文本分类技术中比较常用的算法。但是,当训练集容量较大时,KNN算法分类的效率大大降低。在对中文短信文本的分类时,结合中文短信文本的特点,给出了先由LAS算法进行降维,然后利用KNN算法进行分类的算法。实验结果表明,该算法提高了中文短信文本的分类质量和分类速度。  相似文献   

10.
随机森林算法随机选择多个决策树构成森林,算法分类结果由这些决策树投票得到,在运算量没有显著增加的前提下提高了预测精度,是一种目前比较流行的组合分类器算法。随机森林算法不仅可以用来做分类,也可用来做回归预测,是机器学习、计算机视觉等领域内应用极为广泛的一个算法。该文将随机森林分类算法用于交通状态判别,利用实测数据进行模型训练和验证,并用袋外数据计算判别正确率,实验结果表明该方法具有可行性,为交通状态判别提供了一种新思路。  相似文献   

11.
周靖 《茂名学院学报》2011,21(4):56-58,66
在文本分类过程中,为解决传统支持向量机(SVM)多类分类的不可分区域问题及提高分类性能,提出了一种改进的偏二叉树多类SVM算法。算法依据根据样本的分布情况计算训练集文本特征参数的信息熵,并将熵值结合欧式距离公式以确定各类文本间的相似性测度;以相似性测度作为偏二叉树结构的分类走向,对训练集进行学习,构建各个二类子SVM分类器。实验结果表明,该算法具有较高的分类性能,能更好地解决实际文本分类过程中的问题。  相似文献   

12.
CT 图像中肺结节良恶性鉴别是肺癌计算机辅助诊断研究中的关键。为了提高计算机辅助诊断系统中肺结节良恶性诊断准确性,提出一种基于密度分布特征的肺结节良/恶性判断方法。首先,从肺部肿瘤图像中随机提取图像小单元集并计算其自相关矩阵,然后通过K-means算法对该矩阵实现无监督聚类。特征提取时遍历计算肺结节图像每一像素的灰度密度分布等级,并统计、归一化得到10维特征向量,最后通过卷积方法对特征进行优化。同时,利用随机森林分类器进行模型训练,进而判断肺结节良/恶性水平,提出算法的验证数据为LIDC-IDRI。实验结果表明,最大AUC可达0.955 8。对比分析,该特征表达方法具有更优分类效果和更高鲁棒性。  相似文献   

13.
针对传统的特征选择方法在非平衡数据集中分类效果不理想的问题,提出了一种适合非平衡数据分类的改进特征选择方法.该方法将集中度和分散度相结合,同时考虑到在文本长短不一时词频对文本分类的作用,得到一种新的词频归一化方法,实现了对传统特征提取方法的改进.另一方面,将三支决策思想引入到朴素贝叶斯算法,得到了NB-三支决策分类算法,并将该算法应用到非平衡数据集的分类.通过两组实验对比结果表明:改进特征选择方法较CHI和IG方法,处理非平衡度高的数据集分类效果较好;选取相同的特征选择方法和数据集,NB-三支分类器比NB-分类器的分类效果好.选用本文提出的改进特征选择方法和NB-三支分类器,在处理非平衡度高且文本长短不一的数据集时,分类效果有一定提升.  相似文献   

14.
将随机森林引入图像分类研究.首先利用MR8滤波器组进行纹理过滤,然后用随机子窗口对这些响应提取纹理特征,用随机森林进行训练.对待测图像采样后导入已训练完成的随机森林,用投票的方式为其预测类别.引入MR8滤波器组,将随机森林扩展为能处理滤波图像块,用于纹理图像的分类.在CURe T图像库上的实验表明,该方法能够取得优良的分类精度,并具有较高的分类效率.  相似文献   

15.
在网络环境中文本挖掘的过程主要包括特征提取、特征选择、挖掘方法选择、结果评价和知识模块等几个部分;最新的发展方向是基于EM算法对文本进行挖掘,基于该算法的的比较挖掘模型为:首先对已知数据集任意分为几个类,然后根据各个类集和背景集对文档集的各个词进行似然,再通过求和可以得到整个数据集的似然,该过程反复进行,直到收敛,从而可以根据各类和背景集结果中的较大的概率值得出文本的共同主题和各个类的主题。  相似文献   

16.
为了有效地检测网络攻击行为,提高网络安全水平,提出一种基于随机森林的网络异常流量检测方法。该方法能够从海量的数据流量中高效、准确地检测出异常流量,及时发现并阻断网络攻击行为。将随机森林算法与决策树、支持向量机等经典分类器从正确率、精确率、召回率、F1度量以及训练预测耗时等指标进行对比,随机森林算法都优于其他分类器,具有出极好的检测效果。  相似文献   

17.
基于人体关键点检测的方法需要融合由高分辨率到低分辨率子网络生成的表示,以提高关键点检测的准确性。设计了一种基于沙漏注意力高分辨率网络的人体姿态评估方法实验,在深度高分辨率表示学习的基础上构建沙漏注意力特征模块,并设计特征回传模块和多阶段监督算法,用融合中继监督和自蒸馏的方式实现高分辨率网络的监督训练。与经典方法在标准数据集上完成人体姿态评估实验对比,并在硬件设备上进行了真实场景实验,实现了行人姿态评估和危险行为报警。  相似文献   

18.
传统协同过滤算法仅利用评分信息进行推荐,而没有利用到更多用户特征与电影特征,推荐效果不佳。深度学习的普通应用,为特征提取打下了良好基础。通过爬取网站上的电影演员信息表,使用卷积神经网络对文本信息进行特征提取,采用结合注意力机制与场感知因子分解机的混合推荐方法,并使用用户—电影特征矩阵进行训练。在公开数据集 MovieLens 上进行实验测试,RMSE 达到 0.850,与 5 组推荐模型进行对比,RMSE 分别提18.0%、11.3%、7.60%、25.7%、6.80%。实验结果表明,该模型可以提高推荐效率。  相似文献   

19.
由于文本表示直接影响文本分类的效果,该文提出了一种有监督局部保持索引的文本表示方法.该方法利用Jaccard系数确定同一类别中文本之间的相似性,找出样本对应在低维空间中的文本表示.采用K近邻分类器在Reuters-21578数据集上进行训练和测试.实验结果表明,有监督保局索引方法在文本表示上更有优势.  相似文献   

20.
在传统推荐系统中,通常基于协同过滤推荐算法挖掘评分中的隐含特征,但在实际应用中,评分矩阵往往十分稀疏,很难充分地表示用户偏好特征与物品描述特征。为了充分挖掘评论文本中的隐含特征,并在一定程度上缓解数据稀疏性问题,提出一种深度协同过滤模型(CFiCNN):融合卷积神经网络的协同过滤模型。该模型利用卷积神经网络抽取用户-物品评论数据中的隐含特征,基于协同过滤的矩阵分解方法,进行评分预测。在4个真实数据集上对该模型进行了评估实验,并与3个常用模型进行对比。实验结果表明,该模型能够很好地抽取到用户与物品的隐含特征,并且进行更准确的评分预测。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号