首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
构造性学习(CML)算法训练分类器对有些样本会有“拒认状态”,构造性学习算法中对这一状况的处理使用就近原则,然而,这种方法无法体现数据之间的联系.为了能更好地体现数据间的联系,提出了人脑分类机理的构造性学习方法(HB-CML).在测试阶段,把测试样本、训练样本都考虑进来,利用人脑对数据的自动分类机理,对“拒认状态”样本进行分类标记.同时,选取UCI数据集进行实验.结果表明:与CML算法相比,该方法的分类更为有效.  相似文献   

2.
如今文本自动分类技术发展已较为成熟,中文网页的分类也是自动分类技术的应用之一.分类精度依赖于分类算法,贝叶斯算法在网页分类中有很广泛的使用,但它需要大量且已标记的训练集,而获得大量带有类别标注的样本代价很高.本文以中文网页信息增量式的学习作为研究对象,利用网页已验信息处理训练集增量问题,提出一种改进的增量式的贝叶斯分类算法,研究利用未标记的中文网页来提高分类器的性能,并进行相关实验对比和评价.  相似文献   

3.
《嘉应学院学报》2016,(5):16-20
针对传统Android恶意应用检测方法在处理大规模样本时存在的训练时间长、存储空间消耗大的问题,提出一种基于增量学习SVM的Android恶意应用检测方法.该方法提取Android应用的权限申请和API函数调用特征,利用增量学习SVM理论将训练样本集随机划分为初始样本集和若干个增量样本集,利用循环迭代方法训练SVM分类器,每次新的训练仅保留上一轮训练得到的支持向量集并合并到新增样本集中,舍弃大量对分类结果不产生影响的样本以提高分类器学习效率,同时产生新的支持向量集,并最终得到一个高精度的SVM分类器.通过将增量学习SVM算法与基本SVM算法进行对比实验,结果表明,该算法可以有效降低分类器学习时间,减少样本存储的空间占用,同时随着样本规模的积累逐步提高分类精度.  相似文献   

4.
王振岭 《教育技术导刊》2012,11(10):162-164
随着因特网的快速增长和无线传感器网络的发展,网络安全已成为人们必须考虑的研究课题。提出无线传感器网络入侵检测的多层次分类技术,使用智能代理、决策树分类器和增强型多类支持向量机算法的组合,有效实施入侵检测系统,从而保护无线传感器网络的安全。这种方法的主要优点是系统可以用未标记数据进行训练,能够使用代理技术检测到以前发现不了的攻击。使用KDDCUP'99数据集进行验证测试,实验结果表明,系统入侵检测率和误报减少率都取得了显著的改善。  相似文献   

5.
针对垃圾邮件大量存在的问题,提出基于MapReduce并行SVM的垃圾邮件分类算法,用支持向量机作为分类器,基于MapReduce将各子分类器进行合并,并通过重训练得到模型,利用该模型对测试集进行分类,得到结果。为解决算法精度损失、准确率低等问题,引入KNN,在原算法基础上进行循环迭代。  相似文献   

6.
目的:由于高光谱成像的特性,高光谱遥感影像较光学、多光谱影像具有更多的光谱信息,因此对高光谱影像地物的分类也相对困难。为提高分类精度,本文提出一个新的高光谱遥感影像分类模型。创新点:考虑到不同的地物覆盖对不同波段范围的电磁波有不同的敏感度,本文提出一个基于卷积神经网络和光谱敏感度的深度学习模型,以提高对高光谱遥感影像地物分类的准确率。通过在最终的分类器后添加一个光谱权重,该模型能够更准确地分类地物。方法:1.将带标记的样本在光谱维度上分为可见光和红外波段,并将部分样本作为训练集和测试集输入到网络中进行训练。2.训练完成后利用模型对全图进行预测,并通过部分预测结果计算出未识别率δ和误识别率γ两个参数。3.利用δ和γ可计算出不同光谱范围的光谱权重并将其置于分类器前(图5)。结论:1.模型加入光谱权重后的分类准确率较之前提高了约2%。2.利用公共数据集测试后显示,使用了光谱权重的卷积神经网络模型的分类精度比未使用光谱权重的模型高约1%。3.本文结果显示,利用不同地物对电磁波的敏感性差别可以增加不同地物间的差异,从而提升分类模型的性能。  相似文献   

7.
SVM算法只使用已归类的数据训练分类器,而EM算法用少量已归类数据,结合大量的未归类数据来训练分类器,在减少已归类数据的同时保证了分类器的精度。本文基于EM算法的思想,根据SVM文本分类模型,提出一种新的迭代SVM文本分类算法。实验结果表明,迭代SVM算法分类精度高于传统的SVM文本分类算法,具有较好的性能。  相似文献   

8.
卷积神经网络的深度学习在图像识别领域取得了巨大的成功,但是训练一个深度学习网络需要大量的数据样本。在实际工作中,很难得到大量的训练样本,在数据集有限的情况下,容易过度拟合。针对这一问题,设计了一种基于转移学习的深度卷积神经网络来解决小样本数据集的问题。采用数据扩充的方法来扩大样本数据集的数量,利用转移学习将训练好的网络(CNN)从大样本数据集中转移到的小样本数据集中进行二次训练,使用全局平均池而不是全连接层来训练网络,并利用Soft max进行分类。该方法解决了深度学习中样本数据集小的问题,提高了操作效率。实验结果表明,该方法对小样本数据集的分类具有较高的识别率。  相似文献   

9.
近年来基于Adaboost的人脸检测算法因其快速和可接受的检测率得到了成功的应用,但Viola-Jones学习算法需要对级联分类器的每一个特征反复训练弱分类器显得非常缓慢。本文给出了一种新的级联检测器节点分类设计方法,首先将每个节点所有弱分类器的训练移到循环外,然后选择使强分类器有最小错误率的特征集代替选择单个最小加权误差的特征生成强分类器。实践表明该训练速度快于Viola-Jones的方法。  相似文献   

10.
针对标准支持向量机训练时间过长与参数选择无指导性问题,给出一种通过粒子群优化双支持向量机模型参数的方法。与标准支持向量机不同,该方法的时间复杂度更小,特别适合不均衡的数据样本分类问题,对求解大规模的数据分类问题有很大优势。将该算法与标准的支持向量机分类器在不同的文本数据集上进行仿真实验对比,以验证算法的有效性。结果表明基于粒子群优化的双子支持向量机分类器的分类结果高于标准支持向量机分类结果。  相似文献   

11.
周靖 《茂名学院学报》2011,21(4):56-58,66
在文本分类过程中,为解决传统支持向量机(SVM)多类分类的不可分区域问题及提高分类性能,提出了一种改进的偏二叉树多类SVM算法。算法依据根据样本的分布情况计算训练集文本特征参数的信息熵,并将熵值结合欧式距离公式以确定各类文本间的相似性测度;以相似性测度作为偏二叉树结构的分类走向,对训练集进行学习,构建各个二类子SVM分类器。实验结果表明,该算法具有较高的分类性能,能更好地解决实际文本分类过程中的问题。  相似文献   

12.
在不均衡数据集下,SVM分类超平面的偏移,使得基于KKT条件进行样本选择的增量学习算法性能不佳,针对该问题,提出动态代价的SVM增量学习算法,该算法依据各类样本密度之间的关系动态计算类的错分代价,减少每次迭代中分类超平面偏移造成的错误累积,保证依据KKT条件选取样本的准确性,使得每次迭代选取的样本都包含当前分类器缺少的空间信息,提高最终分类器在不均衡数据集下的分类性能。最后,在UCI数据集上的仿真实验结果表明该算法能够提高不均衡数据下的分类性能。  相似文献   

13.
支持向量机(SVM)是统计学习理论最为成功的实现。支持向量机适用于两类样本的分类问题,面对正负样本数目失衡的情况,加权的方法虽然能有效改变分类器对数目小的样本类的预测偏置问题,但往往是以牺牲数目较大样本类的预测精度为前提。单分类支持向量机(One-SVM)只用某一类样本来训练分类器,可以有效避免预测偏置问题的出现。本文将单分类支持向量机(One-classSVM)用于UCI数据库的灯盏花分类研究,结果显示,单分类支持向量机在处理样本数目失衡的模式识别问题中,具有良好的泛化能力,预测精度特异性达到95.45%,同时单分类支持向量机只用一类样本训练分类器,在算法的时间复杂度上也具有优势。  相似文献   

14.
传统的支持向量机分类算法在优化过程中对所有支持向量都进行优化,增加了计算量,降低了训练效率.针对上述缺点,在分析样本模糊隶属关系的基础上,采用改进的K近邻算法为已知样本分配隶属度,根据训练样本的隶属关系,剔除非支持向量,减少训练样本,并将其用于中文网页的分类中,得到了较好的分类效果.仿真实验结果表明,改进后的方法不仅相对简单,而且在保证分类器性能的情况下,能有效地减少支持向量机的训练样本数,从而提高支持向量机的训练和测试速度.  相似文献   

15.
为了提升不平衡数据中少数类的分类精度,利用SMOTE采样方法对数据集进行平衡化预处理;为了减轻样本重新合成过程中产生的类重叠和噪声对分类精度的影响,选择模糊粗糙最近邻算法(FRNN)作为分类器。在14个不平衡数据集上进行的仿真实验表明,该方法具有较好的分类表现,F值和G值最高分别可达0.965、0.932,是一种适用于不平衡率偏高数据集的分类方法。  相似文献   

16.
针对文本分类领域的有监督学习往往需要大量精准标注样本但大量人工标注困难的问题,提出一种新型的半监督学习方式,通过协同训练合理使用大量未标记训练样本,通过添加不同分类的文本特征噪声解决传统协同半监督学习方法中模型参数趋于统一的问题,同时提高分类模型的分类能力。针对传统深度学习方法中文本特征权重一致导致的分类特异性特征不突出问题,在训练模型中加入 self-attention 机制对文本句子特征权重进行提取,并通过句子加权方式突出特异性分类特征。实验结果表明,通过半监督学习方式同时使用少量已标注数据进行训练,模型能够达到 91.4%的准确率,召回率达到 84.3%,与有监督训练方式的分类准确能力相近,从而解决大量人工标注问题,具有一定的使用价值。  相似文献   

17.
目标跟踪是计算机视觉领域重要研究方向之一。压缩感知跟踪速度快、精度高,但是跟踪被遮挡目标时使用被遮挡的哈尔特征构建分类器,导致分类器性能降低,目标容易丢失。为了解决该问题,提出了根据l1稀疏表示判断哈尔特征是否被遮挡,然后使用未被遮挡的特征构建贝叶斯分类器。首先对每一帧跟踪结果运用稀疏表示提取出未被遮挡特征的集合,在构建贝叶斯分类器时仅使用未被遮挡的特征。然后使用训练好的分类器对下一帧候选样本进行分类,选取具有最大分类响应的候选样本作为跟踪结果。实验结果表明,该算法在跟踪目标部分遮挡时相比CT算法有更高跟踪准确度,算法能够实时得到高效、准确的目标跟踪结果。  相似文献   

18.
所统计分析的数据集是前列腺癌基因数据集.采用分片逆回归方法和线性判别分析(LDA),二次判别分析(QDA).对基因芯片(微阵列)数据进行分析.用SIR降维,用LDA和QDA分类.讨论分片逆回归方法和二种方法对基因样本进行分类的效果.  相似文献   

19.
"落地难"问题已经成为中国PPP模式可持续、健康发展过程中亟待解决的重大问题.通过深入剖析PPP"落地难"形成机理,从政府和项目两个维度分析PPP可落地性评价特征.针对传统分类器识别非平衡样本集的缺陷,通过人工合成数据,并引入集成学习算法,构建SMOTE-Bagging算法进行模型训练,解决PPP可落地性评价中样本数据...  相似文献   

20.
出了一种可伸缩的朴素贝叶斯分类算法。算法针对大数据集的训练数据,通过构建雨林框架,能在有限主存里存储训练数据,训练生成概率矩阵,进而对测试样本进行分类。算法仅对整库一次扫描。实验表明,该算法能够获得与整库读入主存相同的分类准确率.并且有较高的处理效率。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号