首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 187 毫秒
1.
为减少不均衡数据对支持向量机分类性能的影响,提出一种基于二次支持向量机的欠取样分类算法,该算法依据样本的分类超平面贡献大小对多数类样本进行欠取样.并对少数类样本进行过取样,重构训练数据集。该算法能够删除样本中的噪声数据。用控制参数控制删除样本的规模,实验表明,该算法能够提高支持向量机在不均衡数据集下的分类性能。  相似文献   

2.
为了平衡和减少两类不平衡数据的错分率,针对两类不平衡数据的分离超平面的偏置提出一种调整方法。该方法以两类错分概率相等为准则,使用特征提取方法,把高维样本投影到标准支持向量机的法向量上得到一维数据,当一维投影数据服从正态分布时,可由它所提供的信息,对标准的支持向量机中分离超平面的偏置进行调整。随机模拟试验表明了所调整的超平面不仅平衡了错分率而且减少了错分率。与现有方法相比,该方法具有较高的精度。  相似文献   

3.
针对信用评价中最为常见的不平衡小样本数据集问题,以及不同误分类造成的损失代价不同问题,在传统SVM模型基础上,提出采用过采样的SMOTE算法解决数据不平衡问题。在核SVM模型的基础上运用交叉验证得出核最优参数,加入非对称误差成本(DEC),提高将高风险误分为低风险的成本,建立更适用于信用评价的模型。经数据验证,该算法有效弥补了传统SVM模型在不平衡数据集分类中的缺陷,避免了小样本数据集样本过少而使得模型泛化能力降低的问题。加入DEC之后的模型与未加入的相比,虽分类准确率略有降低,但将高风险误分为低风险的错误明显降低,更适用于信用评价模型。  相似文献   

4.
文中深入讨论了利用支持向量机构造多分类器的方法,并比较了它们的优缺点,提出了基于赫夫曼树的SVM多分类构造算法,并在训练时间及判别时间上证明了该构造算法的优越性,减少了分类器的判别时间.  相似文献   

5.
模式识别逐步成为高校本科生和研究生的主干课程,模式分类实验越来越受到重视。以目前广泛的模式分类方法———支持向量机为例,通过Matlab仿真,对模式分类实验方法进行探讨与研究。该实验有助于学生进一步理解模式分类的工作原理,为后续相关内容的学习奠定坚实的基础。人工数据集和标准数据集上的实验表明,支持向量机能较好地完成分类任务。  相似文献   

6.
不平衡数据在各个应用领域普遍存在。在处理不平衡数据时,破坏原始数据的分布特点和丢弃多数类样本的潜在信息都会降低分类精度,为此,提出一种不平衡数据集成分类方法。从多数类样本中依据计算得到的综合权重进行随机采样,并与少数类样本组成新的训练样本子集|为了保证基分类器的差异性,将投影得到的不同样本子集作为各个基分类器的训练样本,通过多分类器集成学习获得最终分类结果|在UCI数据集下进行实验。结果表明,该方法不仅能够提高少数类样本的分类性能,而且能够有效提高整体分类精度。  相似文献   

7.
8.
反义词的不平衡现象是指一对反义词在使用时其范围大小、频率高低并不相等 ,它不同于男与女的使用情况 ,二者存在 3个方面的差异  相似文献   

9.
10.
基于SVM的分类方法及其应用   总被引:1,自引:0,他引:1  
本文对支持向量机的原理、核函数及分类方式进行了详细的介绍,给合实例探讨了支持向量机在分类中的具体应用,并根据应用结果指出了支持向量机的优缺点,最后展望了支持向量机在分类应用的前景。  相似文献   

11.
随着数据库技术的迅速发展以及数据库管理系统的广泛应用,人们积累的数据越来越多.激增的数据背后隐藏着许多重要的信息,人们希望能够对其进行更高层次的分析,以便更好地利用这些数据.将目前先进的机器学习技术支持向量机,与数据挖掘结合起来,提出了一个改进的支持向量机训练算法,进行了支持向量机自动分类的模拟试验.试验结果显示,新算法的训练速度明显提高,并获得了比较理想的分类结果.  相似文献   

12.
为促进农业向精准农业、智慧农业方向发展,针对种业中衡量种子质量的重要指标千粒重,为提高其精确度,提出基于非负矩阵分解与支持向量机的粘连种子分类算法,在利用机器视觉与图像识别等技术进行种子颗粒计数时,解决种子因严重粘连(经图像预处理、形态学操作等仍粘连)使系统出现误判,导致计数结果误差较大的问题。实验以玉米种子为研究对象,研究3种常见粘连类型。采用基于NMF的方法实现种子粘连图像有效特征的提取,再运用SVM构建多分类器,解决种子粘连类型的三分类问题,最后通过实验验证,该方法的分类准确率为98%。  相似文献   

13.
SVM(Support Vector Machine,支持向量机)是由Vapnik等人提出的一种新的机器学习方法。以结构误差理论、条件二次优化理论与核空间理论作为理论基础,能够较地的解决机器学习的问题,如模型选择、过学习、非线性问题和灾难维数等,很适合应用在文本分类领域。针对文本分类技术的新问题,研究了已有的主动学习方法并对其进行改进,提出了一种新的主动学习算法,很好地解决了小规模标注样本集的分类问题。该方法尤其在难以获得大量类标签或者标注样本耗费较大的领域,更能显示出它的优越性,适合日新月异的互联网的应用。  相似文献   

14.
本文提出一种利用特征加权支持向量机(FWSVM)识别河流、湖泊等水域中血吸虫尾蚴的算法.该算法采用图像形态学、动态阈值化等图像处理方法在图片中搜索可能存在尾蚴的区域,然后利用疑似区域图像的Hu矩作为特征值训练FWSVM,最后利用训练好的分类器对采集的视频进行识别.实验结果表明该算法能够有效识别水域中的血吸虫尾蚴.  相似文献   

15.
In order to improve the performance of support vector machine (SVM) applications in the field of credit risk evaluation, an adaptive Lq SVM model with Gauss kernel (ALqG-SVM) is proposed to evaluate credit risks. The non-adaptive penalty of the object function is extended to (0, 2] to increase classification accuracy. To further improve the generalization performance of the proposed model, the Gauss kernel is introduced, thus the non-linear classification problem can be linearly separated in higher dimensional feature space. Two UCI credit datasets and a real life credit dataset from a US major commercial bank are used to check the efficiency of this model. Compared with other popular methods, satisfactory results are obtained through a novel method in the area of credit risk evaluation. So the new model is an excellent choice.  相似文献   

16.
通过分析室内室外图像的内容,发现其差异性有一定规律性,通常情况下,室内图像含有较高比例的具有一定规则的几何形状的人造物体,而室外图像含有一定比例的具有分形结构的自然物体。本文的方法是利用这个差异性和图像的颜色作为出发点,使用支持向量机(SVM)作为分类器依据图像的边缘和颜色矩特征对图像进行分类。实验结果表明此方法对室内、室外图像分类可以获得较高的准确率。  相似文献   

17.
基于支持向量机的栗属树种分类研究   总被引:1,自引:0,他引:1  
形状特征是物体识别的重要依据。同时,分类算法的选择也将对识别的性能造成很大影响。围绕上述两个问题,以栗属树种的果实图像为例,在准确分割出目标图像的基础上,分别应用不变矩和边界矩提取其形状特征值,并使用支持向量机算法对栗属树种果实图像进行分类。实验结果表明:基于支持向量机的栗属树种果实图像分类识别准确率可达到87.5%,识别的结果较为理想。  相似文献   

18.
针对人脸检测中的非线性和降维问题提出了一种有效的人脸检测方法。首先基于人脸的肤色和几何特征.通过局部自适应门限方法提取图象边缘,用几何规则和颜色特征筛选出候选眼睛块。然后采用改进的四边界sobel算子对眼睛精确定位。最后使用训练好的支撑向量机来验证。该方法可以实现多尺度多角度的彩色图像中的正面人脸检测,实验结果令人满意。  相似文献   

19.
基于离散单元法建立了圆柱形颗粒阻尼器的仿真模型,研究了阻尼器内颗粒在不同激振条件下的运动形态及其能量耗散大小。为了获取两者之间的定量关系,应用基于网格搜索法(GS)的支持向量机(SVM)建立了颗粒运动形态的分类预测模型及其能量损耗的回归预测模型,对颗粒运动形态的分布及其能量损耗的大小进行了预测,并通过仿真进行了验证。结果表明:基于GS方法优化的SVM能够建立一个预测准确度很高、推广泛化能力很强的分类和回归预测模型,该预测模型不仅能够很好地揭示颗粒系统在不同运动形态下的能量耗散的变化规律,而且还能在较大的激振条件范围内确定系统能量耗散最大值及对应的运动形态。  相似文献   

20.
可靠的语音端点检测算法是稳健语音识别系统所必须的。针对现有算法在噪声环境下的稳健性问题,提出了基于单类SVM(Support Vecfor Machine)的端点检测算法。通过对多特征信息进行在线学习与综合,以及采用双层决策机制,有效提高了语音检测的稳健性。实验表明,算法在多种噪声环境和信噪比条件下有效,明显提高了语音识别系统在噪声环境下的识别率。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号