首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 218 毫秒
1.
周靖 《茂名学院学报》2011,21(4):56-58,66
在文本分类过程中,为解决传统支持向量机(SVM)多类分类的不可分区域问题及提高分类性能,提出了一种改进的偏二叉树多类SVM算法。算法依据根据样本的分布情况计算训练集文本特征参数的信息熵,并将熵值结合欧式距离公式以确定各类文本间的相似性测度;以相似性测度作为偏二叉树结构的分类走向,对训练集进行学习,构建各个二类子SVM分类器。实验结果表明,该算法具有较高的分类性能,能更好地解决实际文本分类过程中的问题。  相似文献   

2.
支持向量机(SVM)在处理大样本特征维数较多的数据集时,算法消耗时间长而且容易陷入局部最优解,选择不合适的SVM算法参数会影响SVM模型分类性能。为了提高SVM性能,提出了基于粒子群算法(PSO)和遗传算法(GA)相结合的SVM特征选择与参数同步优化算法PGS。在UCI标准数据集上的实验表明,PGS算法能有效地找出合适的特征子集及SVM算法参数,提高收敛速度并能在较小的特征子集获得较高的分类准确率。  相似文献   

3.
《嘉应学院学报》2016,(5):16-20
针对传统Android恶意应用检测方法在处理大规模样本时存在的训练时间长、存储空间消耗大的问题,提出一种基于增量学习SVM的Android恶意应用检测方法.该方法提取Android应用的权限申请和API函数调用特征,利用增量学习SVM理论将训练样本集随机划分为初始样本集和若干个增量样本集,利用循环迭代方法训练SVM分类器,每次新的训练仅保留上一轮训练得到的支持向量集并合并到新增样本集中,舍弃大量对分类结果不产生影响的样本以提高分类器学习效率,同时产生新的支持向量集,并最终得到一个高精度的SVM分类器.通过将增量学习SVM算法与基本SVM算法进行对比实验,结果表明,该算法可以有效降低分类器学习时间,减少样本存储的空间占用,同时随着样本规模的积累逐步提高分类精度.  相似文献   

4.
针对垃圾邮件大量存在的问题,提出基于MapReduce并行SVM的垃圾邮件分类算法,用支持向量机作为分类器,基于MapReduce将各子分类器进行合并,并通过重训练得到模型,利用该模型对测试集进行分类,得到结果。为解决算法精度损失、准确率低等问题,引入KNN,在原算法基础上进行循环迭代。  相似文献   

5.
分析了基于支持向量机(SVM)的文本分类方法,在此基础上,提出一种由SVM和概率统计方法相结合的文本分类方法。详细介绍该方法的实现原理、算法描述和工作流程,并进行实验测试。  相似文献   

6.
提出一种基于梯度方向直方图与AdaBoost+SVM的行人检测算法。方向梯度直方图用于描述和提取行人的外观及运动特征,并使得外观、运动特征实现相互融合。在分类器的选择上使用SVM作为AdaBoost的弱分类器对行人检测器进行分类训练,最终得到分类效果好的行人检测器,实现更好的检测性能。  相似文献   

7.
针对传统信用评价方法分类精度较低、数据集属性变量间存在相关性等问题,提出基于主成分分析的稀疏贝叶斯学习(PCA-SBL)算法。首先对数据集特征变量进行主成分分析,使降维后的变量无相关性|其次,对主成分分析后的数据进行稀疏贝叶斯分类|最后将 PCA-SBL 分类方法分类精度与传统分类方法精度进行比较。分析发现,在 German Credit Data 和 Australian Credit Data 上,与传统 KNN、朴素贝叶斯、SVM、随机森林、决策树相比,改进的 SBL 算法分类精度平均提高了 5.26%、4.65%、2.11%、2.125%、4.66%,与稀疏贝叶斯学习算法(SBL)相比,平均提高 0.965%,从而证明 PCA-SBL 算法具有更高的分类效果。  相似文献   

8.
为提高大数据集粗分类识别率,提出一种基于聚类分析的SVM-Kd-tree树型粗分类方法。首先根据数据集特征分布进行k-means两簇聚类,对聚类后的数据集进行类别分析,同时将属于两簇的同一类别样本划分出来;然后使用两簇中剩余样本训练SVM二分类器并作为树型结构根节点,将两簇数据分别合并,将划分出来的样本作为左右子孩子迭代构建子节点,直到满足终止条件后,叶子节点开始训练Kd-tree。实验结果表明,迭代构建树型粗分类方法使训练单一SVM平均时间减少了61.977 4%,比Kd-tree同近邻数量的准确率提高了0.03%。在进行大规模数据集粗分类时,使用聚类分析迭代构建组合分类器时间更短、准确率更高。  相似文献   

9.
为提高分类性能,提出了一种新的基于数据离散化和选择性集成的SVM集成学习算法。该算法采用粗糙集和布尔推理离散化方法处理数据集,构造有差异的个体SVM以提高集成学习的性能。在训练得到一批SVM之后,算法采用了选择性集成提高性能并减小集成规模。实验结果表明,所提算法能取得比传统集成学习方法Bagging和Adaboost更好的性能。  相似文献   

10.
支持向量机(SVM)作为一种机器学习分类算法应用广泛,但在处理高维度数据集时往往会由于特征维数较多遇到算法分类速度慢且容易陷入局部最优等问题。为了提高支持向量机的性能,提出一种基于多宽度高斯核(GKMW)的支持向量机特征选取算法FSG。FSG算法将泛化能力更强的多宽度高斯核函数引入支持向量机中代替传统的高斯核函数,利用多宽度高斯核函数能体现各个特征对分类贡献程度不同且能区分样本中各个特征重要性的特点,以多宽度高斯核函数的参数优化结果为基础进行特征选取。利用特征选取后的特征子集在多组标准UCI数据集上分类实验,实验结果表明所提算法性能优于有代表性的特征选取法。  相似文献   

11.
Intrusion detection using rough set classification   总被引:2,自引:0,他引:2  
Recently machine learning-based intrusion detection approaches have been subjected to extensive researches because they can detect both misuse and anomaly. In this paper, rough set classification (RSC), a modern learning algorithm, is used to rank the features extracted for detecting intrusions and generate intrusion detection models. Feature ranking is a very critical step when building the model. RSC performs feature ranking before generating rules, and converts the feature ranking to minimal hitting set problem addressed by using genetic algorithm (GA). This is done in classical approaches using Support Vector Machine (SVM) by executing many iterations, each of which removes one useless feature. Compared with those methods, our method can avoid many iterations. In addition, a hybrid genetic algorithm is proposed to increase the convergence speed and decrease the training time of RSC. The models generated by RSC take the form of "IF-THEN" rules, which have the advantage of explication. Tests and compa  相似文献   

12.
Recently machine learning-based intrusion detection approaches have been subjected to extensive researches because they can detect both misuse and anomaly. In this paper, rough set classification (RSC), a modem learning algorithm,is used to rank the features extracted for detecting intrusions and generate intrusion detection models. Feature ranking is a very critical step when building the model. RSC performs feature ranking before generating rules, and converts the feature ranking to minimal hitting set problem addressed by using genetic algorithm (GA). This is done in classical approaches using Support Vector Machine (SVM) by executing many iterations, each of which removes one useless feature. Compared with those methods, our method can avoid many iterations. In addition, a hybrid genetic algorithm is proposed to increase the convergence speed and decrease the training time of RSC. The models generated by RSC take the form of"IF-THEN" rules,which have the advantage of explication. Tests and comparison of RSC with SVM on DARPA benchmark data showed that for Probe and DoS attacks both RSC and SVM yielded highly accurate results (greater than 99% accuracy on testing set).  相似文献   

13.
SVM(Support Vector Machine,支持向量机)是由Vapnik等人提出的一种新的机器学习方法。以结构误差理论、条件二次优化理论与核空间理论作为理论基础,能够较地的解决机器学习的问题,如模型选择、过学习、非线性问题和灾难维数等,很适合应用在文本分类领域。针对文本分类技术的新问题,研究了已有的主动学习方法并对其进行改进,提出了一种新的主动学习算法,很好地解决了小规模标注样本集的分类问题。该方法尤其在难以获得大量类标签或者标注样本耗费较大的领域,更能显示出它的优越性,适合日新月异的互联网的应用。  相似文献   

14.
对于已经分类的数据和大量未分类数据,在运算过程中,采用一种新的半监督聚类算法为支持向量机提供新的训练数据.随后,利用支持向量机判别出所有数据的类别属性,并选取最可靠的点加入已分类集合.为了验证算法的效率,收集了67张黄瓜叶片色调的数字信息,并对具有6个已分类数据与61个未分类数据的数据集进行半监督聚类分析,以判断这些叶片的健康程度.结果表明,该聚类算法优于其他算法.  相似文献   

15.
传统的支持向量机分类算法在优化过程中对所有支持向量都进行优化,增加了计算量,降低了训练效率.针对上述缺点,在分析样本模糊隶属关系的基础上,采用改进的K近邻算法为已知样本分配隶属度,根据训练样本的隶属关系,剔除非支持向量,减少训练样本,并将其用于中文网页的分类中,得到了较好的分类效果.仿真实验结果表明,改进后的方法不仅相对简单,而且在保证分类器性能的情况下,能有效地减少支持向量机的训练样本数,从而提高支持向量机的训练和测试速度.  相似文献   

16.
Based on wavelet packet transformation(WPT), genetic algorithm(GA), back propagation neural network(BPNN)and support vector machine(SVM), a fault diagnosis method of diesel engine valve clearance is presented. With power spectral density analysis, the characteristic frequency related to the engine running conditions can be extracted from vibration signals. The biggest singular values(BSV)of wavelet coefficients and root mean square (RMS)values of vibration in characteristic frequency sub-bands are extracted at the end of third level decomposition of vibration signals, and they are used as input vectors of BPNN or SVM. To avoid being trapped in local minima, GA is adopted. The normal and fault vibration signals measured in different valve clearance conditions are analyzed. BPNN, GA back propagation neural network (GA-BPNN), SVM and GA-SVM are applied to the training and testing for the extraction of different features, and the classification accuracies and training time are compared to determine the optimum fault classifier and feature selection. Experimental results demonstrate that the proposed features and classification algorithms give classification accuracy of 100%.  相似文献   

17.
A method of medical image segmentation based on support vector machine (SVM) for density estimation is presented. We used this estimator to construct a prior model of the image intensity and curvature profile of the structure from training images. When segmenting a novel image similar to the training images, the technique of narrow level set method is used. The higher dimensional surface evolution metric is defined by the prior model instead of by energy minimization function. This method offers several advantages. First, SVM for density estimation is consistent and its solution is sparse. Second, compared to the traditional level set methods, this method incorporates shape information on the object to be segmented into the segmentation process. Segmentation results are demonstrated on synthetic images, MR images and ultrasonic images.  相似文献   

18.
熊思 《培训与研究》2009,26(8):87-90
乳腺癌是现代女性最常见的恶性肿瘤之一。支持向量机SVM是一种基于统计学习理论的机器学习算法,它能在训练样本很少的情况下达到良好的分类效果。本文提出一个基于支持向量机的超声乳腺肿瘤图像计算机辅助诊断系统,它由图像预处理、ROI特征提取和SVM分类器异常诊断三个模块构成。通过实验证明,在处理相同的样本数据集时,基于SVM算法的计算机辅助诊断系统相对于BP神经网络,有更高的诊断灵敏度。统计学习理论的发展将更加完善SVM,具有高分类性能的分类器将使计算机辅助诊断的能力进一步提高。  相似文献   

19.
为了解决传统纸质试卷人工统分过程存在工作量大、错误率高、统分效率低等问题,设计开发一款基于SVM的智能统分自学习系统。该系统由前端用户界面、后台手写分数识别子系统和自学习子系统构成。系统采用C#编程语言和Microsoft Visual Studio软件设计前端用户界面;使用Matlab作为系统运算后台,并构建SVM多分类器识别手写分数;使用C#编程语言设置定时器,在系统空闲时间定时启动Matlab执行自学习程序。经过MNIST数据集的训练和测试,SVM多分类器的测试精度达到97.74%。完成系统设计开发后,使用试卷统分栏图片测试系统。测试结果表明,该系统可以有效实现智能识别、统分栏内手写分数汇总以及自学习功能,并将运行结果清晰准确地显示在前端用户界面上。  相似文献   

20.
INTRODUCTION Support Vector Machine (SVM) is a relativelynew soft computing method based on statisticallearning theory presented by Vapnik (1995). In SVM,original input space is mapped into a high dimen-sional dot product space called feature space in whichthe optimal hyperplane is determined to maximize thegeneralization ability of the classifier. The optimalhyperplane is found by exploiting a branch ofmathematics, called optimization theory, and re-specting the insights provided by …  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号