首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 0 毫秒
1.
核函数参数的选择对支持向量机的性能有着重要影响,不同问题下合适的核参数取值差异性也很大。本文从实验的角度出发,验证研究了不同核参数的对支持向量机性能的影响。  相似文献   

2.
本文提出基于粗糙集和SVM的入侵检测算法。首先预处理训练集,再用粗糙集方法对数据集约简,然后采用两个两类SVM分类器实现对DoS和probing两类攻击检测,最后送入C4.5规则库匹配处理,实现对U2R和R2L攻击的检测。  相似文献   

3.
杨敏  谷俊 《图书情报工作》2012,56(9):114-119
将文本自动分类技术应用于图书书目的自动分类中,利用ICTCLAS分词系统对书名和摘要信息进行中文分词,为标题和摘要的特征词赋予不同的权重。在构建基于文本特征矩阵的基础上,结合SVM算法对实验语料进行学习和测试。为了验证TFIDF权重对分类结果的影响,还对词频特征矩阵、TFIDF特征矩阵和混合特征矩阵进行测试和对比。实验证明,基于混合特征矩阵的SVM算法具有良好的分类效果。据此,构建基于SVM的书目自动分类系统。  相似文献   

4.
本文将潜在语义索引理论与支持向量机方法相结合,对文本向量各维与文本的语义联系进行特征抽取,建立了完整的基于潜在语义索引的支持向量机文本分类模型,分析了该方法与分词的维数以及SVM惩罚因子选择之间的关系.并在NN-SVM分类算法的基础上,通过计算样本点与其最近邻点类别的异同以及该点与其k个同类近邻点在核空间的平均距离来修剪混淆点,提出了一种改进的NN-SVM算法:KCNN-SVM算法.利用该算法对降维后的训练集进行修剪.实验表明,用新的模型进行文本分类,与单纯支持向量机相比,受到文本分词维数以及支持向量机惩罚因子的影响更小,其分类正确率更高.  相似文献   

5.
运用非结构化信息挖掘,对网络评论情感进行分析是一个非常重要的方法。本文基于Web客户评论情感文本,在情感文本预处理过程中使用四种不同的停用词表,采用两种不同的特征选择方法,选用著名的TF-IDF权重计算方法,使用基于RBF核函数的支持向量机方法的分类器实现了对携程网上采集的4000个酒店客户评论情感文本的分类研究。通过实验,分析了不同特征选择方和停用词表的使用对客户评论文本情感分类的影响,提出了基于情感文本分类的有效的停用词表。  相似文献   

6.
本文的研究目的在于介绍一种新兴的从统计学习理论发展而来的方法——支持向量机(SVM),并将其用于银行信用风险分析。支持向量机是一种基于统计学习理论的分类方法。可将其用于分析财务比率和非财务比率,并且用于违约概率的估计的一种方法。本文将通过实证分析来证明支持向量机能够从财务数据中提取或挖掘出有用信息。  相似文献   

7.
基于机器学习的自动文本分类模型研究   总被引:2,自引:0,他引:2  
基于机器学习的方法是自动文本分类中非常重要的一大类方法。本文先给出了形式化的定义,提出了自动文本分类的流程模型,然后选取了支持向量机(Support Vector Machine,SVM)算法作为一个典型例子进行分析,最后作者通过一个中文文本分类实验评价了该算法的效果。  相似文献   

8.
[目的/意义]主题创新是学术论文创新最本质的特征之一。基于主题演化视角对情报学论文的创新性进行分析,以期提供动态评价的新思路。[研究设计/方法]选取情报学领域11种CSSCI期刊近20年的论文作为样本,结合LDA主题模型与SVM分类算法,对摘要进行潜在主题识别,并判断论文创新性。最后,采用统计方法验证评价结果的准确性。[结论/发现]应用的学术论文创新性评价方法能够有效识别情报学领域不同时期具有创新价值的论文,可以为学者的科研选题、论文主题创新性评价以及期刊的论文评审提供参考。[创新/价值]拓展融合LDA与SVM的创新性评价方法的应用领域,丰富基于内容的科研论文创新性评价体系。  相似文献   

9.
对1999-2008年国内支持向量机文本分类研究论文,从来源数据库、发表时间、期刊分布等方面进行文献计量分析,按主题简要介绍该领域理论研究和应用研究两个层次的主要成果,对这些成果从内容和研究方法上进行评述,指出SVM文本分类的不足,对研究中存在的问题进行分析总结,使读者全面对该领域研究情况认识,以期促进该领域进一步的深入发展。  相似文献   

10.
提出了一种基于预抽取支持向量机及模糊循环迭代算法的改进的支持向量机(Support Vector Machines,SVM)的两类文本分类方法, 与传统的SVM相比, 该方法具有高得多的计算效率。文中给出了具体算法并将其用于文本分类中,实验表明了本算法用于文本分类的有效性及其高效率。  相似文献   

11.
从题名抽取关键词,把题名作为基于本体自动分类的文本主体,实现海量科技论文高效、精准地分类,已经成为图书馆事业发展的重要课题。本文利用文本内部词汇的语义关联特性,在高频词和隐含主题两个不同粒度层面,构建了基于BTM模型的题名信息自动分类方法:首先从细粒度层面进行词频统计,提取领域高频词;随后从粗粒度层面进行BTM模型分析,得到主题关键词;之后,将两者去重合并获得领域核心词集;最后,利用SVM算法进行文本分类。该方法有效地实现了知识的快速聚类和关联自动分类,为用户提供了满意度更高的知识发现及相关扩展服务。  相似文献   

12.
骨龄检测在医学、体育科学和司法等领域有着广泛的应用,基于数字图像处理技术来进行骨龄检测是目前骨龄评价的发展趋势,文章提出了一个完整的基于手腕部X光图像的骨龄检测系统的设计和实现方案。骨龄算法依据我国提出的骨龄评价方法CHN法,提取手部X光图像的骨骺特征参数,运用支持向量机方法进行骨龄识别。骨龄检测系统具有交互检测,可视化的特点,允许在检测过程中对图像处理所使用的方法和骨骺特征进行可视化交互调整,骨龄数据管理根据用户角色的不同提供不同的数据管理操作。  相似文献   

13.
博硕士学位论文具有较高的学术研究和使用价值,本文根据学位论文编目分类的特点,使用支持向量机的方法,采用分层分类的办法对学位论文进行自动分类,实验证明了该方法在学位论文分类上的有效性和可行性.  相似文献   

14.
应用最大似然分类、马氏距离分类、最小距离分类、决策树和支持向量机这五种分类方法对北京密云1999年的TM影像进行分类。首先介绍了分类的流程,然后对这五种分类方法进行简单介绍,通过选取训练样本,最后进行分类。  相似文献   

15.
移动互联网的迅速发展成为全球信息通信领域最令人瞩目的现象之一,相比于传统电信市场下的用户需求,移动互联网环境下的消费者需求更加多样化,消费者的行为也呈现出新的特点。根据消费者的以上行为特点,本文基于支持向量机的算法对此现象进行数据挖掘和研究。现有研究证明支持向量机具有良好的推广泛化能力,取得了大量的应用研究成果,采用此研究方法能够得到可靠有效的实验结论,适宜在移动互联网环境下消费者行为研究上推广应用。  相似文献   

16.
一种混合文本分类方法研究   总被引:1,自引:0,他引:1  
文本自动分类是信息检索领域的一个重要研究方向。一些标准的机器学习算法像支持向量机已经成功地运用到了这一领域。不幸的是高维的输入向量严重的影响了分类速度,而支持向量机核函数参数的确定影响到分类的精度。为了提高分类精度和分类速度,本文提出了一种混合分类算法,首先用粗糙集理论对向量进行约简,然后采用基因算法对支持向量机的核函数参数进行优化。实验证明我们提出的算法是有效的。  相似文献   

17.
针对图书借阅量数据呈现的非平稳动态随机变化特性,采用支持向量机作为建模工具,利用混沌时间序列理论对图书借阅流量行为进行了建模和学习预测,结果表明,该方法可有效解决图书借阅行为中的非线性问题,预测结果合理,对提高图书借阅管理质量有较好的理论和实践参考价值.  相似文献   

18.
支持向量机理论引入到图像水印技术,给图像水印技术的研究发展带来了新的活力。本文对基于支持向量机的图像水印技术的研究现状进行概要性的介绍,并在此基础上,鉴于光滑支持向量机比传统支持向量机拥有更好的综合特性,提出今后基于光滑支持向量机图像水印技术的研究设想,为光滑支持向量机理论的应用提供新的思路。  相似文献   

19.
针对一示例同属多类的问题,提出多标记支持向量机并在此基础上构建基于访问页面的多标记用户分类系统。该系统首先对Web页面进行预处理并利用流形判别分析进行文本特征提取,然后利用多标记支持向量机对文本进行分类,最后对分类结果进行评价。真实数据集上的实验表明所建系统的有效性。  相似文献   

20.
基于支持向量机的产品属性识别研究   总被引:1,自引:0,他引:1  
本文提出了一种结合自然语言处理技术与支持向量机模型,从客户评论中识别产品属性的方法.为了检验该方法的有效性,从收集的22 157条有关餐厅的评论语句中随机选取3701条,对其进行手工标注.针对手工标注语料库,利用支持向量机方法进行了产品属性识别训练和测试,并在准确率、召回率、F1值方面进行了评估.在测试结果中,平均准确率为95.6%,平均召回率为81.9%,平均F1值为87.3%.实验结果表明,该方法在平均准确率、平均召回率和平均F1值方面均高于最大熵模型方法,在句子层次上具有较好的属性识别效果.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号