共查询到20条相似文献,搜索用时 15 毫秒
1.
2.
3.
5.
本文将潜在语义索引理论与支持向量机方法相结合,对文本向量各维与文本的语义联系进行特征抽取,建立了完整的基于潜在语义索引的支持向量机文本分类模型,分析了该方法与分词的维数以及SVM惩罚因子选择之间的关系.并在NN-SVM分类算法的基础上,通过计算样本点与其最近邻点类别的异同以及该点与其k个同类近邻点在核空间的平均距离来修剪混淆点,提出了一种改进的NN-SVM算法:KCNN-SVM算法.利用该算法对降维后的训练集进行修剪.实验表明,用新的模型进行文本分类,与单纯支持向量机相比,受到文本分词维数以及支持向量机惩罚因子的影响更小,其分类正确率更高. 相似文献
6.
7.
本文的研究目的在于介绍一种新兴的从统计学习理论发展而来的方法——支持向量机(SVM),并将其用于银行信用风险分析。支持向量机是一种基于统计学习理论的分类方法。可将其用于分析财务比率和非财务比率,并且用于违约概率的估计的一种方法。本文将通过实证分析来证明支持向量机能够从财务数据中提取或挖掘出有用信息。 相似文献
8.
基于机器学习的自动文本分类模型研究 总被引:2,自引:0,他引:2
基于机器学习的方法是自动文本分类中非常重要的一大类方法。本文先给出了形式化的定义,提出了自动文本分类的流程模型,然后选取了支持向量机(Support Vector Machine,SVM)算法作为一个典型例子进行分析,最后作者通过一个中文文本分类实验评价了该算法的效果。 相似文献
9.
[目的/意义]主题创新是学术论文创新最本质的特征之一。基于主题演化视角对情报学论文的创新性进行分析,以期提供动态评价的新思路。[研究设计/方法]选取情报学领域11种CSSCI期刊近20年的论文作为样本,结合LDA主题模型与SVM分类算法,对摘要进行潜在主题识别,并判断论文创新性。最后,采用统计方法验证评价结果的准确性。[结论/发现]应用的学术论文创新性评价方法能够有效识别情报学领域不同时期具有创新价值的论文,可以为学者的科研选题、论文主题创新性评价以及期刊的论文评审提供参考。[创新/价值]拓展融合LDA与SVM的创新性评价方法的应用领域,丰富基于内容的科研论文创新性评价体系。 相似文献
10.
11.
从题名抽取关键词,把题名作为基于本体自动分类的文本主体,实现海量科技论文高效、精准地分类,已经成为图书馆事业发展的重要课题。本文利用文本内部词汇的语义关联特性,在高频词和隐含主题两个不同粒度层面,构建了基于BTM模型的题名信息自动分类方法:首先从细粒度层面进行词频统计,提取领域高频词;随后从粗粒度层面进行BTM模型分析,得到主题关键词;之后,将两者去重合并获得领域核心词集;最后,利用SVM算法进行文本分类。该方法有效地实现了知识的快速聚类和关联自动分类,为用户提供了满意度更高的知识发现及相关扩展服务。 相似文献
12.
提出了一种基于预抽取支持向量机及模糊循环迭代算法的改进的支持向量机(Support Vector Machines,SVM)的两类文本分类方法, 与传统的SVM相比, 该方法具有高得多的计算效率。文中给出了具体算法并将其用于文本分类中,实验表明了本算法用于文本分类的有效性及其高效率。 相似文献
13.
骨龄检测在医学、体育科学和司法等领域有着广泛的应用,基于数字图像处理技术来进行骨龄检测是目前骨龄评价的发展趋势,文章提出了一个完整的基于手腕部X光图像的骨龄检测系统的设计和实现方案。骨龄算法依据我国提出的骨龄评价方法CHN法,提取手部X光图像的骨骺特征参数,运用支持向量机方法进行骨龄识别。骨龄检测系统具有交互检测,可视化的特点,允许在检测过程中对图像处理所使用的方法和骨骺特征进行可视化交互调整,骨龄数据管理根据用户角色的不同提供不同的数据管理操作。 相似文献
14.
博硕士学位论文具有较高的学术研究和使用价值,本文根据学位论文编目分类的特点,使用支持向量机的方法,采用分层分类的办法对学位论文进行自动分类,实验证明了该方法在学位论文分类上的有效性和可行性. 相似文献
15.
应用最大似然分类、马氏距离分类、最小距离分类、决策树和支持向量机这五种分类方法对北京密云1999年的TM影像进行分类。首先介绍了分类的流程,然后对这五种分类方法进行简单介绍,通过选取训练样本,最后进行分类。 相似文献
16.
移动互联网的迅速发展成为全球信息通信领域最令人瞩目的现象之一,相比于传统电信市场下的用户需求,移动互联网环境下的消费者需求更加多样化,消费者的行为也呈现出新的特点。根据消费者的以上行为特点,本文基于支持向量机的算法对此现象进行数据挖掘和研究。现有研究证明支持向量机具有良好的推广泛化能力,取得了大量的应用研究成果,采用此研究方法能够得到可靠有效的实验结论,适宜在移动互联网环境下消费者行为研究上推广应用。 相似文献
17.
一种混合文本分类方法研究 总被引:1,自引:0,他引:1
文本自动分类是信息检索领域的一个重要研究方向。一些标准的机器学习算法像支持向量机已经成功地运用到了这一领域。不幸的是高维的输入向量严重的影响了分类速度,而支持向量机核函数参数的确定影响到分类的精度。为了提高分类精度和分类速度,本文提出了一种混合分类算法,首先用粗糙集理论对向量进行约简,然后采用基因算法对支持向量机的核函数参数进行优化。实验证明我们提出的算法是有效的。 相似文献
18.
田梅 《图书馆理论与实践》2013,(7)
针对图书借阅量数据呈现的非平稳动态随机变化特性,采用支持向量机作为建模工具,利用混沌时间序列理论对图书借阅流量行为进行了建模和学习预测,结果表明,该方法可有效解决图书借阅行为中的非线性问题,预测结果合理,对提高图书借阅管理质量有较好的理论和实践参考价值. 相似文献
19.
20.
基于支持向量机的产品属性识别研究 总被引:1,自引:0,他引:1
本文提出了一种结合自然语言处理技术与支持向量机模型,从客户评论中识别产品属性的方法.为了检验该方法的有效性,从收集的22 157条有关餐厅的评论语句中随机选取3701条,对其进行手工标注.针对手工标注语料库,利用支持向量机方法进行了产品属性识别训练和测试,并在准确率、召回率、F1值方面进行了评估.在测试结果中,平均准确率为95.6%,平均召回率为81.9%,平均F1值为87.3%.实验结果表明,该方法在平均准确率、平均召回率和平均F1值方面均高于最大熵模型方法,在句子层次上具有较好的属性识别效果. 相似文献