共查询到17条相似文献,搜索用时 93 毫秒
1.
基于KNN和SVM的中文文本自动分类研究 总被引:1,自引:0,他引:1
借助文本分类系统软件,采用来自10个大类的中文文本数据,按照训练集与测试集2:1的比例,使用KNN和SVM分类算法,对数据集进行自动分类的实验。旨在通过具体的语料库实验,探讨文本自动分类的关键技术,分析、比较与评价实验结果,探讨文本分类中具体参数的设置和不同分类算法之优劣。 相似文献
2.
3.
4.
5.
基于改进KNN的文本分类方法 总被引:9,自引:0,他引:9
本文针对VSM (向量空间模型)中KNN (K最近邻算法)在文本处理环境下的不足,根据SOM (自组织映射神经网络)理论、特征选取和模式聚合理论,提出了一种改进的KNN文本分类方法。应用特征选取和模式聚合理论以降低特征空间维数。传统的VSM模型各维相同的权重并不适应于文本处理的环境,本文提出应用SOM神经网络进行VSM模型各维权重的计算。结合两种改进,有效地降低了向量空间的维数,提高了文本分类的精度和速度。 相似文献
6.
7.
基于改进的SVM文本分类建模 总被引:1,自引:0,他引:1
SVM是一种新的分类工具,可是其核函数在数学上必须满足Mercer条件,使得具有良好全局分类性能的Sigmoid函数在SVM中应用受到限制。本文将Sigmoid核函数与云模型相结合,提出一种简单的核函数的实现方法。此方法不仅提高了SVM文本分类能力,而且明显地减少了平均的CPU执行时间。 相似文献
8.
随着智能终端设备的不断普及,微博、微信等国内最受欢迎的社交平台等富含情感倾向的中英文混合极短文本数据的信息呈爆发式增长。为了有效提取中英文混合极短文本中的情感倾向等关键特征信息,本文提出了一种基于情感倾向和SVM的极短文本分类模型。首先对原数据进行识别并利用kettle、N-Gram模型对数据进行处理;然后利用TF-IDF提取分类所需要的关键词;再将处理后的数据存入词向量集;最后利用SVM对混合极短文本进行分类。经过K-fold交叉验证,检验了模型的有效性。实验以微博等主流社交平台上的6905条极短文本数据作为样本进行实验与分析。结果表明在分类准确率方面,该方法能够有效提高匹配效率;同时在泛化误差与精确度指标上匹配结果更加均衡。 相似文献
9.
应用于中文文本分类的改进KNN算法 总被引:1,自引:0,他引:1
本文介绍了文本分类的基本流程及涉及到的相关技术,详细介绍了传统KNN方法并分析了它存在的不足之处,在此基础上提出了一种改进的KNN方法,该方法在相似度计算上进行了改进,通过实验证明了改进的KNN方法在宏召回率、宏准确率、宏F1值以及微F1上都有所提高。 相似文献
10.
11.
主要研究了文本分类精度问题。介绍了文本分类的基本过程,提出了一种改进的支持向量机文本分类技术,设计并实现了一个开放的中文文档自动分类系统。实验结果表明,提出的方法不仅具有较高的训练效率,同时也能得到很高的分类准确率和查全率。 相似文献
12.
13.
14.
基于改进SVM的网络异常数据优化分类方法研究 总被引:1,自引:0,他引:1
《科技通报》2016,(2)
对网络异常数据进行准确分类能够为网络入侵分类、保障网络安全提供准确的依据。传统算法没有考虑网络异常数据分布的不均衡性和高动态变化性,从而降低了分类的准确率和效率。为此,提出一种基于改进SVM的网络异常数据分类方法。在确定网络异常数据隶属度的时候考虑到其与类中心的关系,对传统的SVM进行了改进,在构建SVM分类器的过程中,引入了模糊隶属度函数,并将网络异常数据的分类问题转换为二次规划问题,最终实现网络异常数据的准确分类。仿真实验结果表明,利用改进算法进行网络异常数据分类,能够提高网络异常数据分类的准确率和分类效率,效果令人满意。 相似文献
15.
本文对文本分类过程中关键的部分进行了改进,在分词阶段,对分词的速度和精度进行了改进,在特征选取阶段,把多种特征选取方法进行了融合,最后对分类器进行了优化,并给出了实验测试的结果,实验的结果表明,文本分类的效率的确有了提高. 相似文献
16.
针对传统的竞争情报分析模型无法有效地对情报源进行深入挖掘分析,获取企业所需的深层情报内容,本文构建了基于语义空间和SVM的竞争情报分类分析模型.该模型利用语义空间来表示文本,提高文本表示的精度;利用基于语义核函数的SVM分类分析算法进行学习和训练,实现语义层面的竞争情报分类分析.实验结果表明,该模型取得了很好的预期效果,显著提高了竞争情报分析的准确率和效率. 相似文献
17.
一种改进的SVM决策树文本分类算法 总被引:1,自引:0,他引:1
将SVM和二叉决策树结合起来构成SVM决策树的方法能够较好地解决多类文本分类问题,在此基础上引入了一种基于支持向量数据描述(SVDD)的类间可分性度量方法,对SVM决策树分类器进行改进,实验表明,该方法有效地提高了SVM决策树多类分类器的分类精度和速度. 相似文献