首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于SVM与KNN的中文文本分类比较实证研究
引用本文:刘怀亮,张治国,马志辉,孙蕾.基于SVM与KNN的中文文本分类比较实证研究[J].情报理论与实践,2008,31(6).
作者姓名:刘怀亮  张治国  马志辉  孙蕾
作者单位:西安电子科技大学,经济管理学院,陕西,西安,710071
基金项目:国家自然科学基金资助项目“基于语义网的多媒体检索与数据挖掘”(项目编号:70503022); 中国博士后基金项目“基于支持向量机的视频语义检索研究”(项目编号:20060400996)的研究成果之一
摘    要:本文详细介绍了中文文本分类过程以及SVM和KNN两种方法在中文文本分类中的具体步骤,给出了中文文本分类的模型。通过实验对SVM算法和传统的KNN算法应用于文本分类效果进行了比较性实证研究。研究表明,SVM分类器较KNN在处理中文文本分类问题上有更良好的分类效果,有较高的查全率和查准率。

关 键 词:支持向量机  文本分类  实证研究  

Empirical Study of the Comparison of SVM and KNN-based Categorization of Chinese Text
Liu Huailiang et al.Empirical Study of the Comparison of SVM and KNN-based Categorization of Chinese Text[J].Information Studies:Theory & Application,2008,31(6).
Authors:Liu Huailiang
Abstract:After describing the categorization process of the Chinese text and the concrete steps of using SVM and KNN to categorize the Chinese text,a model of Chinese text categorization is proposed.An empirical study of using the SVM algorithm and the traditional KNN algorithm to categorize the Chinese text is conducted.The experiment shows that,compared with KNN,SVM has better categorization effect of the Chinese text and higher recall ratio and pertinency ratio.
Keywords:support vector machine  text categorization  empirical study  
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号