首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于KNN和SVM的中文文本自动分类研究
引用本文:张野,杨建林.基于KNN和SVM的中文文本自动分类研究[J].情报科学,2011(9).
作者姓名:张野  杨建林
作者单位:南京大学信息管理系;
基金项目:国家社会科学基金项目(09BTQ020)
摘    要:借助文本分类系统软件,采用来自10个大类的中文文本数据,按照训练集与测试集2:1的比例,使用KNN和SVM分类算法,对数据集进行自动分类的实验。旨在通过具体的语料库实验,探讨文本自动分类的关键技术,分析、比较与评价实验结果,探讨文本分类中具体参数的设置和不同分类算法之优劣。

关 键 词:自动分类  KNN  SVM  中文信息处理  

Reseach on Automatic Classification for Chinese Text Based on KNN and SVM
ZHANG Ye,YANG Jian-lin.Reseach on Automatic Classification for Chinese Text Based on KNN and SVM[J].Information Science,2011(9).
Authors:ZHANG Ye  YANG Jian-lin
Institution:ZHANG Ye,YANG Jian-lin(Department of Information Management,Nanjing University,Nanjing 210093,China)
Abstract:This paper describes the experimental process of automatic text categorization. The experiment chooses Chinese text data sets from 10 categories,and distributes the training set and test set based on the ratio of 1:2. With the help of text automatic classification system software,the experiment does automatic classification based on algorithms of KNN and SVM,in order to compare different classification algorithms and explore key technologies of text classification.
Keywords:automatic classification  KNN  SVM  Chinese information process  
本文献已被 CNKI 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号