首页 | 本学科首页   官方微博 | 高级检索  
     检索      

文本自动分类新探究
引用本文:陈可华.文本自动分类新探究[J].赤峰学院学报(自然科学版),2011,27(4):34-36.
作者姓名:陈可华
作者单位:宁德师范学院,计算机与信息工程系,福建,宁德,352100
基金项目:福建省教育厅B类科研项目,宁德师范学院科研资助项目
摘    要:文本自动分类是一种有效的组织信息和管理信息的工具.传统分类方法一般在分类效果和运行效率两者上不可兼得.通过综合Rocchio和KNN两种分类方法的优点,设计了一种基于多代表点的文本分类方法,该方法通过对各类挖掘出多个有效的代表点(真实或虚拟的),再使用基于这些代表点的Rocchio和KNN方法进行分类.实验表明,该方法以较少的训练时间达到令人满意的分类效果,并且能很好解决不平衡类问题,实验结果显示该方法能达到与SVM相当的分类效果.

关 键 词:文本分类  多代表点  Rocchio  KNN
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号