首页 | 本学科首页   官方微博 | 高级检索  
     

基于信息粒度的交叠类文本分类方法
引用本文:林琛,李弼程,周杰. 基于信息粒度的交叠类文本分类方法[J]. 情报学报, 2011, 30(4). DOI: 10.3772/j.issn.1000-0135.2011.04.001
作者姓名:林琛  李弼程  周杰
作者单位:信息工程大学信息工程学院,郑州,450002
基金项目:国家863项目“网络舆情态势分析与预警关键技术研究”基金资助
摘    要:从信息粒度的角度分析了文本分类中出现样本错分的原因,同时结合人类认知方式,提出一种基于信息粒度的交叠类文本分类方法。新方法通过转换描述训练样本集合的粒度空间,对训练样本进行重新划分,加大训练样本之间的差异性,以此增加分类的先验知识;根据人类认知方式的特点,在划分后的训练样本集合上构建层次分类器进行分类。实验中采用了不同领域、不同类型的语料库,定量分析了类交叠程度对分类性能的影响并对新方法进行了测试。实验结果表明,新方法能够有效地提高分类性能,尤其适合于类交叠程度较高的情况。

关 键 词:信息粒度  文本分类  认知方式  

A Text Categorization Method for Overlapping Classes Based on Information Granularity
Lin Chen,Li Bicheng,Zhou Jie. A Text Categorization Method for Overlapping Classes Based on Information Granularity[J]. Journal of the China Society for Scientific andTechnical Information, 2011, 30(4). DOI: 10.3772/j.issn.1000-0135.2011.04.001
Authors:Lin Chen  Li Bicheng  Zhou Jie
Affiliation:Lin Chen,Li Bicheng and Zhou Jie (PLA School of Information Engineering,University of Information Engineering,Zhengzhou 450002)
Abstract:The paper firstly analyses the cause of misclassification from the view of information granularity,then gives a method for classification of overlapping classes based on the characteristic of human cognitive style.The new method transfers granularity space that describes train corpus to redrawing trian samples in order to increase the difference between train samples and get more prior knowledge.Then,based on the characteristic of Human beings' cognitive style,new method builds a hierarchical classifier on ...
Keywords:information granularity  text categorization  cognitive style  
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号