基于特征族群语义扩散核的半监督农业文本分类 |
| |
作者单位: | ;1.赣南师范大学数学与计算机科学学院 |
| |
摘 要: | 农业文本分类旨在对主流的农业信息网抽取的文本数据集进行分类.在样本充足的情形下,经典的支持向量机方法能取得较好的效果,然而在样本较少或者样本矩阵很稀疏的情形下效果较差.提出了一种基于特征族群语义扩散核(它是语义扩散核的一种)和支持向量机的半监督农业文本分类方法.该方法在经典的支持向量机方法基础上结合特征族群语义扩散核,使得农业文本分类准确率得到一个显著的提升,在训练集样本数量只有原来一半的数量情况下预测原来的测试样本,预测准确率几乎与原来的相同.
|
关 键 词: | 文本分类 支持向量机 语义扩散核 半监督学习 农业文本 |
Semi-supervised Agricultural Text Classification Based on Feature Cluster Semantic Diffusion Kernel |
| |
Abstract: | |
| |
Keywords: | |
|
|