首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于特征权重优化的改进KNN Web文本分类算法
引用本文:王煜,白石,王正欧.基于特征权重优化的改进KNN Web文本分类算法[J].情报学报,2007,26(5):643-647.
作者姓名:王煜  白石  王正欧
作者单位:1. 河北大学数学与计算机学院,保定,071002;天津大学系统工程研究所,天津,300072
2. 沧州市城建档案馆,沧州,061000
3. 天津大学系统工程研究所,天津,300072
摘    要:本文提出了一种基于权重优化的样本相似度测量的距离公式,改进了KNN文本分类算法.KNN算法通常采用传统的VSM模型,各个特征具有相同的权重,使其不适应于文本处理的环境.本文首先根据神经网络理论,采用灵敏度方法对文本特征向量的每个特征的权重进行修正,并且采用降低运算量的神经网络特征选择方法进行第二次降维处理.然后根据同一特征对不同类别的文本类的分类作用不同,对距离公式中的特征权重进行进一步改进,从而进一步提高了KNN文本分类算法的精度.

关 键 词:文本分类  神经网络  KNN算法
修稿时间:2006年6月20日

An Improved KNN Algorithm Applied to Web Text Categorization Based on Weight Optimization
Wang Yu,Bai Shi,Wang Zheng'ou.An Improved KNN Algorithm Applied to Web Text Categorization Based on Weight Optimization[J].Journal of the China Society for Scientific andTechnical Information,2007,26(5):643-647.
Authors:Wang Yu  Bai Shi  Wang Zheng'ou
Abstract:
Keywords:
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号