首页 | 本学科首页   官方微博 | 高级检索  
     

基于KNN与自动检索的迭代近邻法在自动分类中的应用
引用本文:杨建良,王永成. 基于KNN与自动检索的迭代近邻法在自动分类中的应用[J]. 情报学报, 2004, 23(2): 137-141
作者姓名:杨建良  王永成
作者单位:上海交通大学计算机系,上海,200030;上海交通大学计算机系,上海,200030
基金项目:国家自然科学基金资助项目 (6 0 0 82 0 0 3)
摘    要:本文研究了一种基于KNN与自动检索的自动分类算法———迭代近邻法 (IterativeKNN ,I KNN) ,用以解决KNN算法在小样本库的环境下分类效果不佳的问题。在无法得到足够的定类样本时 ,通过检索的方法将待分样本的局部主题特征放大 ,进而得到足够定类的相似样本。实验证明 ,迭代近邻法既增加了获取相似样本的几率 ,同时也有效地控制了样本相似度条件限制放宽后可能引入的分类噪声 ,在实际应用中能较好地提升自动分类系统的查全率和查准率。

关 键 词:KNN  自动分类  自动检索  迭代近邻法
修稿时间:2003-04-22

Application of Iterative-KNN Based on KNN and Automatic Retrieval in Automatic Categorization
Yang Jianliang and Wang Yongcheng. Application of Iterative-KNN Based on KNN and Automatic Retrieval in Automatic Categorization[J]. Journal of the China Society for Scientific andTechnical Information, 2004, 23(2): 137-141
Authors:Yang Jianliang and Wang Yongcheng
Abstract:In this paper, an approach called I KNN, based on KNN and automatic retrieval, is proposed in order to improve the performance of KNN algorithm with a small scale document database. If we cannot get enough similar documents in such condition, we magnify part of the document subjects to find more similar documents by Internet retrieval. It is proved by experiment that I KNN can improve the recall and precision of automatic categorization system.
Keywords:KNN   automatic categorization   automatic retrieval   iterative KNN.
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号