数字图书馆中基于向量空间模型的文档分类系统 |
| |
引用本文: | 成奋华,吴家强.数字图书馆中基于向量空间模型的文档分类系统[J].上海高校图书情报工作研究,2004,14(2):27-31. |
| |
作者姓名: | 成奋华 吴家强 |
| |
作者单位: | 长沙民政学院电子信息工程系,长沙410004 |
| |
摘 要: | 介绍一个建立在向量空间模型上的文档分类系统。该系统着重解决向量维数压缩和中文专有词汇获取等问题。在特征项的选取上,我们并不采用文档中出现的全部词汇,而是利用语料库统计信息生成的关键词汇。实验结果表明,较之以采用全体词汇作为特征项进行分类的方法,本方法能有效地进行向量维数压缩,同时也提高了分类准确率。
|
关 键 词: | 数字图书馆 向量空间模型 文档分类系统 关键词 信息检索 向量维数压缩 |
本文献已被 维普 等数据库收录! |
|