基于特征向量的中文文档比较方法 |
| |
引用本文: | 王琳,刘进忙,王永鑫,李岱峰.基于特征向量的中文文档比较方法[J].情报杂志,2005,24(11):46-47. |
| |
作者姓名: | 王琳 刘进忙 王永鑫 李岱峰 |
| |
作者单位: | [1]空军工程大学导弹学院,三原713108 [2]西安交通大学,西安710049 |
| |
摘 要: | 提出的以段落为单位的特征向量比较法,突破了以往以信息熵向量夹角法为基础的相似度比较技术的局限性。实验分析,本方法具有较好的实用价值和较高的可靠性,广泛适用于报刊杂志、项目审批、论文评阅等急需高效率文本比较技术的领域。
|
关 键 词: | 数据挖掘 文本比较 特征向量 相似度 |
本文献已被 CNKI 维普 万方数据 等数据库收录! |
|