基于混合策略的中文查询串相似度计算 |
| |
引用本文: | 章成敏 鞠海燕. 基于混合策略的中文查询串相似度计算[J]. 情报杂志, 2005, 24(11): 101-103,105 |
| |
作者姓名: | 章成敏 鞠海燕 |
| |
作者单位: | [1]中国药科大学图书馆,南京210009 [2]南京农业大学工学院,南京210031 |
| |
摘 要: | 综合考虑查询串所包含关键词的词形、语义、语用三个层面的信息计算查询串相似度的计算方法。首先利用字面相似度算法计算查询串在词形上的相似度,然后利用义类词典进行关键词在语义层面上的匹配,得到查询串在语义层面上的相似度,接着以搜索引擎作为语料库来源,将查询串提交给搜索引擎,通过对返回结果中重叠部分的统计分析,计算查询串在语用上的相似度,最后综合这三个相似度,完成相似度的计算。实验结果表明该算法的有效性。
|
关 键 词: | 查询串相似度 语义相似度 字面相似度 语用相似度 查询 混合策略 中文 搜索引擎 语义层 计算方法 |
Hybrid Strategy- Based Similarity Measure of Chinese Query |
| |
Abstract: | |
| |
Keywords: | |
本文献已被 CNKI 维普 万方数据 等数据库收录! |