首页 | 本学科首页   官方微博 | 高级检索  
     检索      

一种基于后缀树的Web搜索结果聚类方法
引用本文:吴江宁,王治江.一种基于后缀树的Web搜索结果聚类方法[J].情报学报,2010,29(1).
作者姓名:吴江宁  王治江
作者单位:大连理工大学系统工程研究所,大连,116024
基金项目:国家自然科学基金资助项目 
摘    要:为同时满足Web搜索结果聚类的关联性、快速性以及类别描述的可浏览性等需求,本文提出了一种适合中文Web信息搜索结果的后缀树聚类算法,其中后缀树的构建以中文汉字为基本单位,一种有效的策略解决了基于二进制方法合并短语类后的类别描述问题,利用短语类语义层面的相似性合并同义短语类,有效地改善了聚类结果的质量.测试结果表明:与传统的文档聚类算法相比,基于后缀树的算法在Web文档聚类的精度和效率方面具有较强的优越性.

关 键 词:Web搜索  后缀树  文档聚类

A Clustering Method for Web Search Results Based on Suffix Tree
Wu Jiangning , Wang Zhijiang.A Clustering Method for Web Search Results Based on Suffix Tree[J].Journal of the China Society for Scientific andTechnical Information,2010,29(1).
Authors:Wu Jiangning  Wang Zhijiang
Institution:Institute of Systems Engineering/a>;Dalian University of Technology/a>;Dalian 116024
Abstract:
Keywords:Web search  suffix tree  document clustering  
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号