首页 | 本学科首页   官方微博 | 高级检索  
     检索      

网页去重技术
引用本文:殷波.网页去重技术[J].现代图书情报技术,2008(Z1).
作者姓名:殷波
作者单位:桂林电子科技大学大学计算机学院,桂林,541004
摘    要:以去除冗余网页为目标,分析搜索引擎工作原理,讨论现有的去重算法,并提出基于Suffix Tree的倒排索引改进算法.实验表明该算法有着优秀的判断文档相似度的特性.最后对现有去重算法进行分析总结并提出网页去重新思路,以便进行下一步研究.

关 键 词:数据挖掘  搜索引擎  网页去重

Technology of Cleaning out Redundant Web Pages
Yin Bo.Technology of Cleaning out Redundant Web Pages[J].New Technology of Library and Information Service,2008(Z1).
Authors:Yin Bo
Abstract:
Keywords:
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号