首页 | 本学科首页   官方微博 | 高级检索  
     

基于用户查询关键词的网页去重方法研究
引用本文:谢蕙,秦杰,胡双双. 基于用户查询关键词的网页去重方法研究[J]. 现代图书情报技术, 2008, 3(7): 43-46
作者姓名:谢蕙  秦杰  胡双双
作者单位:河南工业大学信息科学与工程学院,郑州,450001
摘    要:在研究传统的基于特征码去重算法的基础上,针对元搜索引擎中网页重复现象,提出一种基于用户查询关键词的网页去重方法,提高元搜索引擎检索质量,并且介绍算法的实现过程,通过实验验证算法的有效性。

关 键 词:网页去重  元搜索  特征码  中文分词
收稿时间:2008-03-27
修稿时间:2008-04-30

The Study on the Duplicated Web Pages Detection Algorithm Based on the Keyword from User's Submission
Xie Hui,Qin Jie,Hu Shuangshuang. The Study on the Duplicated Web Pages Detection Algorithm Based on the Keyword from User's Submission[J]. New Technology of Library and Information Service, 2008, 3(7): 43-46
Authors:Xie Hui  Qin Jie  Hu Shuangshuang
Affiliation:(College of Information Science and Engineering,Henan University of Technology,Zhengzhou  450001,China)
Abstract:Based on the study of the duplicated Web pages detection algorithm with feature code, the paper proposes a duplicated detection algorithm based on the keyword from user’s submission for meta search engine. The main steps of algorithm are introduced. And this algorithm is tested and verified its validity in an experiment.
Keywords:Duplicate detection  Meta search  Feature code  Chinese word segmentation
本文献已被 万方数据 等数据库收录!
点击此处可从《现代图书情报技术》浏览原始摘要信息
点击此处可从《现代图书情报技术》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号