首页 | 本学科首页   官方微博 | 高级检索  
     

基于SVM的重复网页检测算法
作者姓名:冯金波
作者单位:江苏大学 计算机科学与通信工程学院,江苏 镇江 212013
摘    要:互联网中存在大量重复网页,降低了用户体验并使搜索变得复杂化。为解决这些问题,把相似网页的比较转换成二元分类问题,使用监督学习算法构造判别函数,避免人为设定相似度阈值所带来的误差;通过SVM训练出的判别函数检测网页对,以此检测网页是否重复。

关 键 词:SVM  重复网页  支持向量机  编辑距离  最长公共子串  
本文献已被 CNKI 万方数据 等数据库收录!
点击此处可从《教育技术导刊》浏览原始摘要信息
点击此处可从《教育技术导刊》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号