首页 | 本学科首页   官方微博 | 高级检索  
     

Web网页识别算法研究
引用本文:韩彬斌,王培康. Web网页识别算法研究[J]. 情报学报, 2001, 20(1): 77-81
作者姓名:韩彬斌  王培康
作者单位:中国科学技术大学电子工程与信息科学系,
摘    要:WWW上的文本信息挖掘工作是网络信息处理领域的新课题。本文研究了两种机器学习算法———Rocchio算法和Widrow Hoff算法在Web网页识别领域中的应用 ,并对几种网页识别算法进行了比较分析

关 键 词:特征提取  机器学习  WWW  网页识别
修稿时间:2000-05-23

Research on the Recognizing Algorithm of Web Pages
Han Binbin and Wang Peikang. Research on the Recognizing Algorithm of Web Pages[J]. Journal of the China Society for Scientific andTechnical Information, 2001, 20(1): 77-81
Authors:Han Binbin and Wang Peikang
Abstract:Text information mining on WWW is a new trend in networkinformation searching field. We apply two machine learning algorithms——Rocchio algorithm and Widrow-Hoff algorithm to recognize Web pages and compare them to some custom algorithms.
Keywords:character extraction   machine learning   World Wide Web   recognizing of Web pages.
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号