首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于数据库分类的deep web爬行器研究
引用本文:郭少友,赵善义,李建平,王斌.基于数据库分类的deep web爬行器研究[J].情报科学,2011(10).
作者姓名:郭少友  赵善义  李建平  王斌
作者单位:郑州大学信息管理系;郑州大学教育技术中心;郑州大学社科办;解放军信息工程大学信息工程学院;
基金项目:河南省重大科技攻关项目(102101210100)
摘    要:在现有相关研究的基础上,设计一种基于数据库分类的deep web爬行器。该爬行器首先从抓取的网页中识别出deep web数据库的入口表单,然后采用查询探测方法对数据库进行自动分类,并根据分类结果来选取一组合适的关键词作为查询词,自动填写入口表单中的文本框并向数据库提出查询请求。实验结果表明,基于数据库分类的deep web爬行器的爬行效果要优于基于指定查询词的deep web爬行器的爬行效果。

关 键 词:数据库分类  deep  web  爬行器  表单  查询探测  

Research on Deep Web Crawler Based on Database Classification
GUO Shao-you,ZHAO Shan-yi,LI Jian-ping,WANG Bin.Research on Deep Web Crawler Based on Database Classification[J].Information Science,2011(10).
Authors:GUO Shao-you  ZHAO Shan-yi  LI Jian-ping  WANG Bin
Institution:GUO Shao-you1,ZHAO Shan-yi2,LI Jian-ping3,WANG Bin4(1.Department of Information Management,Zhengzhou University,Zhengzhou 450001,China,2.Educational Technology Center,3.Social Science Research Management Office,4.Institute of Information Engineering,Information Engineering University,Zhengzhou 450002,China)
Abstract:On the basis of related work,this paper designs a deep web crawler based on database classification.First,it identifies the entry forms of deep web databases from downloaded pages,and then classifies deep web databases with query probing.According to the classification results,some proper keywords are selected as query terms,and automatically filled in the text boxes of these forms to query deep web databases.The experimental results show that the crawling effect of the crawler based on database classificat...
Keywords:database classification  deep web  crawler  form  query probing  
本文献已被 CNKI 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号