首页 | 本学科首页   官方微博 | 高级检索  
     检索      

Ajax站点数据采集研究综述*
引用本文:夏天.Ajax站点数据采集研究综述*[J].现代图书情报技术,2010,26(3):52-57.
作者姓名:夏天
作者单位:(中国人民大学信息资源管理学院   北京 100872)
基金项目:*本文系国家社会科学基金项目“Web2.0环境下的网络舆情采集与分析”(项目编号:09CTQ027)和中国人民大学科学研究基金项目“Web2.0网站的数据采集研究”(项目编号:22382078)的研究成果之一。
摘    要:从Ajax链接元素的识别、页面状态标识、页面状态可控性转换、页面状态内容动态获取和状态重复检测5个方面介绍Ajax数据采集所取得的最新研究进展,总结系统的整体处理流程和支撑技术,探讨新的发展趋势,推动Ajax数据采集问题展开更为深入的研究。

关 键 词:数据采集  Ajax网络爬虫  HTML渲染器  Web2.0
收稿时间:2010-03-06
修稿时间:2010-03-10

Overview of Research on Data Collection from Ajax Sites
Xia Tian.Overview of Research on Data Collection from Ajax Sites[J].New Technology of Library and Information Service,2010,26(3):52-57.
Authors:Xia Tian
Institution:(School of Information Resource Management, Renmin University of China, Beijing 100872, China)
Abstract:This paper introduces the recent advances achieved from five aspects, which include Ajax link elements judgment, page state identification, page state controllable transformation, content extraction and duplicated states detection. The overall processing flow and the relevant supporting technologies are summarized, and the new research trends are discussed. This study will be helpful to promote the further research on Ajax data collection issues.
Keywords:
点击此处可从《现代图书情报技术》浏览原始摘要信息
点击此处可从《现代图书情报技术》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号