首页 | 本学科首页   官方微博 | 高级检索  
     检索      

网络信息数据采集的质量控制研究
引用本文:庞景安.网络信息数据采集的质量控制研究[J].情报理论与实践,2007,30(4):526-530.
作者姓名:庞景安
作者单位:中国科学技术信息研究所,北京,100038
摘    要:由于因特网和web都是开放、变化、非结构化、动态无序的海量信息资源组织,所以对于网络信息数据的采集和质量控制成为网络计量学领域集中研究的热点问题。本文针对网络信息数据采集的质量控制问题进行了比较全面的研究,内容涉及网络检索时段的统一测定,Web网页及Web网站的抽样设计,避免重复采集网页和优先搜集重要网页的方法,以及面向主题进行特定信息采集的技术等。

关 键 词:网络计量学  信息采集  质量控制  检索时段
修稿时间:2007-01-29

Researches on the Quality Control of Web Information Data Collection
Pang Jing'an.Researches on the Quality Control of Web Information Data Collection[J].Information Studies:Theory & Application,2007,30(4):526-530.
Authors:Pang Jing'an
Abstract:Owing to the fact that Internet and Web are open, dynamically-changing, non-structured and nonsequenced huge information resources organization, collection and quality control of Web information data have become the hotspot for study in Webometrics field. This article gives a comprehensive study of this problem. It involves with the unified measurement of Web search session, the sampling design of Web pages and Web sites, the methods that avoid repeated collection of Web pages and give priority to collect important Web pages, as well as the collecting technology for subject-oriented special information.
Keywords:Webometrics  information collection  quality control  search session
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号