首页 | 本学科首页   官方微博 | 高级检索  
     检索      

全自动生成网页信息抽取包装器的主要技术方法研究
引用本文:李广建,乔建忠.全自动生成网页信息抽取包装器的主要技术方法研究[J].情报理论与实践,2010,33(1).
作者姓名:李广建  乔建忠
作者单位:1. 北京大学,信息管理系,北京,100871
2. 中国科学院,国家科学图书馆,北京,100190;中国科学院,研究生院,北京,100049;解放军艺术学院,教育技术中心,北京,100081
摘    要:网页信息抽取包装器的生成方法很多,按自动化程度可分为手工、半自动和全自动三类,本文旨在研究全自动生成网页信息抽取包装器的主要技术方法,首先构建了对应的分类体系;其次对近年来主流的15种包装器生成技术进行了定性分析和分类比较;最后提出5点发展趋势。

关 键 词:信息抽取  包装器  信息技术  深层网  

Research on the Major Technologies of Fully Automatic Wrapper Generation for Web Information Extraction
Li Guangjian et al..Research on the Major Technologies of Fully Automatic Wrapper Generation for Web Information Extraction[J].Information Studies:Theory & Application,2010,33(1).
Authors:Li Guangjian
Institution:Li Guangjian et al.
Abstract:There are many wrapper generation methods for Web information extraction. According to the automation degree,they can be divided into 3 categories:manual,semi-automatic and fully automatic. This paper aims to study the main technologies of fully automatic wrapper generation for Web information extraction. Firstly,a corresponding classification system is constructed. Secondly,15 major fully automatic wrapper generation technologies in recent years are analyzed qualitatively and compared according to classifi...
Keywords:information extraction  wrapper  information technology  deep Web  
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号