基于DOM的数字图书馆Web资源信息提取服务模型之研究 |
| |
引用本文: | 刘平兰. 基于DOM的数字图书馆Web资源信息提取服务模型之研究[J]. 情报杂志, 2002, 21(11): 37-38 |
| |
作者姓名: | 刘平兰 |
| |
作者单位: | 中南林学院,长沙,410004 |
| |
摘 要: | 针对万维网上用于表达Web页面信息的HTML语言存在的缺点,提出了一种基于DOM的数字图书馆Web资源信息提取服务模型,即以文档对象模型DOM为基础,把所要提取的信息在DOM层次结构中的路径作为信息提取的“坐标”,设计了一种归纳学习算法来半自动地生成提取规则,然后根据提取规则生成Java类,生成的Java类可以作为Web包装器软件的重要组成部分。此模型是研究异型数据源系统中组合查询处理的重要组成部分。
|
关 键 词: | DOM 信息提取 XML 提取规则 数字图书馆 Web资源 |
DOM based Digital Library Servings for Information Extraction on the Web |
| |
Abstract: | |
| |
Keywords: | DOM XML |
本文献已被 CNKI 维普 万方数据 等数据库收录! |