首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
DOM4J集成了DOM和SAX的XML文件解析器,在此基础上,DOM4J对文档对象模型DOM做了一些改进。与DOM相比,DOM4j提供了大量的接口用于对XML文件的处理,在使用上比DOM、SAX更加灵活,具有性能优异、功能强大等特点。本文对DOM4j的解析模型进行了介绍,详细分析了DOM4j各个接口之间的定义及继承关系,并给出了解析XML文件的时序图及关键代码。  相似文献   

2.
利用JDOM解析XML文档及其在数据转换上的应用*   总被引:5,自引:1,他引:5  
由于企业、组织、数字图书馆等之间现存的计算机平台,数据存储模型的不同,严重地阻碍了信息交流。为消除“信息孤岛”,本文试图结合Java的跨平台特性和XML信息交流的标准平台特性,利用JDOM实现从数据库抽取有效数据转换为XML文档保存,从而满足数据的多样性表示和异构数据库环境下数据交换的需求。  相似文献   

3.
XML及基于XML的广播式检索   总被引:3,自引:0,他引:3  
郭少友 《情报学报》2002,21(5):568-572
本文比较详细地介绍了XML的主要特点 ,并简要介绍了DTD和DOM技术 ,然后以对多个图书馆馆藏进行检索为例 ,初步探讨了利用XML技术进行广播式检索的基本思路。  相似文献   

4.
在分词技术、索引技术、结构化查询语言技术的基础上,提出了一个基于XML文档数据库的信息检索系统,这一系统模型主要由分词模块、索引模块及查询模块组成。  相似文献   

5.
随着Web的发展,XML文档的应用越来越广泛。目前针对XML文档的查询处理.已有的查询策略往往需要判断结点的祖先/后代关系,因而对结点要进行编码。但是目前的编码技术.有的在文档更新时需要重新对XML文档进行编码,有的支持XML文档更新但需要庞大的存储空间。本文提出了一种基于层次结构的编码方案,不仅可以在线性时间内判断两个结点的祖先/后代关系,并且可以优化存储。  相似文献   

6.
基于XML的PDF文档信息抽取系统的研究*   总被引:3,自引:0,他引:3  
首先设计了科技论文的DTD文档,然后分析了PDF文档的结构。在此基础上, 我们介绍了PDF文档信息抽取系统的设计框架。该框架以上述DTD为模板,把以PDF格式表示的科技论文解析转换为有效的XML文档。  相似文献   

7.
XML文档自动聚类研究   总被引:6,自引:4,他引:6  
潘有能 《情报学报》2006,25(2):215-220
本文在文本聚类的基础上对XML文档自动聚类进行了研究,对划分聚类法和层次聚类法进行了改进,使之适合于XML文档聚类;给出了元素比较法、边集比较法和编辑距离法等三种计算文档间相似度的方法,并利用实际数据进行了测试和分析。  相似文献   

8.
关系型数据库与XML文档相互映射模型的实现   总被引:7,自引:1,他引:6  
严海兵  卞福荃 《情报学报》2003,22(3):325-328
本文探讨了实现关系型数据库与XML文档的映射过程 ,使用XMLSchema文档定义数据类型 ,在保证XML树状节点模型固有特征以及关系型数据库中的关系和键值等特征的基础上 ,实现相互映射模型  相似文献   

9.
潘有能  丁楠 《情报学报》2007,26(3):350-355
本文首先介绍了XML文档和DTD标记树的生成方法,并对标记树中节点的概念进行了扩充,使之不但包括元素,同时也包括连接符,以适应DTD结构的要求。随后将标记树中的元素分为共有元素、文档元素和DTD元素,并提出层次权重和结构权重以衡量元素的层次和结构复杂程度,给出具体计算方法。在此基础上提出了一个衡量XML文档和DTD之间相似度的算法,将其应用于XML文档自动分类中,并给出该算法的时间复杂度计算公式。从实验结果可以看出,该分类方法准确率较高。  相似文献   

10.
方世敏 《图书馆学刊》2009,31(6):105-107
XML及其相关技术的简单、易用的特点,使其成为数据表示和数据交换的理想选择。笔者首先简要介绍了数据迁移以及XML的相关技术,然后着重介绍了基于XML的信息系统数据迁移的关键技术,包括XML数据模型的建立扣数据处理两部分。最后比较了该技术相对于传统数据迁移技术的优势并提出了改进建议。  相似文献   

11.
XML在虚拟图书馆中的应用及其处理技术   总被引:1,自引:0,他引:1  
分析XML在虚拟图书馆中的应用及其优势,并介绍两种XML文档的处理模式--SAX、DOM,提出将SAX、DOM结合起来使用是处理虚拟图书馆XML文档的理想选择.  相似文献   

12.
利用web文档的半结构化信息,提出一种基于DOM的web文本分割算法。该算法充分挖掘web网页中控制网页内容结构和显示的HTML标签信息,构建HTML DOM树。首先通过改进传统的平面文本分割方法,使之适用于web文本分割;然后利用DOM树中的节点平滑平面文本分割的结果,初步实验表明该算法能有效提高web文本分割的精确度。  相似文献   

13.
XML文档相似度计算方法研究   总被引:1,自引:0,他引:1  
XML(可扩展标记语言)正在成为Web上各种应用交换信息的标准.随着XML格式的半结构数据的大量出现,如何处理和管理XML文档已经成为了一个研究热点.XML文档的相似度计算是XML数据处理的重要课题,是XML文档聚类与检索的关键技术.XML文档由逻辑结构(structure)和文本内容(content)构成,可以根据结构特征或内容特征来度量XML文档之间的相似度.本文将XML文档的相似度计算方法分为基于结构的和结构与内容相结合的两类,并对各种已有的XML文档相似度计算方法进行了比较和述评.  相似文献   

14.
提出了Web页面信息的自动抽取思想,并使用WebBrowser和DOM技术实现了Web页面上网页元素查找、表单自动填写、表单自动提交、自动获得查询结果并自动抽取所需信息的技术,从而实现了Web页面信息的自动抽取。文中还给出了这一方法的实现细节和示例代码。  相似文献   

15.
新一代可扩展置标语言XML具有面向文档、面向数据和面向语义的功能,能够很好地保证文档一体化过程所产生的电子文件的凭证价值,因此,XML已经成为文档一体化过程中不可或缺的工具.本文从多层次、多角度对文档一体化领域中XML的研究现状进行了统计,并对统计的结果进行了阐述.  相似文献   

16.
张丕生 《大观周刊》2012,(28):246-246
1、引言 由于素数分布散乱,规律难寻,长期以来人们都在苦苦寻求.希望能找到一个可通过实际计算得到素数的公式或定理,由它直接推导出一个又一个的素数。本人在研究不定方程的基础上.  相似文献   

17.
基于XML的MARC研究   总被引:4,自引:1,他引:3  
本文分析了机读目录MARC在未来数字化图书馆应用的局限性,并提出了改进方案,以哈尔滨工业大学为例,对其采用的中文机读目录CNMARC格式进行了XML转换的尝试,从而使得MARC书目数据库和Internet上的非书目数据库的集成成为可能.本文的研究对于现有MARC数据在未来数字图书馆中的利用具有重要意义.  相似文献   

18.
研究将XML文本检索方法应用于长文本环境,并以中文博硕士论文为数据集。对博硕士论文数据集的XML标引、索引、关键词检索和结构化检索分别进行设计和实现,构建一个基于XML的中文博硕士论文检索系统。  相似文献   

19.
基于XML的分布式信息检索   总被引:1,自引:0,他引:1  
提出了一种对互联网信息进行分布式信息检索的方法:利用代理程序和XML技术向多个相同类型的网站同时发送检索请求文档并接收它们返回的检索结果文档,经过统一处理后将检索结果显示给读者  相似文献   

20.
XML及其相关技术已成为解决跨平台电子公文交换问题的主要手段。本文介绍了XML技术的基本概念、特点及其在电子公文流程中的作用,并结合实例介绍了XML在电子公文交换中的具体应用。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号