共查询到20条相似文献,搜索用时 171 毫秒
1.
孙辉 《现代图书情报技术》2004,20(9):58-60
基于RDBMS的XML数据存储方法有多种,本文认为它们大体上可分为两类。第一类方法是根据XML文档数据的物理结构设计关系模式,第二类方法是根据XML文档数据的逻辑结构设计关系模式,即根据XML的结构定义(DTD或XML Schema)来设计关系表,第一类方法还可分为基于边的存储和基于结点的存储。本文将结合XML文档实例对上述方法进行分析和探讨。 相似文献
2.
3.
图像对象特征值的抽取、存储、转换、显现的实现有多种方法,SIMIIRS系统主要采用了数据库方法和XML方法。文章主要讨论了图像资源的XML描述方法、建立图像信息的XML索引文档,检索XML文档以实现图像信息查询与提供。 相似文献
4.
5.
XML文档相似度计算方法研究 总被引:1,自引:0,他引:1
XML(可扩展标记语言)正在成为Web上各种应用交换信息的标准.随着XML格式的半结构数据的大量出现,如何处理和管理XML文档已经成为了一个研究热点.XML文档的相似度计算是XML数据处理的重要课题,是XML文档聚类与检索的关键技术.XML文档由逻辑结构(structure)和文本内容(content)构成,可以根据结构特征或内容特征来度量XML文档之间的相似度.本文将XML文档的相似度计算方法分为基于结构的和结构与内容相结合的两类,并对各种已有的XML文档相似度计算方法进行了比较和述评. 相似文献
6.
基于用户相关反馈的带结构语义的XML查询词扩展 总被引:1,自引:0,他引:1
在XML文档的信息检索中,检索质量不高的一个主要原因是用户难以提出准确描述其查询意图的查询表达式,而查询扩展技术被认为是可以帮助用户构建符合其查询意图的查询表达式.本文在XML信息检索中提出了基于用户相关反馈的查询扩展技术,在查询扩展中除了考虑词频因素外还充分考虑了XML文档的结构特点对于扩展查询词选取的影响,包括文档中元素的语义权重、元素所在层次和词项与初始查询词间的距离因素对于扩展查询词选取的影响.实验证明本方法是可行的,且能较好地提高检索结果的准确率. 相似文献
7.
张健 《现代图书情报技术》2005,21(4):83-85
作为Internet网络的标准之一,XML文档通常用于文本数据的描述、存储和交换。本文讨论了用XML文档存储图片的技术方案,包括XML文档结构、图片存储、在线提交、下载和显示,描述了各个功能步骤的技术要点,并给出了基于ASP.NET的程序代码。本文探讨的基于纯XML文档和ASP.NET的图片管理技术具有无数据库驱动、易于实现等特点。 相似文献
8.
传统的关键词检索技术在文本检索和HTML文档检索上得到了广泛的应用,但它运用于检索XML文档时却不尽如意.为此,本文引入一种改进的遗传算法,对XML文档上的关键词检索进行了研究,提出了XML文档标记的自适应遗传训练算法与XML文档上关键词语义检索及结果排序算法. 相似文献
9.
基于XML的词典信息组织技术 总被引:3,自引:0,他引:3
如何有效地组织词典信息,是词典数字化出版首要关注的问题。本文针对词典信息的特点,引入基于XML的文档组织技术,并探讨该XML数据库的存储方式和索引机制,设计一种存储XML文档的中粒度的关系数据库模式。 相似文献
10.
11.
基于OKAPI的XML信息检索实现研究 总被引:3,自引:1,他引:3
OKAPI能实现强大的自由文本检索与评价功能,但要实现基于XML的信息检索,却要做适当改造。改造时,一方面尽量不破坏原有系统的体系结构,又要能实现对XML文档的索引、查询和表示。为此,必须完成面向XML的文档预处理和索引、面向XML的文档检索及检索模型的选择。图3。公式3。参考文献10。 相似文献
12.
本文围绕PDF文档转化为XML和数字图书重组等数字图书跨终端出版的关键技术,详细描述了一套跨终端数字图书出版的设计方案.文章首先分析了PDF文档的结构,再在此基础上对PDF进行版面分析和文本内容提取,形成描述文件结构和内容的XML文档,最终实现基于XML文档的跨终端出版设计. 相似文献
13.
XML文档和数据库的集成 总被引:1,自引:0,他引:1
本文首先阐述了需要把XML文档和数据库集成的原因;然后针对描述MBAR书目记录的XML文档,详细说明了把XML文档与数据库集成的办法;最后指出了转换过程中可能出现的一些问题。 相似文献
14.
关系型数据库与XML文档相互映射模型的实现 总被引:7,自引:1,他引:6
本文探讨了实现关系型数据库与XML文档的映射过程 ,使用XMLSchema文档定义数据类型 ,在保证XML树状节点模型固有特征以及关系型数据库中的关系和键值等特征的基础上 ,实现相互映射模型 相似文献
15.
XML文档的约束及其应用探讨 总被引:1,自引:0,他引:1
张健 《现代图书情报技术》2005,21(5):23-26
在XML文档中应用约束机制,可以保证其数据的规范性、一致性和有效性。文章讨论了两类XML约束,一类是基于XML模式语言XSD或文档类型定义DTD的基本约束,另一类是自定义约束——XML函数依赖,描述了这两类约束及约束验证方式。在探讨XML约束机制的同时,结合图书馆具体业务,给出并分析了几个XML约束和XML文档的实例。 相似文献
16.
本文首先介绍了XML文档和DTD标记树的生成方法,并对标记树中节点的概念进行了扩充,使之不但包括元素,同时也包括连接符,以适应DTD结构的要求。随后将标记树中的元素分为共有元素、文档元素和DTD元素,并提出层次权重和结构权重以衡量元素的层次和结构复杂程度,给出具体计算方法。在此基础上提出了一个衡量XML文档和DTD之间相似度的算法,将其应用于XML文档自动分类中,并给出该算法的时间复杂度计算公式。从实验结果可以看出,该分类方法准确率较高。 相似文献
17.
基于XML的PDF文档信息抽取系统的研究* 总被引:3,自引:0,他引:3
首先设计了科技论文的DTD文档,然后分析了PDF文档的结构。在此基础上, 我们介绍了PDF文档信息抽取系统的设计框架。该框架以上述DTD为模板,把以PDF格式表示的科技论文解析转换为有效的XML文档。 相似文献
18.
用JAVA+XML实现网站全文检索 总被引:2,自引:0,他引:2
介绍了用JAVA和XML实现网站站内全文检索的实现过程,即用java编写索引工具,对WEB文档进行索引,索引结果写入XML文档;用Servlet和JDOM实现读取和查询XML文档,并在客户返回查询结果。 相似文献
19.
基于XML的Web日志挖掘研究* 总被引:2,自引:0,他引:2
潘有能 《现代图书情报技术》2006,1(5):62-64
设计一个基于XML的Web日志挖掘体系结构,简要介绍XGMML和LOGML,并在此基础上讨论LOGML文档的生成方法及利用Apriori算法对日志文档进行频繁集、频繁序列和频繁子图挖掘。 相似文献