首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 171 毫秒
1.
近年来XML凭借其自身的简单性、半结构化、可扩展性、自描述性等特点,逐渐成为了互联网数据表示和数据交换的标准.XML文档聚类是数据挖掘研究中热点一个,为网络信息资源的搜集、组织及检索利用提供良好的技术支持.本文首先介绍了目前主要的XML文档聚类算法,然后在利用WordNet对XML文档中的标记进行语义消歧的基础上,提出了一种新的基于语义标记树的XML文档相似度计算方法,并通过最近邻算法进行聚类,最后在用于XML检索研究的数据集上进行实验,证实其确实是一种比较有效的XML文档聚类方法.  相似文献   

2.
本文阐述了XML、RDF及Ontology等信息资源组织与检索的核心技术及其对于数字信息资源组织与检索的重要意义,指出XML是语义层面上通用的信息传输标准,是数字信息资源共享的基石;RDF提供了一个支持XML数据信息资源交换的结构,是数字信息资源描述和交换的基础;Ontology是数字信息资源检索与知识共享的基础。参考文献8。  相似文献   

3.
XML及其在图书馆和情报检索中的应用   总被引:40,自引:4,他引:36  
与HTML 和SGML 相比, XML 更适合运用于Web 环境, 用以表达信息的语义和结构。XML 将对Web 产生重大影响, 并影响图书馆参与Web 信息资源组织和整理的方式。对HTML﹑SGML 和XML 进行了比较, 阐述了XML 影响图书馆的诸多因素, 并对用于检索XML 文档的情报检索技术和XML 对情报检索的帮助进行探讨。  相似文献   

4.
语义网信息组织机制论纲   总被引:4,自引:1,他引:3  
语义网是设想中的下一代万维网,对语义网的研究将推动网络信息资源的组织,使网络信息组织向知识组织发展。 Ontology是语义网的语义基础,是网络时代理想的检索语言。Ontology与XML、RDF(s)共同构成了语义网的信息组织机制,对此机制展开逻辑分析具有重要意义。  相似文献   

5.
王知津  赵洪 《图书馆杂志》2007,26(11):20-26
传统的关键词检索技术在文本检索和HTML文档检索上得到了广泛的应用,但它运用于检索XML文档时却不尽如意.为此,本文引入一种改进的遗传算法,对XML文档上的关键词检索进行了研究,提出了XML文档标记的自适应遗传训练算法与XML文档上关键词语义检索及结果排序算法.  相似文献   

6.
我国目前对网上异构档案数据库信息共享和开发利用仍处于低水平实践,其质量和效率有待进一步提高。实现异构档案信息整合与检索涉及诸多方法和技术上的困难,首先研究基于语义的档案信息整合、基于XML EAD的异构档案信息组织及其本体方法的应用,然后研究档案信息检索的平台异构性和语义异构性,语义异构性包括字段映射、数据去重、缩略词统一等,分别给出解决方案。结论是提高了档案信息资源共享与利用的质量,能够促进我国相关标准的制定与完善。  相似文献   

7.
在电子文件管理元数据中,主题元素存在着3种语义结构:无级次语义结构,有级次语义结构,多级次语义结构。由此也就形成3种不同的XML语法结构。基于XML电子文件管理元数据的主题元素的语义结构设计,不能忽视XML检索功能的需求分析。表8。参考文献5。  相似文献   

8.
本文介绍了语义Web的三大关键技术:XML、RDF和Ontology,并建立起以Ontology组织知识和基于语义的检索模型系统。  相似文献   

9.
基于本体的语义检索是它从语义理解的角度分析信息对象与检索请求,通过语义信息这个桥梁来实现二者的匹配,满足用户的信息需求。文章从语义三棱出发提出了语义信息链的概念,并详细阐述了语义信息链中的语义检索环节是如何体现语义信息来实现语义层次上的检索。  相似文献   

10.
语义检索技术研究   总被引:4,自引:0,他引:4  
史田华 《图书馆杂志》2001,20(11):13-16
本文论述了语义检索的基本概念及实现语义检索的基本条件-信息交互空间和概念空间等相关内容,为数字化信息资源的利用提供了保证。  相似文献   

11.
从信息检索流程对XML检索的研究情况进行综述。主要对XML查询语言、XML索引、XML检索排序方法以及XML检索评价4个方面的研究情况进行评述,并对XML检索研究的一些热点领域进行介绍,最后就需要继续深入研究的问题进行简要说明。  相似文献   

12.
元素级XML检索模型构建的关键问题与解决方案研究   总被引:2,自引:1,他引:2       下载免费PDF全文
与传统信息检索不同的是XML要实现元素级的检索,其核心是元素级检索模型的构建。而XML文档内上下文元素的相关性、元素之间信息的重复性以及元素大小的不一性等则是构建模型时面临的核心问题。解决办法是:构建基于BM25元素级XML检索模型,构建基于上下文的元素级XML检索模型BM25E,过滤重复元素,进行可检索元素的选择和太小元素的处理。表1。图1。参考文献19。  相似文献   

13.
XML检索系统及其比较研究*   总被引:2,自引:0,他引:2  
探讨XML检索与传统信息检索的区别、XML检索的目标与任务以及XML检索系统研究的核心问题,并对现有的几个XML检索系统进行介绍和比较研究。  相似文献   

14.
指出传统信息检索技术对XML文档的处理,没有考虑其结构信息,描述粒度不够细致,故不能充分挖掘XML文档的表达能力;认为采用元素索引、属性索引和结构索引来记录XML文档的结构信息,可在细粒度上记载XML文档的结构,从而深层次地挖掘XML文档的表达能力。  相似文献   

15.
XML信息检索探究   总被引:4,自引:0,他引:4  
廖述梅  万常选  徐升华 《情报学报》2007,381(2):229-234
XML文档是具有层次结构和文本内容的半结构化数据。现有的Web信息检索是基于HTML文档的关键词全文检索,无法胜任XML元素粒度的检索;同时,XML数据库检索实现的是精确查找,检索结果无排序支持。因此,融合信息检索和数据库技术研究XML检索问题成为必然。本文从XML检索的问题域出发,阐述了XML信息检索(XML IR)的国内外研究现状与特点,并分析了目前XML IR的热点和难点问题。  相似文献   

16.
研究将XML文本检索方法应用于长文本环境,并以中文博硕士论文为数据集。对博硕士论文数据集的XML标引、索引、关键词检索和结构化检索分别进行设计和实现,构建一个基于XML的中文博硕士论文检索系统。  相似文献   

17.
XML 语言在数字化图书馆系统中的应用   总被引:2,自引:0,他引:2  
介绍了如何在数字化图书馆系统中运用XML语言的方法。并且说明了XML语言的特性及它与HTML语言的区别。利用韩国虚拟图书馆和信息系统(VINIS)中的一个子系统——基于XML语言的元数据搜索的实验系统来演示XML用法。元数据检索系统包括两个模块:搜索模块和浏览模块。搜索模块允许对储存在Access文件中的元数据进行搜索并且可以用XML语言的形式显示搜索结果,浏览模块允许浏览以XMUXSL文件形式存在的元数据。文章最后讨论了如何在数字化图书馆中更有效的运用XML语言。  相似文献   

18.
This special issue contains articles describing XML retrieval approaches developed and evaluated during the second year of INEX, the evaluation initiative for XML retrieval.  相似文献   

19.
This paper investigates the impact of three approaches to XML retrieval: using Zettair, a full-text information retrieval system; using eXist, a native XML database; and using a hybrid system that takes full article answers from Zettair and uses eXist to extract elements from those articles. For the content-only topics, we undertake a preliminary analysis of the INEX 2003 relevance assessments in order to identify the types of highly relevant document components. Further analysis identifies two complementary sub-cases of relevance assessments (General and Specific) and two categories of topics (Broad and Narrow). We develop a novel retrieval module that for a content-only topic utilises the information from the resulting answer list of a native XML database and dynamically determines the preferable units of retrieval, which we call Coherent Retrieval Elements. The results of our experiments show that—when each of the three systems is evaluated against different retrieval scenarios (such as different cases of relevance assessments, different topic categories and different choices of evaluation metrics)—the XML retrieval systems exhibit varying behaviour and the best performance can be reached for different values of the retrieval parameters. In the case of INEX 2003 relevance assessments for the content-only topics, our newly developed hybrid XML retrieval system is substantially more effective than either Zettair or eXist, and yields a robust and a very effective XML retrieval.  相似文献   

20.
研究利用XML文本片段和图像的内容特征(颜色)实现图像的检索。基于XML多媒体数字图书馆检索系统平台WHU-XML,对XML文本和图像构建索引,并在此基础上,采用线性归并法,实现基于XML文本片段的图像检索和基于图像内容特征(颜色)检索的结合。研究结果表明,当文本检索权重大于图像内容检索的权重时,检索效果比只采用单一检索方式时好。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号