首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 593 毫秒
1.
近年来XML凭借其自身的简单性、半结构化、可扩展性、自描述性等特点,逐渐成为了互联网数据表示和数据交换的标准.XML文档聚类是数据挖掘研究中热点一个,为网络信息资源的搜集、组织及检索利用提供良好的技术支持.本文首先介绍了目前主要的XML文档聚类算法,然后在利用WordNet对XML文档中的标记进行语义消歧的基础上,提出了一种新的基于语义标记树的XML文档相似度计算方法,并通过最近邻算法进行聚类,最后在用于XML检索研究的数据集上进行实验,证实其确实是一种比较有效的XML文档聚类方法.  相似文献   

2.
王知津  赵洪 《图书馆杂志》2007,26(11):20-26
传统的关键词检索技术在文本检索和HTML文档检索上得到了广泛的应用,但它运用于检索XML文档时却不尽如意.为此,本文引入一种改进的遗传算法,对XML文档上的关键词检索进行了研究,提出了XML文档标记的自适应遗传训练算法与XML文档上关键词语义检索及结果排序算法.  相似文献   

3.
要想有效地检索Web上的信息资源,网上信息的结构化编码已势在必行。由于迄今广泛使用的超文本标记语言(HTML)采用了固定标签(tag),没有包含内容和语义的结构,所以对此无能为力。标准通用标记语言(SGML)允许编写者建立自己的标记,解决了HTML采用固定标记的问题,但它的复杂性影响了其广泛使用。XML的问世及其逐步发展与完善,使人们看到了其用于因特网信息组织与检索的诱人前景。本文在分析XML的结构、体系、主要特点、功能的基础上,从文档能够用模式来分类,一些含糊不清的词汇可以用上下文来区分、检索提问可以使用丰富的数据类型、用结构上的临近代替物理上的临近来排列检索结果、将文献中的部分内容作为检索结构予以返回、超前的结构化提问等方面探讨了XML在信息检索领域的应用。  相似文献   

4.
XML(可扩展标记语言)正在成为Web数据交换的标准格式.随着XML格式的半结构数据的大量出现,如何处理和管理XML文档已经成为了一个研究热点.XML文档聚类作为XML数据处理的重要课题,是指将具有类似特征的XML文档聚集成簇.现有的大部分XML文档聚类是基于文档结构特征的.本文提出了一个新的结构与内容相结合的XML文档聚类方法.首先从文档中抽取构件向量,并把文档转换为向量化的表示.然后,在文档相似度计算的基础上,引入一个层次聚类方法对XML文档进行聚类.在DBLP XML记录集上进行的实验表明该方法具有可行性并且性能明显优于已有方法.  相似文献   

5.
XML文档相似度计算方法研究   总被引:1,自引:0,他引:1  
XML(可扩展标记语言)正在成为Web上各种应用交换信息的标准.随着XML格式的半结构数据的大量出现,如何处理和管理XML文档已经成为了一个研究热点.XML文档的相似度计算是XML数据处理的重要课题,是XML文档聚类与检索的关键技术.XML文档由逻辑结构(structure)和文本内容(content)构成,可以根据结构特征或内容特征来度量XML文档之间的相似度.本文将XML文档的相似度计算方法分为基于结构的和结构与内容相结合的两类,并对各种已有的XML文档相似度计算方法进行了比较和述评.  相似文献   

6.
介绍一种解释XML文档语义的方法。该方法使用RDF Schema描述的本体来对XML文档进行语义提取,并将结果以RDF数据模式(三元组)表现出来。  相似文献   

7.
本文介绍了XML(扩展型标记语言)的基本概念和其实现技术方法,通过实例说明了XML的结构化文档技术,类型定义方法。运用不同的XSL方式将XML中的数据用HTML格式表示出来,并在IE5.0下实际运行。文章对XML的应用前景作了讨论。  相似文献   

8.
文章介绍了可扩展标记语言XML,与HIML和SGML相比,XML更适合运用于Web环境,用以表达信息的语义和结构。XML将对Web产生重大影响,并影响图书馆参与Web信息资源组织和整理的方式。阐述了XML影响图书馆的诸多因素。  相似文献   

9.
本文分析了XML在电子文件管理中的面向文档———自定义“电子文件类型定义”的功能 ,面向数据———封装电子文件元数据的功能 ,面向语义———进行全文检索的功能 ,并总结了XML在电子文件管理中的对电子文件真实性、可靠性、凭证性、可理解性及可检索性具有语言 (因为XML本质上是一种语言 )上的保证作用  相似文献   

10.
新一代可扩展置标语言XML具有面向文档、面向数据和面向语义的功能,能够很好地保证文档一体化过程所产生的电子文件的凭证价值,因此,XML已经成为文档一体化过程中不可或缺的工具.本文从多层次、多角度对文档一体化领域中XML的研究现状进行了统计,并对统计的结果进行了阐述.  相似文献   

11.
XML搜索引擎研究   总被引:1,自引:0,他引:1  
首先分析传统搜索引擎查准率不高的原因,然后介绍XML以及XML搜索引擎研究现状,并对XML搜索引擎所涉及的文档存储、索引、查询等关键技术进行详尽探讨。在此基础上,设计现行网络环境下的XML搜索引擎模型。认为该模型可充分利用XML文档的DTD模式信息,并能大幅度提高查询的准确率。  相似文献   

12.
XML的技术特征及其对超文本导航的影响   总被引:8,自引:0,他引:8  
徐英  刘甲学  毕强 《情报学报》2002,21(4):437-440
XML是一种超文本标识语言 ,它源于SGML ,是SGML的一个子集。文章在分析XML与HTML技术对链接规定的差异性的基础上 ,探讨了XML对超文本导航的影响。  相似文献   

13.
刘凯  王永成  毛军 《情报学报》2005,24(3):294-298
本文提出了一种适合机器翻译的标记语言MTML(MachineTranslationMarkupLanguage)。针对机器翻译研究中对混合策略处理的需求,我们将传统的机器翻译方法与模式匹配及XML等技术相结合,形成了一套灵活的、可扩展的处理机制,方便了基于规则的翻译与数据驱动的翻译之间的交互。目前已经将该标记语言应用到翻译试验系统之中,获得了较好的效果  相似文献   

14.
新一代WEB技术层:XML   总被引:3,自引:0,他引:3  
黄晨 《图书馆杂志》2001,20(3):24-26
可扩展标记语言(XML)是万维网协会(W3C)定义的用于优化Web上的传输的SGML的子集,它是一种元标注语言,提供一种描述结构数据的格式,本文讨论使用XML作为数据的标准格式,Web发展的趋势是数据集成和管理,而只有利用XML才是解决这一问题的关键。  相似文献   

15.
16.
标记语言及HTML和XML的比较分析   总被引:14,自引:0,他引:14  
从介绍标记语言的发展历史入手, 对HTML 和XML 分别进行简述和比较分析。  相似文献   

17.
PREMIS XML模式设计研究   总被引:1,自引:0,他引:1  
论文重点针对国际保存元数据:应用策略(简称PBEMIS)数据字典(2.0版)的XML Schema进行研究,以为我国数字信息保存元数据标准制定、完善及其实践提供借鉴经验。在分析PREMIS XML Schema最新设计特点的基础上,归纳XML Schema设计应结合应用语义依赖性原则与需求牵引等原则的结论,从而才能保证其高度标准化,达到数字信息长期保存与科学管理的目的。  相似文献   

18.
基于XML技术的中国电子公文结构设计研究   总被引:1,自引:0,他引:1  
论文首先指出了研究中国电子公文结构设计的目的与意义,并明确了中国电子公文结构设计的基本概念与原理,还对XML置标语言技术进行了研究。在此基础上,分析得出了中国电子公文结构的设计步骤,进而确定了中国电子公文结构设计的具体实现需要构建中国电子公文的概念、语义与扩展语言描述,以及格式布局等四大逻辑结构模型。  相似文献   

19.
RSS made easy: a basic guide for librarians   总被引:1,自引:0,他引:1  
Really Simple Syndication (RSS) uses extensive markup language (XML) to constantly scan the content of Web sites for updates, which will then be delivered to subscribers' desktops or mobile devices through an RSS feed. RSS helps professionals stay current while reducing workloads. Librarians need to get familiar with RSS to educate their users, to stay current in information technology, and to generate and disseminate selected information to target user groups. doi:10.1300/J115v26n01_04.  相似文献   

20.
国外有人设计了一种新的实现Web Services的XML编程语言——XL。XL完全适应W3C的标准。其主要优点是让编程人员集中关注程序的应用逻辑。XL为Actions提供了在Web Services实现中执行的典型高层级开放结构,编程人员的效率、程序的进化能力等将有实质性的提高。本文介绍了XL的语法,并给出一个XL Web Service程序实例。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号