首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
在分词技术、索引技术、结构化查询语言技术的基础上,提出了一个基于XML文档数据库的信息检索系统,这一系统模型主要由分词模块、索引模块及查询模块组成。  相似文献   

2.
潘有能  丁楠 《情报学报》2007,26(3):350-355
本文首先介绍了XML文档和DTD标记树的生成方法,并对标记树中节点的概念进行了扩充,使之不但包括元素,同时也包括连接符,以适应DTD结构的要求。随后将标记树中的元素分为共有元素、文档元素和DTD元素,并提出层次权重和结构权重以衡量元素的层次和结构复杂程度,给出具体计算方法。在此基础上提出了一个衡量XML文档和DTD之间相似度的算法,将其应用于XML文档自动分类中,并给出该算法的时间复杂度计算公式。从实验结果可以看出,该分类方法准确率较高。  相似文献   

3.
针对信息检索角度的XML的结构化检索问题,利用基于倒排文件的方法,使用NEXI作为检索语言,在基于XML的数字图书馆检索实验系统WHU-XML上对其进行实现,并具体分析查询语言的解析方法以及所采用的结构化检索算法。  相似文献   

4.
张宁  冷秀斌  梁帆 《档案学研究》2020,34(6):97-103
非结构化文档数据是企业文档数据的重要组成部分。但目前企业普遍缺乏对于非结构化文档数据的专门治理,极大阻碍了数据资产价值的实现。本文通过对案例企业的深度调研,提出由顶层设计、数据治理环境、数据治理域和数据治理过程四部分组成的企业非结构化文档数据治理的总体规划,并以分级分类为治理思路,从平台化、智能化和安全化三个方向入手提出实施高效非结构化文档数据治理的方法。  相似文献   

5.
基于文档结构的向量空间检索模型研究   总被引:9,自引:0,他引:9  
韩毅 《情报学报》2004,23(2):158-162
分析了传统向量空间检索模型在网络信息检索中的不足 ,给出了基于文档结构的向量空间检索模型。该模型将文档在逻辑上分成N段 ,依据特征项对文档内容代表能力的不同 ,选择有限的最能代表逻辑段内容的特征项构造文本逻辑段的特征项向量与权值向量 ,并以此为基础计算文档与提问的匹配相似度值 ,从而决定匹配文档的检出与排列顺序。进行了两种模型算法时间复杂度的比较分析 ,讨论了改进模型的可能应用前景和存在问题。  相似文献   

6.
XML文档相似度计算方法研究   总被引:1,自引:0,他引:1  
XML(可扩展标记语言)正在成为Web上各种应用交换信息的标准.随着XML格式的半结构数据的大量出现,如何处理和管理XML文档已经成为了一个研究热点.XML文档的相似度计算是XML数据处理的重要课题,是XML文档聚类与检索的关键技术.XML文档由逻辑结构(structure)和文本内容(content)构成,可以根据结构特征或内容特征来度量XML文档之间的相似度.本文将XML文档的相似度计算方法分为基于结构的和结构与内容相结合的两类,并对各种已有的XML文档相似度计算方法进行了比较和述评.  相似文献   

7.
区分文档过滤、信息过滤和文本过滤并介绍文档过滤技术的研究现状;提出基于Ontology的文档过滤的设想,认为其优势在于灵活、共享性好、有利于进行个性化服务等;讨论基于Ontology的文档过滤的实施过程,包括构建准备、本体构建、本体调用,重点阐述公共本体、用户本体和文档本体的构建方法以及实施过程中涉及的技术体系;最后指出今后的努力方向。  相似文献   

8.
新一代可扩展置标语言XML具有面向文档、面向数据和面向语义的功能,能够很好地保证文档一体化过程所产生的电子文件的凭证价值,因此,XML已经成为文档一体化过程中不可或缺的工具.本文从多层次、多角度对文档一体化领域中XML的研究现状进行了统计,并对统计的结果进行了阐述.  相似文献   

9.
企业文档资源不断丰富,对企业档案部门的工作提出了新的挑战,然而,目前的传统文档利用方式较为简单,文档中蕴含的知识资源无法给企业的发展带来实际效益.基于此,文章提出基于知识库的企业文档智能服务模式,通过知识库实现从文献传递到知识服务的转型,为企业档案部门进行知识服务提供帮助.具体步骤包括原始文件到知识单元的转化、知识单元关联形成知识图谱、知识图谱应用实现知识问答,以及最终不同形式的文档智能服务.  相似文献   

10.
基于Ontology的文档过滤研究   总被引:2,自引:0,他引:2  
区分文档过滤、信息过滤和文本过滤并介绍文档过滤技术的研究现状;提出基于Ontology的文档过滤的设想,认为其优势在于灵活、共享性好、有利于进行个性化服务等;讨论基于Ontology的文档过滤的实施过程,包括构建准备、本体构建、本体调用,重点阐述公共本体、用户本体和文档本体的构建方法以及实施过程中涉及的技术体系;最后指出今后的努力方向。  相似文献   

11.
12.
随着气象数据规模快速增长,气象预报和气候分析对数据服务时效性要求的提高,传统的气象数据存储和服务模式面临一定的挑战.本文提出了结合了hadoop技术的气象数据存储检索应用模式,并进行了实验和性能测试,以评估其实现效果.实现中针对代表性的结构化与非结构化气象业务数据,分别进行了测试,并提出优化方法.性能测试中对于自动站结构化数据的检索,大部分响应时间在毫秒级;对于大结果集的雷达基数据非结构化数据的检索响应时间也在秒级.本文认为基于hadoop的气象数据存储检索可作为应对海量气象数据增长带来的存储服务问题的有效解决途径之一.  相似文献   

13.
总结了文档搜索引擎发展过程中存在的两种主要解决方案,并分析这两种解决方案在检索功能上的差异,最后提出了文档搜索引擎的发展前景.  相似文献   

14.
15.
开放文档格式,简称ODF,是一种适合办公应用的标准化的基于XML的文件格式规范.它的出现,打破了封闭格式称霸办公软件市场的局面.本文通过介绍ODF,分析优点和不足及其所带来的影响,希望它能进一步为人们所认识和接受.  相似文献   

16.
17.
通过业务流程生命周期和文档生命周期(下称"双周期")交互的全程视角探究业务流程管理和文档管理交互关系的本质.首先从业务流程管理和文档管理两方面分析企业文档管理的现状并提出"双周期"交互的理念,明确"双周期"概念并阐述"双周期"交互的内涵.再次探讨"双周期"交互的实质,并从业务数据和文档信息的层面将"双周期"的交互关系具...  相似文献   

18.
本文针对我国文献资源建设上存在的问题,从理论上阐述了加强我国文献资源整体化建设的必然性和可行性,并对我国文献资源整体化建设的发展方向、布局模式及当前的主要工作任务提出了一些建设性意见和看法.  相似文献   

19.
论述基于数字图书馆辅助科技创新平台的功能,对基于数字图书馆的科技创新平台实现的可能性进行分析,并对基于数字图书馆的科技创新平台整体架构进行设计,指出关联知识库和描述性知识库是该平台实现科技创新功能的关键,重点对这两个知识库的构建思路和构建策略进行探讨,以期为图书馆在国家科技创新服务和科学研究服务中提供新途径.  相似文献   

20.
李玉秋 《兰台世界》2008,(12):27-28
在档案管理创新过程中,必须转变传统的思维模式,树立以利用者为中心和知识服务体系的创新目标,采取文档一体化的管理模式,突破实体档案的局限,直接对信息进行管理、加工和利用。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号