首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 140 毫秒
1.
XML(可扩展标记语言)正在成为Web数据交换的标准格式.随着XML格式的半结构数据的大量出现,如何处理和管理XML文档已经成为了一个研究热点.XML文档聚类作为XML数据处理的重要课题,是指将具有类似特征的XML文档聚集成簇.现有的大部分XML文档聚类是基于文档结构特征的.本文提出了一个新的结构与内容相结合的XML文档聚类方法.首先从文档中抽取构件向量,并把文档转换为向量化的表示.然后,在文档相似度计算的基础上,引入一个层次聚类方法对XML文档进行聚类.在DBLP XML记录集上进行的实验表明该方法具有可行性并且性能明显优于已有方法.  相似文献   

2.
近年来XML凭借其自身的简单性、半结构化、可扩展性、自描述性等特点,逐渐成为了互联网数据表示和数据交换的标准.XML文档聚类是数据挖掘研究中热点一个,为网络信息资源的搜集、组织及检索利用提供良好的技术支持.本文首先介绍了目前主要的XML文档聚类算法,然后在利用WordNet对XML文档中的标记进行语义消歧的基础上,提出了一种新的基于语义标记树的XML文档相似度计算方法,并通过最近邻算法进行聚类,最后在用于XML检索研究的数据集上进行实验,证实其确实是一种比较有效的XML文档聚类方法.  相似文献   

3.
本文分析了XML在电子文件管理中的面向文档———自定义“电子文件类型定义”的功能 ,面向数据———封装电子文件元数据的功能 ,面向语义———进行全文检索的功能 ,并总结了XML在电子文件管理中的对电子文件真实性、可靠性、凭证性、可理解性及可检索性具有语言 (因为XML本质上是一种语言 )上的保证作用  相似文献   

4.
基于OKAPI的XML信息检索实现研究   总被引:3,自引:1,他引:3  
OKAPI能实现强大的自由文本检索与评价功能,但要实现基于XML的信息检索,却要做适当改造。改造时,一方面尽量不破坏原有系统的体系结构,又要能实现对XML文档的索引、查询和表示。为此,必须完成面向XML的文档预处理和索引、面向XML的文档检索及检索模型的选择。图3。公式3。参考文献10。  相似文献   

5.
用JAVA+XML实现网站全文检索   总被引:2,自引:0,他引:2  
介绍了用JAVA和XML实现网站站内全文检索的实现过程,即用java编写索引工具,对WEB文档进行索引,索引结果写入XML文档;用Servlet和JDOM实现读取和查询XML文档,并在客户返回查询结果。  相似文献   

6.
王知津  赵洪 《图书馆杂志》2007,26(11):20-26
传统的关键词检索技术在文本检索和HTML文档检索上得到了广泛的应用,但它运用于检索XML文档时却不尽如意.为此,本文引入一种改进的遗传算法,对XML文档上的关键词检索进行了研究,提出了XML文档标记的自适应遗传训练算法与XML文档上关键词语义检索及结果排序算法.  相似文献   

7.
钟闻 《北京档案》2004,(3):31-31,38
在机关实现办公自动化过程中,文档一体化是一项不容回避的工作.此时的文档一体化应该是指文件和档案在同一管理软件系统进行收发、流转、归档和管理的连续过程.文档一体化的特点应该是公文处理与档案工作纳入到在计算机网络中共享文件数据、相互渗透、相互协调的运行体制之中.但在机关实际工作中存在的种种主客观因素阻碍了文档一体化的实施.  相似文献   

8.
XML文档相似度计算方法研究   总被引:1,自引:0,他引:1  
XML(可扩展标记语言)正在成为Web上各种应用交换信息的标准.随着XML格式的半结构数据的大量出现,如何处理和管理XML文档已经成为了一个研究热点.XML文档的相似度计算是XML数据处理的重要课题,是XML文档聚类与检索的关键技术.XML文档由逻辑结构(structure)和文本内容(content)构成,可以根据结构特征或内容特征来度量XML文档之间的相似度.本文将XML文档的相似度计算方法分为基于结构的和结构与内容相结合的两类,并对各种已有的XML文档相似度计算方法进行了比较和述评.  相似文献   

9.
随着电子文件资源大量出现,在高校的教学过程中构建文档一体化的管理体系已是一种趋势。本文从文档一体化中电子文件的存储及意义入手,对文档一体化中电子文件存储的关键问题进行了一些分析。  相似文献   

10.
XML文档和数据库的集成   总被引:1,自引:0,他引:1  
向桂林 《图书馆杂志》2002,21(7):47-51,64
本文首先阐述了需要把XML文档和数据库集成的原因;然后针对描述MBAR书目记录的XML文档,详细说明了把XML文档与数据库集成的办法;最后指出了转换过程中可能出现的一些问题。  相似文献   

11.
赵屹 《档案学研究》2022,36(1):73-78
当前我国正在加快数字化发展,上海提出全面推进城市数字化转型并出台了指导性文件。上海城市数字化转型是大战略,是档案事业发展的大机遇。档案事业应从融入、贯通、创发、引领四个方面推进数字化转型。融入包括融通数字底座、融达公共服务、融归新型数据。贯通包括馆室贯通、馆际贯通、档社贯通。创发包括流程再造、功能重塑、服务重构。引领包括数据资源引领、政策制度引领、技术应用引领。档案事业应该实现数字化转型并助力城市数字化转型,同时,借力城市数字化转型开创新局面。  相似文献   

12.
边媛 《档案学研究》2022,36(5):102-108
中央苏区革命期间,保留了珍贵的档案文献、革命文物、旧居以及实景遗址遗产。对分属不同机构且形式多样的中央苏区档案进行多源数据整合,既有中央苏区档案自身价值及保存现状、中央苏区各档案资源的内在关联性和时空场景的整体历史叙事需求等内在动因,也有其理论前提、国家政策扶持、各机构资源共建共享的共同目标以及技术赋能的外在条件。本文在分析中央苏区档案数据多源整合的动因、条件的基础上,探讨中央苏区档案以数字人文项目为纽带,通过对不同数据结构进行多源异构整合,再现历史以及场景等方式的实现路径。  相似文献   

13.
以归档为契机的文件、档案一体化管理战略研究   总被引:1,自引:0,他引:1  
归档既是电子件纳入档案管理范畴的最佳切入点,也是实现电子件管理流程重组、完善电子政务环境中件管理功能的关节点。本分析了在电子政务环境中如何以归档为契机实现件、档案一体化管理战略。  相似文献   

14.
档案登记备份工作是档案安全体系建设的一项重要内容,我国一些档案馆正在开展电子文件和数字档案的登记备份工作,以系统工程方法建设档案登记备份的安全体系具有整体性、开放性、层次性和稳定性的特点,应用信息系统工程技术开展档案登记备份工作能做到持续集成和创新。  相似文献   

15.
蔡学美 《档案学研究》2020,34(5):122-125
新修订的《档案法》提出了电子档案来源可靠、程序规范、要素合规的要求,这对推进电子档案规范管理必将产生重大而深远的影响。以我国法律对电子数据作为证据使用的要求和国家对电子公文要素的规定内容为依据,结合传统载体档案形成和管理的要求,分析提出电子档案要素构成,以期在实践和操作层面落实档案法关于电子档案合规管理的要求。  相似文献   

16.
作为全国首批国家示范性高等职业院校和广东省一流高职院校建设计划立项建设单位之一的广州番禺职业技术学院,伴随着智慧校园的建设,从文档一体化到数据档案一体化,一方面,将档案管理渗透到教学、科研、管理等业务活动中,另一方面,将归档流程写入业务环节,通过更新观念、规则前置、协同治理的方式将档案工作深度融入学校信息化整体进程,并结合自身实践,提出了高校业务系统数据电子化归档的具体思路和实现路径。  相似文献   

17.
介绍一种解释XML文档语义的方法。该方法使用RDF Schema描述的本体来对XML文档进行语义提取,并将结果以RDF数据模式(三元组)表现出来。  相似文献   

18.
论档案行政执法与刑事司法衔接中的证据转换   总被引:1,自引:0,他引:1  
档案行政执法与刑事司法有效衔接的重要问题之一就是档案执法证据的转换,《档案法》及《刑事诉讼法》等法律法规的规定为档案执法证据能够在刑事司法程序中采纳与使用提供了法律依据,这既是由档案违法行为与档案犯罪之间的竞合与证据的不可复制性所决定,又有助于提高刑事司法效率。档案执法证据向刑事司法证据的转换包括证据的转换范围、证据转换规则和档案执法文书的转换规则等内容。为确保公安司法机关合理使用档案执法证据,有必要对档案执法证据在刑事司法中的适用条件和特殊程序做出明确规定。  相似文献   

19.
文章从电子文件全程管理的角度分析了我国电子文件管理的现状,探讨了长春市机关及长春市档案馆在OA环境中文件、档案全程管理模式,并对电子档案的有效利用进行了方向性的探索,特别是按国家新的标准一体化设计电子文件和档案管理系统软件功能方面提出了新的思路。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号