共查询到18条相似文献,搜索用时 125 毫秒
1.
2.
3.
针对现有元数据索引方法因其固有的缺陷而难以应用于复杂的语义网络,提出一种新的基于语义的元数
据索引查询方法。该方法以RDF图为数据模型,在路径索引的基础上,为元数据建立索引,并通过路径表达式实现元数据的查询。它能有效的促进领域知识的共享和语义表达,提高元数据的检索效率和查准率,为用户和应用提供语义查询和信息汇集能力。 相似文献
4.
王莉 《现代图书情报技术》2007,2(7):79-82
针对学位论文模板与在线提交系统分离情况下,学生提交论文重新填写元数据项可能带来的输入错误、与印本不符等问题,介绍从Word文档中提取学位论文元数据集表单,将相应数据项内容传递给本地学位论文在线提交系统的方案,并给出VB.net编写的主要程序代码。 相似文献
5.
6.
王莉 《现代图书情报技术》2007,2(6):66-69
针对学位论文服务体系建设过程中出现的数据格式不统一、数据不规范问题,提出元数据交换标准,介绍利用XML技术实现这一标准,进而提出解决问题的方案。 相似文献
7.
简述PDF信息抽取过程中采用的转换工具及抽取语言,简析PDFTOHTML格式转换后的中间文档,分析PDF科技论文首页元数据存在的问题,给出对以上问题的解决方案。 相似文献
8.
现有的元数据提取方法提取规则烦琐、适应性差.针对这一问题,文章提出了借助八爪鱼采集器实现过刊网刊元数据提取的新方法.该方法以大型数据库的网页信息为对象,建立了提取元数据的流程图,通过该流程图设置相应的规则,并配置抓取数据模块,最后将该方法应用于网刊元数据的自动提取中.实际应用显示,该方法有效地提高了元数据的提取性能,并且具有较强的适应性. 相似文献
9.
OAI-PMH元数据的关联数据化方法研究 总被引:1,自引:0,他引:1
OAI-PMH元数据的关联数据化是指将OAI仓储中的元数据转换为关联数据,可以解决用户在按传统方式采集这些元数据时所遇到的问题.总结现有相关研究的不足,描述OAI-PMH元数据的关联数据化方法的基本原理,对URI分配方法、用于描述关联数据的元数据元素的确定、关联信息的生成等关键问题进行探讨. 相似文献
10.
11.
基于XML/RDF的MARC元数据描述技术 总被引:41,自引:1,他引:41
由W3C推出的元数据标准可扩展标记语言XML和资源描述框架RDF分别规范了Internet上资源描述的语法和语义,为元数据的编码、交换和重用提供了基础架构。本文针对目前广泛存在于图书馆系统中的MARC格式的大量书目数据,研究了基于XML/RDF的MARC元数据描述技术,重点解决了MARC元数据的XML描述问题和基于RDF的MARC元数据描述问题,从而使得专用的MARC规范格式的书目数据转换成通用的机器可读和机器可理解的元数据成为可能。本文的研究成果对于现有MARC数据在未来数字图书馆中的利用具有重要意义。 相似文献
12.
元数据自动抽取研究新进展* 总被引:1,自引:0,他引:1
分析元数据自动抽取的现实需求,对元数据自动抽取的相关研究进行阐述,然后对DROID、 NLNZ Metadata Extractor、Metadata Miner Catalogue PRO 3种典型的元数据自动抽取器进行分析比较;在讨论目前元数据自动抽取技术局限性的基础上,对该技术进行总结和展望。 相似文献
13.
基于欧美英语图书出版市场的产品元数据信息发展,通过介绍信息链上的主要业务主体及其作用,勾勒书业元数据的生命运行轨迹,并分析现阶段数据信息在图书产品发行中的应用、电子书元数据及对产品营销的意义等突出问题,得出结论:元数据业务在未来发展中将逐渐与出版业务融合,对信息化系统也将不断提出更高的要求,信息发展会趋向标准化与开放化.同时指出图书元数据建设是一项行业性信息化整体方案,需要全行业共同参与维护. 相似文献
14.
介绍五种医学资源元数据方案:OhioLINK医学元数据、NLM Metadata Schema、 Medical Core Metadata(MCM)、CISMeF元数据、EBM metadata,分析比较他们的共性与区别,为制定我国的医学元数据方案提供思路。 相似文献
15.
PDF科技论文语义元数据的自动抽取研究 总被引:1,自引:0,他引:1
在分析PDF文件结构的基础上,解析PDF文件的内容流,并采用基于规则的匹配方法和基于格式的定位方法,自动抽取科技论文中的语义元数据信息。实验结果表明,上述方法对标题、作者等重要的语义元数据信息能够达到较好的抽取效果。 相似文献
16.
特征词抽取和相关性融合的伪相关反馈查询扩展 总被引:2,自引:0,他引:2
针对现有信息检索系统中存在的词不匹配问题,提出一种基于特征词抽取和相关性融合的伪相关反馈查询扩展算法以及新的扩展词权重计算方法。该算法从前列n篇初检局部文档中抽取与原查询相关的特征词,根据特征词在初检文档集中出现的频度以及与原查询的相关度,将特征词确定为最终的扩展词实现查询扩展。实验结果表明,该方法有效,并能提高和改善信息检索性能。 相似文献
17.
基于关系抽取的企业竞争情报获取与融合框架 总被引:2,自引:1,他引:2
网页蕴含了大量的企业竞争情报.然而,现有的企业竞争情报获取系统还缺乏直接从网页中获取竞争情报的能力.本文提出了一个基于网页实体关系抽取与融合的企业竞争情报获取系统框架.该系统通过对网页内容的抽取与融合,最终形成可信的企业竞争情报数据.论文首先讨论面向Web的企业竞争情报自动获取系统的总体结构,并重点阐述了其中的企业竞争情报获取方法、企业竞争情报融合机制等问题及其解决方案.本文的工作为进一步建立实用的Web竞争情报获取与融合系统奠定了基础. 相似文献