首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 62 毫秒
1.
[目的/意义]构建多源文献元数据融合模型,有助于提升文献元数据整体质量,促进资源发现系统中的元数据管理与利用,优化用户资源发现服务体验.针对笔者此前提出的文献元数据判重策略进行优化,从经验为主向自动化转变,在保障判重和融合效果的前提下,提升整个过程的自动化水平.[方法/过程]针对不同类型文献的元数据项不一样、同一文献不...  相似文献   

2.
基于正则表达式批量提取CNKI文献元数据技术探究   总被引:1,自引:0,他引:1  
介绍一种仅仅依靠中国知网文献磁盘文件提取元数据的方法。根据已下载的CNKI文献提取元数据,构建个人文献信息数据库,进而能建立个人文献信息管理系统。虽然CNKI文献库没有提供外界的数据库访问接口,但是文献的元数据都以web页面的方式展现。通过分析与文献绑定的属性页面的结构,利用正则表达式提取文献元数据,可以将其批量导入到数据库中。  相似文献   

3.
针对现有元数据索引方法因其固有的缺陷而难以应用于复杂的语义网络,提出一种新的基于语义的元数 据索引查询方法。该方法以RDF图为数据模型,在路径索引的基础上,为元数据建立索引,并通过路径表达式实现元数据的查询。它能有效的促进领域知识的共享和语义表达,提高元数据的检索效率和查准率,为用户和应用提供语义查询和信息汇集能力。  相似文献   

4.
针对学位论文模板与在线提交系统分离情况下,学生提交论文重新填写元数据项可能带来的输入错误、与印本不符等问题,介绍从Word文档中提取学位论文元数据集表单,将相应数据项内容传递给本地学位论文在线提交系统的方案,并给出VB.net编写的主要程序代码。  相似文献   

5.
设计一个跟踪科技文献网站的伺服程序,定期对网页数据进行提取,获取最新的科技文献信息,协助高校图书馆完成最前沿科技情报的信息采集工作。本文主要采用主题式网络爬虫技术对国内重要的科技期刊、科技论坛、博客等科技文献特征信息进行统一标准和增量式数据管理,建成元数据库本地存储模式。该系统具有编制简单、易扩展、运行速度快等特点,实现了图书馆科技文献元数据库的增量更新;丰富和完善了图书馆资源建设和知识发现体系;为高校图书馆收集最新的科技情报提供了快捷的途径;促进了以用户为中心的高校图书馆个性化服务体系的建设。  相似文献   

6.
针对学位论文服务体系建设过程中出现的数据格式不统一、数据不规范问题,提出元数据交换标准,介绍利用XML技术实现这一标准,进而提出解决问题的方案。  相似文献   

7.
简述PDF信息抽取过程中采用的转换工具及抽取语言,简析PDFTOHTML格式转换后的中间文档,分析PDF科技论文首页元数据存在的问题,给出对以上问题的解决方案。  相似文献   

8.
崔玉洁  廖坤 《编辑学报》2016,28(5):485-487
现有的元数据提取方法提取规则烦琐、适应性差.针对这一问题,文章提出了借助八爪鱼采集器实现过刊网刊元数据提取的新方法.该方法以大型数据库的网页信息为对象,建立了提取元数据的流程图,通过该流程图设置相应的规则,并配置抓取数据模块,最后将该方法应用于网刊元数据的自动提取中.实际应用显示,该方法有效地提高了元数据的提取性能,并且具有较强的适应性.  相似文献   

9.
OAI-PMH元数据的关联数据化方法研究   总被引:1,自引:0,他引:1  
OAI-PMH元数据的关联数据化是指将OAI仓储中的元数据转换为关联数据,可以解决用户在按传统方式采集这些元数据时所遇到的问题.总结现有相关研究的不足,描述OAI-PMH元数据的关联数据化方法的基本原理,对URI分配方法、用于描述关联数据的元数据元素的确定、关联信息的生成等关键问题进行探讨.  相似文献   

10.
关联规则兴趣度度量方法的比较研究   总被引:2,自引:1,他引:1  
关联规则挖掘是数据挖掘中重要的研究课题,已有许多有效的实现算法。然而,这些算法找到的关联规则数目太多,用户无法对其进行分析。为了克服这个问题,出现了一些关联规则衡量标准来分析规则的有趣性,在本文里我们在给出的实例上比较分析了一些关联规则客观兴趣度度量指标,提出了使用关联规则客观兴趣度度量指标的一些建议。  相似文献   

11.
基于XML/RDF的MARC元数据描述技术   总被引:42,自引:1,他引:41  
黄伟红  张福炎 《情报学报》2000,19(4):326-332
由W3C推出的元数据标准可扩展标记语言XML和资源描述框架RDF分别规范了Internet上资源描述的语法和语义,为元数据的编码、交换和重用提供了基础架构。本文针对目前广泛存在于图书馆系统中的MARC格式的大量书目数据,研究了基于XML/RDF的MARC元数据描述技术,重点解决了MARC元数据的XML描述问题和基于RDF的MARC元数据描述问题,从而使得专用的MARC规范格式的书目数据转换成通用的机器可读和机器可理解的元数据成为可能。本文的研究成果对于现有MARC数据在未来数字图书馆中的利用具有重要意义。  相似文献   

12.
元数据自动抽取研究新进展*   总被引:1,自引:0,他引:1  
 分析元数据自动抽取的现实需求,对元数据自动抽取的相关研究进行阐述,然后对DROID、 NLNZ Metadata Extractor、Metadata Miner Catalogue PRO 3种典型的元数据自动抽取器进行分析比较;在讨论目前元数据自动抽取技术局限性的基础上,对该技术进行总结和展望。  相似文献   

13.
基于欧美英语图书出版市场的产品元数据信息发展,通过介绍信息链上的主要业务主体及其作用,勾勒书业元数据的生命运行轨迹,并分析现阶段数据信息在图书产品发行中的应用、电子书元数据及对产品营销的意义等突出问题,得出结论:元数据业务在未来发展中将逐渐与出版业务融合,对信息化系统也将不断提出更高的要求,信息发展会趋向标准化与开放化.同时指出图书元数据建设是一项行业性信息化整体方案,需要全行业共同参与维护.  相似文献   

14.
介绍五种医学资源元数据方案:OhioLINK医学元数据、NLM Metadata Schema、 Medical Core Metadata(MCM)、CISMeF元数据、EBM metadata,分析比较他们的共性与区别,为制定我国的医学元数据方案提供思路。  相似文献   

15.
基于关系抽取的企业竞争情报获取与融合框架   总被引:2,自引:1,他引:2  
网页蕴含了大量的企业竞争情报.然而,现有的企业竞争情报获取系统还缺乏直接从网页中获取竞争情报的能力.本文提出了一个基于网页实体关系抽取与融合的企业竞争情报获取系统框架.该系统通过对网页内容的抽取与融合,最终形成可信的企业竞争情报数据.论文首先讨论面向Web的企业竞争情报自动获取系统的总体结构,并重点阐述了其中的企业竞争情报获取方法、企业竞争情报融合机制等问题及其解决方案.本文的工作为进一步建立实用的Web竞争情报获取与融合系统奠定了基础.  相似文献   

16.
PDF科技论文语义元数据的自动抽取研究   总被引:1,自引:0,他引:1  
在分析PDF文件结构的基础上,解析PDF文件的内容流,并采用基于规则的匹配方法和基于格式的定位方法,自动抽取科技论文中的语义元数据信息。实验结果表明,上述方法对标题、作者等重要的语义元数据信息能够达到较好的抽取效果。  相似文献   

17.
特征词抽取和相关性融合的伪相关反馈查询扩展   总被引:2,自引:0,他引:2  
针对现有信息检索系统中存在的词不匹配问题,提出一种基于特征词抽取和相关性融合的伪相关反馈查询扩展算法以及新的扩展词权重计算方法。该算法从前列n篇初检局部文档中抽取与原查询相关的特征词,根据特征词在初检文档集中出现的频度以及与原查询的相关度,将特征词确定为最终的扩展词实现查询扩展。实验结果表明,该方法有效,并能提高和改善信息检索性能。  相似文献   

18.
基于元数据的Web信息检索研究   总被引:10,自引:0,他引:10  
王晔  王继成  张福炎 《情报学报》2001,20(3):309-316
本文针对当前Web信息检索的不足 ,提出了一种新的基于元数据的检索方式 ,并利用Z39 50协议实现了一个检索服务器。通过DublinCore元数据集到MARC的相互转化 ,保持了与通用的Z39 50客户端的兼容性  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号