首页 | 本学科首页   官方微博 | 高级检索  
 共查询到20条相似文献,搜索用时 159 毫秒
受控标引和受控词表的应用   总被引:1,自引:0,他引:1  
本文介绍了受控标引的定义、特点,并对当前关于受控标引和受控语言已经过时的论点进行了反驳,认为受控标引和受控语言具有自然语言所不能代替的优点。文章还论述了受控词表在数据库、搜索引擎、DC元数据中的应用,进一步证明受控语言在当前网络环境下具有一定的地位,认为当前文献信息的组织和利用应该把受控语言和自然语言结合起来。  相似文献   

针对国内外著名数据库受控标引的标引方式、标引字段的现状和发展趋势进行深入分析,指出目前虽然受控标引以机器辅助标引为主,但自动标引也有成功案例。标引字段除标引文献主题内容外已扩至对文献中的图表、重要数值、化学分子式等进行标引,并采用与分类标引、非受控语言标引相结合的多维度标引模式。最后,基于目前国内外受控标引发展水平的差异,提出国内应从三个方面予以改进。  相似文献   

网络环境信息标引的测评与比较研究   总被引:1,自引:1,他引:0  
网络环境下,文献信息具有数量多、增长快、新词层出不穷等特点。标引是对信息资源进行组织的有效手段和重要环节,标引的质量和效率直接影响信息组织的质量和速度。对受控标引、自由标引和自动标引三种标引方式进行了相符度、专指度、标引深度及通用词数的测试对比.得出自由标引优于受控标引,自动标引优于自由标引及受控标引的结论。  相似文献   

叙词表结构的属性异构为开展知识组织体系的集成服务带来障碍。文章以理学叙词表为例,梳理叙词表属性字段,在此基础上提出知识组织体系集成建设元数据框架,采用核心元素集与扩展元素集共建的设计思路。  相似文献   

元数据问题是特色数据库构建中的基本问题,该文从元数据的定义出发,阐述了采用元数据标准的必要性,并结合实践分析了高句丽文献资源及研究成果电子数据库构建过程中的元数据模板及标引字段设计、元数据集的选择等方案,最后提出了元数据工作要注意的问题。  相似文献   

论文献结构标引   总被引:1,自引:0,他引:1  
张志农  刘磊 《图书馆》2003,(6):12-15
本文通过分析一般文献的组成元素、元素之间的结构关系和传统文献的结构标识,提出数字文献在元数据基础上的结构标引。阐述了结构标引的一般意义和基本原理。  相似文献   

网络环境下,文献信息具有数量多、增长快、文献信息中的新词层出不穷等特点。标引是对信息资源进行组织的有效手段和重要环节,标引的质量和效率直接影响信息组织的质量和速度。为了比较受控标引、自由标引和自动标引三种标引方式的标引性能,本文从定量的角度对三种标引方式的相符度、专指度、标引深度及通用词数进行了测试对比,并分析了它们的综合性能。最后,分析讨论了网络环境下文本信息标引方式的选择和发展趋势。表5。图1。参考文献9。  相似文献   

本文报道了一个基于微机Windows 环境的微机辅助文献标引系统, 用以解决文献前处理速度慢与文献数据库时间要求强之间的时差矛盾。介绍了系统的界面设计与设计思想, 辅助标引的机读叙词表和词典, 以及相关的文件组织和数据结构等。研究了系统界面与标引员之间的关系, 以求设计出最佳的人机界面促进文献标引的速度和质量。讨论了辅助标引用机读叙词表的各个学科词库合并与词表参照系统的应用等问题。  相似文献   

计算机检索环境下工具书分类标引的探讨   总被引:1,自引:0,他引:1  
本文根据工具书的不同类型所具有的特征 ,分别探讨了对它们进行分类标引的不同方法 ,特别是探讨了在计算机检索环境下工具书的分类标引方法 ,以求从多个角度和途径揭示工具书具有的学科内容属性及其特征 ,方便读者从多个途径检索、利用工具书。  相似文献   

医学主题词表(MeSH)专指度研究   总被引:4,自引:0,他引:4  
本文从词表先组度、词量及词量系数、标引及检索四个不同角度探讨厂MeSH表的专指度问题,认为MeSH表的收词量及专指度较为适宜,不失为词表中的典范,只是对于那些覆盖文献量过大的主题词应采取措施进一步细分,以利于标引和检索。  相似文献   

建立网络社区主题通道的核心主题词表   总被引:1,自引:0,他引:1  
网络社区收藏的资源往往倾向于满足日常信息需要,涉及的主题范围比较专指,而传统的图书馆分类主题词表则倾向于学术性和综合性,不适于网络社区用户的需要,因此需要建立适于这些特定用户群的分类主题词表。本文作者曾经参与了一些数字化图书馆的项目,设计开发过一此专门用于这些目的的小型核心词表。这篇文章介绍了作者们在开发过程中遇到的一些问题以及解决这些问题的方法和策略。小型“核心”主题测表可以定义为为网络社区资源专用的主题分类表。通过对元数据记录中的主题词频统计分析,作者确定哪些是核心词,然后再将这些核心词分成网络、图书馆、机构组织和设施、图书馆类型、组织名称和服务、地名、一般主题词、和参考工具等8个大类。在这8个大类下再进一步细分到二级类目。本文展示了三个图书馆的实例,它们主要是为公共图书馆的用户设计的。通过解释他们在这三个项目中的做法,作者讨论了在开发过程中的技术和成本以及在维护方面的问题,并且比较了一些类似的词表。  相似文献   

Minnesota’s Foundations Project is a multiagency collaboration to improve access to environmental and natural resources information. The Project chose the Dublin Core metadata standard for web resources. Three studies were conducted: needs assessment, Bridges web site user interface, and usability of controlled vocabulary in Dublin Core metadata. Based on these findings and information architecture, the Project published best practice guidelines. Controlled vocabulary is important to facilitate access. This is relevant to the third study on Dublin Core metadata, which tested keyword searches of web pages to determine the effectiveness of controlled vocabulary in the Dublin Core subject tag. Central to the Best Practice Guidelines is the User Guide to Dublin Core, which offers an element-by-element understanding of the metadata schema. Current bibliographies and reports show further background work that informed the decision-making process for such important choices as metadata schema, thesaurus and thesaurus management software, search engine, and RDF/XML standards.  相似文献   

《资源描述与检索》的实施包括三个层面。第一层面是作为内容标准,替代原有编目规则,RDA将比AACR2有更广泛的应用。第二层面是实现FRBR化的用户界面,这取决于呈现方式及作品/内容表达层的预约被用户接受程度。第三层面是成为通用的元数据本体,实现关联数据发布,美国国会图书馆书目框架转换行劝对RDA注册元素集的支持,将决定其应用前景。  相似文献   

There have been ample suggestions in the literature that terms added to documents from Flickr and Wikipedia can complement traditional methods of indexing and controlled vocabularies. At the same time, adding new metadata to existing metadata objects may not always add value to those objects. The potential added-value of using user-contributed (“social”) terms from Flickr and the English Wikipedia in image indexing is compared with using two expert-created controlled vocabularies—the Thesaurus for Graphic Materials and the Library of Congress Subject Headings—without those social terms. Experiments confirmed that the social terms did add value, relative to terms from the controlled vocabularies. The median rating for the usefulness of social terms was significantly higher than the baseline rating, but was lower than the ratings for the terms from the Thesaurus for Graphic Materials and the Library of Congress Subject Headings. Furthermore, complementing the controlled vocabulary terms with social terms more than doubled the average coverage of participants' terms for a photograph. The relationships between user demographics and users' perceptions of the value of terms were also investigated, as well as the relationships between user demographics and indexing quality, as measured by the number of terms participants assigned to a photograph. Participants with more tagging and indexing experience assigned a greater number of tags than did other participants.  相似文献   

The German National Library of Science and Technology (TIB) developed a Web-based platform for audiovisual media. The audiovisual portal optimizes access to scientific videos such as computer animations and lecture and conference recordings. TIB's AV-Portal combines traditional cataloging and automatic indexing of audiovisual media. The article describes metadata standards for audiovisual media and introduces the TIB's metadata schema in comparison to other metadata standards for non-textual materials. Additionally, we give an overview of multimedia retrieval technologies used for the Portal and present the AV-Portal in detail as well as the additional value for libraries and their users.  相似文献   

文章以网络调查法、文献调研法和内容分析法为主要研究方法,比较并分析DataVerse、Dryad、DSpace、Fedora和CKAN 5个应用广泛的开源科研数据知识库的元数据方案,包含元数据模式、元数据收割协议、资源标识系统以及应用程序接口等内容。提出了我国科研数据知识库元数据的建设方案,即复用通用、标准的元数据模式,根据实际需求扩展与修改;遵循简单、灵活和自动生成的设计原则;将关联数据等语义网技术应用于元数据方案的设计,解决不同元数据模式之间的互操作问题。  相似文献   

面向网络信息资源聚合搜索的细粒度聚合单元元数据研究   总被引:1,自引:0,他引:1  
由于相关信息片段分散分布在海量且复杂多样的网络信息资源中,用户往往需要花费大量时间浏览、查询和收集所需信息。面向聚合搜索的细粒度聚合单元元数据可以深入揭示信息特征及其关联关系,促进知识发现并提升知识服务效率。因此,有必要构建细粒度聚合单元的元数据描述框架。本文以图书情报领域开放获取期刊论文、在线百科、博客等网络信息资源为数据源,采用逻辑结构分析和形式结构分析方法建立聚合单元划分框架,包括篇章层级的标题、著者等外部特征,以及节段、句群、图表单元中的话语意图和语义功能等特征;通过分析聚合单元的属性特征及复用DC、LOM元数据元素,构建描述聚合单元访问信息、物理信息和语义信息的元数据框架;设计检索数据库并采用实验法对聚合单元元数据框架进行验证。实验表明,该元数据框架可支持多类型网络信息资源、各层级细粒度聚合单元的检索,可为细粒度信息聚合与搜索提供理论基础与实践指导。图7。表6。参考文献58。  相似文献   

北京高校网络图书馆"教学参考资源共享网"项目由6所北京高校图书馆联合共建,项目采用CDI CM内容管理软件作为建设平台,将参建学校教学信息与图书馆的馆藏及网上教学资源整合起来提供多层次教学参考服务。"教学参考资源共享网"包括教师库、学科专业库、课程库、机构库、教材教参库、精品课程库、教师论著7个资源子库。元数据方案的设计依据国家图书馆《中文元数据方案》规定的核心元素集并进行适当扩展。针对每个资源子库设计了3个级别发布模板,实现了数据的导航、检索及资源库之间的数据关联发布等功能。  相似文献   

This paper describes a probabilistic model for optimum information retrieval in a distributed heterogeneous environment.The model assumes the collection of documents offered by the environment to be partitioned into subcollections. Documents as well as subcollections have to be indexed, where indexing methods using different indexing vocabularies can be employed. A query provided by a user is answered in terms of a ranked list of documents. The model determines a procedure for ranking the documents that stems from the Probability Ranking Principle: For each subcollection, the subcollection's documents are ranked; the resulting ranked lists are combined into a final ranked list of documents, where the ordering is determined by the documents' probabilities of being relevant with respect to the user's query. Various probabilistic ranking methods may be involved in the distributed ranking process. A criterion for effectively limiting the ranking process to a subset of subcollections extends the model.The property that different ranking methods and indexing vocabularies can be used is important when the subcollections are heterogeneous with respect to their content.The model's applicability is experimentally confirmed. When exploiting the degrees of freedom provided by the model, experiments showed evidence that the model even outperforms comparable models for the non-distributed case with respect to retrieval effectiveness.  相似文献   

文章根据期刊论文自身的特点和应用需求,分析期刊论文元素标引的意义,设计期刊论文元素标引规范的制定流程,并深入分析和研究标引规范的内容结构、元素构成及互操作框架,在此基础上提出了期刊论文的核心元数据、文档结构、深度内容三个方面的标引元素,同时指出了下一阶段研究工作的主要方向。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号