共查询到20条相似文献,搜索用时 159 毫秒
1.
受控标引和受控词表的应用 总被引:1,自引:0,他引:1
本文介绍了受控标引的定义、特点,并对当前关于受控标引和受控语言已经过时的论点进行了反驳,认为受控标引和受控语言具有自然语言所不能代替的优点。文章还论述了受控词表在数据库、搜索引擎、DC元数据中的应用,进一步证明受控语言在当前网络环境下具有一定的地位,认为当前文献信息的组织和利用应该把受控语言和自然语言结合起来。 相似文献
2.
3.
4.
叙词表结构的属性异构为开展知识组织体系的集成服务带来障碍。文章以理学叙词表为例,梳理叙词表属性字段,在此基础上提出知识组织体系集成建设元数据框架,采用核心元素集与扩展元素集共建的设计思路。 相似文献
5.
高句丽文献资源及研究成果电子数据库构建中的元数据设计方案 总被引:1,自引:0,他引:1
元数据问题是特色数据库构建中的基本问题,该文从元数据的定义出发,阐述了采用元数据标准的必要性,并结合实践分析了高句丽文献资源及研究成果电子数据库构建过程中的元数据模板及标引字段设计、元数据集的选择等方案,最后提出了元数据工作要注意的问题。 相似文献
6.
7.
网络环境下,文献信息具有数量多、增长快、文献信息中的新词层出不穷等特点。标引是对信息资源进行组织的有效手段和重要环节,标引的质量和效率直接影响信息组织的质量和速度。为了比较受控标引、自由标引和自动标引三种标引方式的标引性能,本文从定量的角度对三种标引方式的相符度、专指度、标引深度及通用词数进行了测试对比,并分析了它们的综合性能。最后,分析讨论了网络环境下文本信息标引方式的选择和发展趋势。表5。图1。参考文献9。 相似文献
8.
本文报道了一个基于微机Windows 环境的微机辅助文献标引系统, 用以解决文献前处理速度慢与文献数据库时间要求强之间的时差矛盾。介绍了系统的界面设计与设计思想, 辅助标引的机读叙词表和词典, 以及相关的文件组织和数据结构等。研究了系统界面与标引员之间的关系, 以求设计出最佳的人机界面促进文献标引的速度和质量。讨论了辅助标引用机读叙词表的各个学科词库合并与词表参照系统的应用等问题。 相似文献
9.
计算机检索环境下工具书分类标引的探讨 总被引:1,自引:0,他引:1
本文根据工具书的不同类型所具有的特征 ,分别探讨了对它们进行分类标引的不同方法 ,特别是探讨了在计算机检索环境下工具书的分类标引方法 ,以求从多个角度和途径揭示工具书具有的学科内容属性及其特征 ,方便读者从多个途径检索、利用工具书。 相似文献
10.
11.
建立网络社区主题通道的核心主题词表 总被引:1,自引:0,他引:1
Wonsook Lee Shigeo Sugimoto 《现代图书情报技术》2006,37(1):25-32,82
网络社区收藏的资源往往倾向于满足日常信息需要,涉及的主题范围比较专指,而传统的图书馆分类主题词表则倾向于学术性和综合性,不适于网络社区用户的需要,因此需要建立适于这些特定用户群的分类主题词表。本文作者曾经参与了一些数字化图书馆的项目,设计开发过一此专门用于这些目的的小型核心词表。这篇文章介绍了作者们在开发过程中遇到的一些问题以及解决这些问题的方法和策略。小型“核心”主题测表可以定义为为网络社区资源专用的主题分类表。通过对元数据记录中的主题词频统计分析,作者确定哪些是核心词,然后再将这些核心词分成网络、图书馆、机构组织和设施、图书馆类型、组织名称和服务、地名、一般主题词、和参考工具等8个大类。在这8个大类下再进一步细分到二级类目。本文展示了三个图书馆的实例,它们主要是为公共图书馆的用户设计的。通过解释他们在这三个项目中的做法,作者讨论了在开发过程中的技术和成本以及在维护方面的问题,并且比较了一些类似的词表。 相似文献
12.
《Government Information Quarterly》2001,18(3):181-194
Minnesota’s Foundations Project is a multiagency collaboration to improve access to environmental and natural resources information. The Project chose the Dublin Core metadata standard for web resources. Three studies were conducted: needs assessment, Bridges web site user interface, and usability of controlled vocabulary in Dublin Core metadata. Based on these findings and information architecture, the Project published best practice guidelines. Controlled vocabulary is important to facilitate access. This is relevant to the third study on Dublin Core metadata, which tested keyword searches of web pages to determine the effectiveness of controlled vocabulary in the Dublin Core subject tag. Central to the Best Practice Guidelines is the User Guide to Dublin Core, which offers an element-by-element understanding of the metadata schema. Current bibliographies and reports show further background work that informed the decision-making process for such important choices as metadata schema, thesaurus and thesaurus management software, search engine, and RDF/XML standards. 相似文献
13.
14.
Besiki Stvilia Corinne JörgensenAuthor VitaeShuheng WuAuthor Vitae 《Library & information science research》2012
There have been ample suggestions in the literature that terms added to documents from Flickr and Wikipedia can complement traditional methods of indexing and controlled vocabularies. At the same time, adding new metadata to existing metadata objects may not always add value to those objects. The potential added-value of using user-contributed (“social”) terms from Flickr and the English Wikipedia in image indexing is compared with using two expert-created controlled vocabularies—the Thesaurus for Graphic Materials and the Library of Congress Subject Headings—without those social terms. Experiments confirmed that the social terms did add value, relative to terms from the controlled vocabularies. The median rating for the usefulness of social terms was significantly higher than the baseline rating, but was lower than the ratings for the terms from the Thesaurus for Graphic Materials and the Library of Congress Subject Headings. Furthermore, complementing the controlled vocabulary terms with social terms more than doubled the average coverage of participants' terms for a photograph. The relationships between user demographics and users' perceptions of the value of terms were also investigated, as well as the relationships between user demographics and indexing quality, as measured by the number of terms participants assigned to a photograph. Participants with more tagging and indexing experience assigned a greater number of tags than did other participants. 相似文献
15.
The German National Library of Science and Technology (TIB) developed a Web-based platform for audiovisual media. The audiovisual portal optimizes access to scientific videos such as computer animations and lecture and conference recordings. TIB's AV-Portal combines traditional cataloging and automatic indexing of audiovisual media. The article describes metadata standards for audiovisual media and introduces the TIB's metadata schema in comparison to other metadata standards for non-textual materials. Additionally, we give an overview of multimedia retrieval technologies used for the Portal and present the AV-Portal in detail as well as the additional value for libraries and their users. 相似文献
16.
文章以网络调查法、文献调研法和内容分析法为主要研究方法,比较并分析DataVerse、Dryad、DSpace、Fedora和CKAN 5个应用广泛的开源科研数据知识库的元数据方案,包含元数据模式、元数据收割协议、资源标识系统以及应用程序接口等内容。提出了我国科研数据知识库元数据的建设方案,即复用通用、标准的元数据模式,根据实际需求扩展与修改;遵循简单、灵活和自动生成的设计原则;将关联数据等语义网技术应用于元数据方案的设计,解决不同元数据模式之间的互操作问题。 相似文献
17.
面向网络信息资源聚合搜索的细粒度聚合单元元数据研究 总被引:1,自引:0,他引:1
由于相关信息片段分散分布在海量且复杂多样的网络信息资源中,用户往往需要花费大量时间浏览、查询和收集所需信息。面向聚合搜索的细粒度聚合单元元数据可以深入揭示信息特征及其关联关系,促进知识发现并提升知识服务效率。因此,有必要构建细粒度聚合单元的元数据描述框架。本文以图书情报领域开放获取期刊论文、在线百科、博客等网络信息资源为数据源,采用逻辑结构分析和形式结构分析方法建立聚合单元划分框架,包括篇章层级的标题、著者等外部特征,以及节段、句群、图表单元中的话语意图和语义功能等特征;通过分析聚合单元的属性特征及复用DC、LOM元数据元素,构建描述聚合单元访问信息、物理信息和语义信息的元数据框架;设计检索数据库并采用实验法对聚合单元元数据框架进行验证。实验表明,该元数据框架可支持多类型网络信息资源、各层级细粒度聚合单元的检索,可为细粒度信息聚合与搜索提供理论基础与实践指导。图7。表6。参考文献58。 相似文献
18.
北京高校网络图书馆"教学参考资源共享网"项目由6所北京高校图书馆联合共建,项目采用CDI CM内容管理软件作为建设平台,将参建学校教学信息与图书馆的馆藏及网上教学资源整合起来提供多层次教学参考服务。"教学参考资源共享网"包括教师库、学科专业库、课程库、机构库、教材教参库、精品课程库、教师论著7个资源子库。元数据方案的设计依据国家图书馆《中文元数据方案》规定的核心元素集并进行适当扩展。针对每个资源子库设计了3个级别发布模板,实现了数据的导航、检索及资源库之间的数据关联发布等功能。 相似文献
19.
Christoph Baumgarten 《Information Retrieval》2000,3(3):253-271
This paper describes a probabilistic model for optimum information retrieval in a distributed heterogeneous environment.The model assumes the collection of documents offered by the environment to be partitioned into subcollections. Documents as well as subcollections have to be indexed, where indexing methods using different indexing vocabularies can be employed. A query provided by a user is answered in terms of a ranked list of documents. The model determines a procedure for ranking the documents that stems from the Probability Ranking Principle: For each subcollection, the subcollection's documents are ranked; the resulting ranked lists are combined into a final ranked list of documents, where the ordering is determined by the documents' probabilities of being relevant with respect to the user's query. Various probabilistic ranking methods may be involved in the distributed ranking process. A criterion for effectively limiting the ranking process to a subset of subcollections extends the model.The property that different ranking methods and indexing vocabularies can be used is important when the subcollections are heterogeneous with respect to their content.The model's applicability is experimentally confirmed. When exploiting the degrees of freedom provided by the model, experiments showed evidence that the model even outperforms comparable models for the non-distributed case with respect to retrieval effectiveness. 相似文献
20.
文章根据期刊论文自身的特点和应用需求,分析期刊论文元素标引的意义,设计期刊论文元素标引规范的制定流程,并深入分析和研究标引规范的内容结构、元素构成及互操作框架,在此基础上提出了期刊论文的核心元数据、文档结构、深度内容三个方面的标引元素,同时指出了下一阶段研究工作的主要方向。 相似文献