首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
基于概念空间方法的信息检索技术研究   总被引:14,自引:0,他引:14  
为了解决词汇差异问题,词表构造在信息检索系统中有着重要意义。概念空间方法是利用计算机自动构造概念语义网络(词表)并以此为基础进行概念检索的一种方法。由词语作为语义网络的节点,词语之间的关联权重以一个给定文档集合中词语的共现率来计算,其大小代表它们之间的相似性。检索时系统采用人工智能方法激活与检索入口词相关的术语或概念,为用户提供交互式的检索用语建议。方法的具体步骤包括文档和对象列表收集、对象过滤和自动标引、共现分析和联想检索四个阶段。这种方法多用于英文检索系统,但对我国的信息检索系统也有重要的借鉴意义。  相似文献   

2.
基于Internet的汉语后控全文检索系统的研究与开发   总被引:2,自引:0,他引:2  
概述国内外后控词表检索系统的研究状况;重点论述基于iBASE非结构化数据库系统的汉语后控全文检索系统的研制与开发。  相似文献   

3.
4.
多语叙词表是实现多语言信息组织和检索,满足日益增长的多语言信息需求的重要工具资源。首先介绍多语叙词表构建的研究现状和3种主要构建方法,并对基于翻译构建多语叙词表的方法及该方法的不足进行分析,然后从汉化方法、汉语词汇的选取原则、叙词表辅助汉化平台的构建及汉化结果评价4个方面对英语EI叙词表和日语JST叙词表的汉化工作进行介绍,最后探讨下一步的研究工作。  相似文献   

5.
网络环境中汉语叙词表的自动构建研究   总被引:2,自引:0,他引:2  
为解决网络信息检索效率低的问题,需要把叙词表等控制机制引入到网络检索系统中,但传统词表编制方式已经不能满足网络信息检索的需要.本文制定了一种汉语叙词表自动构建方案,以财税领域为例,采用模式识别、词聚类、同现分析等自然语言处理技术实现自动识别词间等同关系、等级关系和相关关系,从而构建一部财税领域叙词表,最后对所构建的叙词表进行测评.相比传统叙词表编制方法,自动构建叙词表能降低编表专家的智力负担,而且编表时间短,费用低,时效性强,符合普通用户的检索习惯.但对词间关系的识别不如人工编表时精当可靠,所以需要人工辅助判定.  相似文献   

6.
情报检索系统与后控制词表   总被引:3,自引:0,他引:3  
回顾七十年代以来, 我国情报工作现代化的历史, 不难看出, 主题词典所起的重大作用。它不仅提供了计算机情报检索所需的检索语言, 并促进了我国情报工作现代化的进程。但十多年的实践, 也发现了它的许多不足: 维护的难度大和工作量大, 标引的不一致性、检索效率不理想等。在计算机的各种资源已大大丰富、要求用户友好的情况下, 作者认为主要词典应退居幕后, 采用全文检索加后控制的词表当是明智之举。  相似文献   

7.
对多语言信息进行语义层面的精确描述,为用户提供准确的跨语言信息资源,是当前多语言信息服务中必须面临和解决的实际问题。多语言主题词表正是解决这一问题的有效工具资源之一。文章首先介绍了国外三个常用多语言主题词表,然后对多语言主题词表在多语言信息自动标引和多语言信息检索两个领域中的应用情况进行了分析,说明多语言主题词表在多语言信息服务领域的潜在应用价值。  相似文献   

8.
熊霞  常春 《图书情报工作》2010,54(12):50-108
通过调查总结叙词表在文献数据库中的应用现状,在此基础上设计一个基于叙词表的文献数据库知识单元检索系统。该系统首先将数据库中的文献分解为知识单元,检索时用叙词表中的正式叙词对用户输入的检索词进行规范化处理,并将该正式叙词作为中心词,利用叙词表中的词间关系查找出该词的等同词、上下位词和相关词作为扩展检索词,对知识单元进行加权检索,按权值之和以及检索词的密集程度排序输出。经实例分析,具有可行性。  相似文献   

9.
认为主题词表有利于信息的组织、信息的利用和信息的检索,传统的手工构建单语言主题词表的方法耗时且成本昂贵,难以满足用户对跨语言信息的处理和使用需求。目前在国内外,如何利用计算机技术,实现跨语言主题词表的自动构建功能是信息检索研究领域需要解决的一个关键问题。在对国内外研究现状进行分析的基础上,较为详细地阐述和分析跨语言主题词表自动构建技术的思想及其技术方法,并提出相关的研究建议。  相似文献   

10.
将叙词表同传统的信息检索技术相结合,提出用叙词表的族对爬虫的主题进行描述的方法并用该方法设计实现一主题爬虫。实验结果证明本文提出模型和算法的有效性。  相似文献   

11.
基于词共现的可视化概念空间研究   总被引:2,自引:1,他引:1  
张学福 《情报学报》2008,27(2):205-211
概念空间在信息组织和帮助用户表达信息需求方面起到了重要作用,但目前研究构建的概念空间主要是一般意义上的概念空间,即具有严格体系结构、概念含义限定严格以及概念之间关系层次清晰等,如叙词表、领域本体等.由于它们在构建、使用过程中存在的问题,在信息检索领域应用的效果并不理想.鉴于这些情况,本文试图借助信息可视化技术研究非一般意义上的概念空间,即以对象内能够描述对象内容的词为概念,通过词共现方式构建的概念空间,研究它能否在一定程度上替代一般意义上的概念空间、效果如何等,为构建基于概念空间的信息检索可视化系统打下基础.  相似文献   

12.
The amount of health information available on the Internet is considerable. In this context, several health gateways have been developed. Among them, CISMeF (Catalogue and Index of Health Resources in French) was designed to catalogue and index health resources in French. The goal of this article is to describe the various enhancements to the MeSH thesaurus developed by the CISMeF team to adapt this terminology to the broader field of health Internet resources instead of scientific articles for the medline bibliographic database. CISMeF uses two standard tools for organizing information: the MeSH thesaurus and several metadata element sets, in particular the Dublin Core metadata format. The heterogeneity of Internet health resources led the CISMeF team to enhance the MeSH thesaurus with the introduction of two new concepts, respectively, resource types and metaterms. CISMeF resource types are a generalization of the publication types of medline. A resource type describes the nature of the resource and MeSH keyword/qualifier pairs describe the subject of the resource. A metaterm is generally a medical specialty or a biological science, which has semantic links with one or more MeSH keywords, qualifiers and resource types. The CISMeF terminology is exploited for several tasks: resource indexing performed manually, resource categorization performed automatically, visualization and navigation through the concept hierarchies and information retrieval using the Doc'CISMeF search engine. The CISMeF health gateway uses several MeSH thesaurus enhancements to optimize information retrieval, hierarchy navigation and automatic indexing.  相似文献   

13.
分类主题一体化词表是将分类法与主题法有机结合的一种先进的情报检索语言。本文探讨了联机形式的一体化词表在实现查找概念和显示语义关系这一词表本质作用方面的理论与实践, 首次提出了重定位、重入和重构三种用表行为的概念, 对比印刷型词表对联机一体化词表在这方面的改进和优越性进行了讨论, 分析论证了联机一体化词表进一步发展完善的途径和潜力。  相似文献   

14.
基于Internet的后控制全文检索系统的研究与综述   总被引:11,自引:0,他引:11  
基于自然语言的全文检索已经成为目前主要的信息检索技术。主要论述在Interne环境下,采用后控制检索机制(以后控制词表为代表)如何提高自然语言的检索效率和系统的友好性,并以国内外具有代表性的后控制词表检索系统为例,对该领域的研究状况进行综述性研究。  相似文献   

15.
网络叙词表的组织结构及优化模式研究   总被引:2,自引:0,他引:2  
网络叙词表是重要的网络信息组织工具,目前已投入使用的网络叙词表根据宏观结构的不同可以分为3种类型,它们主要用于网络信息资源描述和检索系统两个方面。虽然网络叙词表在组成上与印刷本叙词表没有大的差异,但在其生成和实现方式上有很多不同点,而且它在入口界面、词汇控制和标识系统3个微观结构方面也有着显著的特征和优势。同时,网络叙词表在宏观结构和微观结构方面也有必要进行一系列优化,以完善其使用功能。  相似文献   

16.
17.
电子政务主题词表自动构建研究   总被引:4,自引:0,他引:4  
电子政务主题词表是电子政务信息组织和检索的重要语义工具。传统手工编制叙词表的方法已不再适用于网络环境。电子政务词表的自动构建技术主要有基于N-gram方法的词汇收集和选择词间关系的自动识别。要想编制一部性能优越且容易应用的词表,应将计算机自动构建与传统方式编制结合起来,取长补短。表7。参考文献10。  相似文献   

18.
情报检索语言的发展方向问题--分类主题一体化新论   总被引:3,自引:0,他引:3  
对国内外五种著名分类主题一体化词表作了剖析,从新的视角揭示了一体化词表的实质,并根据情报检索语言的发展现状,阐明了分类主题一体化的前景,从而看清情报检索语言的发展方向。  相似文献   

19.
顾颖  何琳 《图书情报工作》2012,(19):109-113
认为中文文献数据库中存在大量的分类号与关键词(或主题词)对应的人工标引记录。通过对这些标引记录信息进行聚合处理,可以实现计算机自动编制分类主题词表。比较两种分类主题词表的编制模式,讨论机编分类主题词表的优势,针对机编分类主题词表已有的成果——知识库的不足之处提出改进方案。改进方案在小规模测试集中取得了良好的效果。最后分析将机编分类主题词表技术应用于新一代《中国分类主题词表》升级改造的良好前景。  相似文献   

20.
后控词表在文献检索系统中的应用   总被引:5,自引:2,他引:3  
本文分析了自由词标引系统的优缺点。文中具体描述了文献检索系统中倒排档与后控制词表一体化的构造方法、使用方法及其效果。最后讨论了后控制词表引入到文献检索系统后所产生的问题及进一步的解决办法。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号