首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
传统上,检索系统利用基于词语共现分析所生成的自构造词表,即词词关联矩阵来实现模糊检索,这种方式生成的词表存在词间关系单一、语词假相关、词义控制差等问题.本文结合传统叙词表,对自构造词表的词间关联度算法进行了改进,新算法丰富了词间关系类型.实证分析表明,新算法有助于提升系统的检索效率.本文首先阐明词间关联度现有算法及关系数据处理方式,并指出现有算法存在的问题,然后引入叙词表控制机制,针对四种词间关系控制情形提出了各自的词间关联度改进算法.最后通过集合从理论上分析改进算法和现有算法,并借助语词关系网实证改进算法对语词关系网的关联性的影响.  相似文献   

2.
熊霞  常春 《图书情报工作》2010,54(12):50-108
通过调查总结叙词表在文献数据库中的应用现状,在此基础上设计一个基于叙词表的文献数据库知识单元检索系统。该系统首先将数据库中的文献分解为知识单元,检索时用叙词表中的正式叙词对用户输入的检索词进行规范化处理,并将该正式叙词作为中心词,利用叙词表中的词间关系查找出该词的等同词、上下位词和相关词作为扩展检索词,对知识单元进行加权检索,按权值之和以及检索词的密集程度排序输出。经实例分析,具有可行性。  相似文献   

3.
2.5后控制词表 为自然语言检索系统配备后控制词表,是提高其检索效率的有效 措施。 后控制词表的性质类似于人口词表,它是一种转换工具,是一种 扩检工具,是一种罗列自然语言检索标识供选择的工具。 后控制词表的特点在于:其中的控制词(也可以是分类号)并非直接用于标引,而是对作为文献检索标识的自然语言词进行控制(建立等同、等级。相关关系)。因此,在后控制词表中,标引一检索用词是自然语言,非标引一检索用词却是人工语言,这与在一般词表中的情形正好相反。 后控制词表必须在检索系统中实有的自然语言检索标识的基础上…  相似文献   

4.
李纲  叶光辉 《图书情报工作》2013,57(21):104-111
语义网的发展为模糊语词转模糊概念检索提供了可能,鉴于词表在模糊检索系统中的主导地位,实现模糊概念检索必须先完成词表向本体的转换。在综合分析和评价已有转换方法的基础之上,提出综合转换法。该方法继承间接转换法规范的概念抽取及关联设计规则,又通过综合评议和词信息量、词间关联度、文档频率等参数的算法设计改变了直接转换法过于程式化的处理方式。最终将词词关联矩阵转换为概念矩阵,叙词表升级为本体库,并在现有检索算法的基础上设置了检索原子与概念的映射关系,以实现概念检索。  相似文献   

5.
提出了采用检索语言兼容性的研究方法建立分类法、主题法和学科代码表之间相互兼容关系的《分类集成词表》,实现类目名称、主题词与中图分类号、科图分类号之间的兼容互换关系,并利用这个关系,在书目检索系统中进行扩展检索方式研究,进而实现采用检索词入口,经过检索系统中检索语言之间的兼容性互换(检索词与分类号互换),最后检索系统用分类号进行检索结果提取。  相似文献   

6.
网络环境中汉语叙词表的自动构建研究   总被引:2,自引:0,他引:2  
为解决网络信息检索效率低的问题,需要把叙词表等控制机制引入到网络检索系统中,但传统词表编制方式已经不能满足网络信息检索的需要.本文制定了一种汉语叙词表自动构建方案,以财税领域为例,采用模式识别、词聚类、同现分析等自然语言处理技术实现自动识别词间等同关系、等级关系和相关关系,从而构建一部财税领域叙词表,最后对所构建的叙词表进行测评.相比传统叙词表编制方法,自动构建叙词表能降低编表专家的智力负担,而且编表时间短,费用低,时效性强,符合普通用户的检索习惯.但对词间关系的识别不如人工编表时精当可靠,所以需要人工辅助判定.  相似文献   

7.
一种能综合利用多种检索技术优势的数据库检索功能设计   总被引:3,自引:0,他引:3  
首先说明,通过分面分类、后控检索和超链接检索技术的利用,信息检索中分类、主题检索优势难以兼得,采用自然语言又影响查全率,扩检、缩检难以同时方便进行的问题是可以解决的。然后又说明,采用分面分类技术可编制一个分类主题一体化的联机词表,在联机词表的基础上可生成具有各种词间关系的后控词表,由于在后控词表网状词间关系的基础上还可以引入超链接检索技术,因此如上三种技术的综合利用成为可能,一个具有分类、主题检索两方面优势,使用自然语言、又能保障检索质量,并能方便的进行扩检、缩检检索功能设计得以实现。  相似文献   

8.
基于内容图像检索中纹理分析的研究   总被引:1,自引:0,他引:1  
首先介绍了三种常用于基于内容图像检索系统中的纹理分析方法。在游程长度统计分析法的基础上提出了一种新的算法——游程累加算法,并设计了一个基于纹理特征进行图像检索的系统。对两种算法进行比较,试验结果表明游程累加算法能更好的反映图像的纹理特征。  相似文献   

9.
等级关系循环错误检查算法的设计与实现*   总被引:1,自引:0,他引:1  
分析词间关系错误检查在叙词表编制和本体转化中的必要性,并从机辅编表系统、具体检查方法等方面对叙词表错误检查的相关研究进行概括性介绍。根据研究目标,着重分析等级关系中循环错误的具体形式,设计并实现一个用于检查等级关系循环错误的算法。分别对自定义数据和叙词表数据进行实验,结果显示,该算法能有效地检查出等级关系中的所有循环错误。  相似文献   

10.
叙词表中词间关系分为等同关系(EquivaLence Relationship)、等级关系(Hierarchical Relationship)和相关关系(Associative Relationship),词间关系的控制是叙词表编制的关键技术,文章主要针对叙词表词间的等级关系和相关关系,比较国际标准ISO2788、中国标准GB13190—91以及关国标准NISO Z39.19—2005对其的规定,分析异同,总结联系,从三个标准的实用性、检索效率等方面予以分析,并为中国叙词表编制标准提出改进建议。  相似文献   

11.
分类法主题法一体化自动标引系统的基本原理和方法   总被引:7,自引:0,他引:7  
本文阐述基于文献题名的自动标引系统的原理和方法,该系统是分类法主题法一体化的。文中说明了依据文献题名对文献进行分类和主题标引的可行性、从题名中自动轴词、以体系分类法为基础的自动分类用分类词表、自动分类规则及以分面分类法为基础的文献自动分类、自由体系自动分类、半自动抽词、检索系统的分类法主题法一体化检索功能保证检索系统质量的关键因素等问题。  相似文献   

12.
肖燕 《全国新书目》2008,(16):91-93
非控主题词,也称自由词,是指词表未收、可随需要增补、不作为正式标引检索用词、但可实际用于检索,具有较大的识别功能的词。非控主题词属于自然语言范畴,其专指度一般高于词表中的正式词。在CNMARC(中国机读目录格式)中,610字段反映非控主题词。  相似文献   

13.
分析了传统叙词表在网络信息检索系统应用中存在的不足之处,并提出了改进方案,即在传统叙词表的基础上构建一个包括核心词库、扩展词库以及两者间映射关系的扩展型叙词表,该词表可用于对用户检索词进行规范化处理,从而改善检索效果。  相似文献   

14.
通过模糊集合检索模型的规范描述,本文首先定义了检索系统中检索效率和系统效率之间的函数关系,并应用该函数关系对比分析模糊集合检索系统和标准布尔检索系统的性能,指出模糊集合检索系统所面临的"囚徒困境":检索效率的提升引起了系统效率的下降.之后针对"囚徒困境",从词词关联矩阵方面来改进模糊集合检索策略,寻求到解决"囚徒困境"的思路和技术手段.最后借助SQL语言演示词词关联矩阵的两种构造策略,建立数学模型分析词词关联矩阵构造的最优时机,并确立该思路为一种新的系统开发模式.根据时机来合理选择词词关联矩阵构造策略有助于改善现有模糊集合检索算法的执行效率,实现检索效率和系统效率的双赢.  相似文献   

15.
自动构造布尔检索提问式算法研究   总被引:6,自引:0,他引:6  
本文分析和评价了自动构造布尔检索提问式的两种典型算法,在此基础上提出了一种新的算法──基于样本文献提问构造布尔检索提问式算法。核算法以样本文献提问为基础计算检索词的权重,根据检索词权重值的分布规律来构造布尔检索提问式。此算法的主要目的是简化用户在检索中与情报检索系统的交互过程,从而提高检索效率。笔者利用AUBO检索系统对算法进行了验证。结果表明、,该算法在相同的查全水平上的查准率普遍高于手编提问式的检索结果。  相似文献   

16.
基于概念空间方法的信息检索技术研究   总被引:14,自引:0,他引:14  
为了解决词汇差异问题,词表构造在信息检索系统中有着重要意义。概念空间方法是利用计算机自动构造概念语义网络(词表)并以此为基础进行概念检索的一种方法。由词语作为语义网络的节点,词语之间的关联权重以一个给定文档集合中词语的共现率来计算,其大小代表它们之间的相似性。检索时系统采用人工智能方法激活与检索入口词相关的术语或概念,为用户提供交互式的检索用语建议。方法的具体步骤包括文档和对象列表收集、对象过滤和自动标引、共现分析和联想检索四个阶段。这种方法多用于英文检索系统,但对我国的信息检索系统也有重要的借鉴意义。  相似文献   

17.
以武汉大学专家检索系统WHU-ES为平台,借鉴基于相关文档集的归并排序法和基于词典进行查询扩展的方法,对图情领域专家检索进行实验与评价,包括专家排序和专长识别两个方面.利用基于词典进行查询扩展的方法对基于相关文档集的归并排序法进行改进,实验结果表明,利用专长词表可以有效地提高专家检索的查准率和专长识别的效果.未来研究中需进一步解决词表的规范性生成问题.  相似文献   

18.
针对基于内容的图像检索方法这一日前有效地查询大量图片资料的关键技术,论述了利用面向对象的多媒体数据处理技术构建一个基于内容的图像检索系统的方法,重点讨论了图像纹理特征提取的改进算法,系统通过该算法以及和其它图像检索方法的配合使用.可顺利地实现图书馆数字图片资料的快速检索。  相似文献   

19.
中文题录单汉字与关键词混合检索系统   总被引:2,自引:0,他引:2  
作者在微机上自建了一个记录数为8599的中文题录单汉字与关键词混合检索系统,它在一定程度上弥补了有的单汉字检索系统没有词检索功能及某些单汉字检索系统索引空间较大的缺陷.同时还使用户的检索结果得到了更为充分的利用。  相似文献   

20.
基于传统知识组织资源的本体自动构建   总被引:3,自引:1,他引:2  
本文介绍了基于现有的知识组织工具和书目数据资源自动构建本体的方法:首先根据书目数据揭示的领域知识建立一个用OWL描述的数据模型,然后从词表、类表和书目数据集中自动抽取对象和关系的实例,写入OWL数据模型,形成书目本体.这是构建本体的一条经济、高效、合理且实用的道路.基于该本体,不仅可以实现概念浏览和语义检索,还可以增强搜索引擎的功能,通过词汇服务实现检索词提示和搜索结果归类.基于<中国分类主题词表>和计算机类的书目数据,本文实现了一个语义检索系统KVision,展现了传统知识组织资源对于网络信息资源利用的潜在价值.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号