共查询到10条相似文献,搜索用时 31 毫秒
1.
2.
3.
非控主题词,也称自由词,是指词表未收、可随需要增补、不作为正式标引检索用词、但可实际用于检索,具有较大的识别功能的词。非控主题词属于自然语言范畴,其专指度一般高于词表中的正式词。在CNMARC(中国机读目录格式)中,610字段反映非控主题词。 相似文献
4.
利用语料库、释义词典、用户检索日志作为识别相关词的语境,设计并实现相关词自动提取系统。实验结果表明,虽然面向相同的基本词汇集合,但是基于不同语境提取的相关词之间的重复率很低,各个结果间的互补性很强,说明结果整合非常有必要。在本系统中,通过直接整合途径构建最后的相关词词表。 相似文献
5.
积极为自然语言与情报检索语言的结合创造条件--建议大量编制自然语言词表(下) 总被引:7,自引:0,他引:7
2.5后控制词表 为自然语言检索系统配备后控制词表,是提高其检索效率的有效 措施。 后控制词表的性质类似于人口词表,它是一种转换工具,是一种 扩检工具,是一种罗列自然语言检索标识供选择的工具。 后控制词表的特点在于:其中的控制词(也可以是分类号)并非直接用于标引,而是对作为文献检索标识的自然语言词进行控制(建立等同、等级。相关关系)。因此,在后控制词表中,标引一检索用词是自然语言,非标引一检索用词却是人工语言,这与在一般词表中的情形正好相反。 后控制词表必须在检索系统中实有的自然语言检索标识的基础上… 相似文献
6.
秦健 《现代图书情报技术》2006,(1):44-46,9
元数据的应用需要开发适于所应用主题领域的规范词表来满足用户的检索需求,但目前对用户用什么词来进行查找却知之甚少。为了了解数字化教育图书馆用户在检索中使用什么样的词来进行查找,本文作者利用检索记录挖掘的方法来进行研究。在初步分析了40多万条检索记录中所含的100多万个检索词之后,作者重点分析了规范词在检索中被用户使用的情况,并且对比分析了哪些非规范词被用户使用.作者发现用户在查找信息的过程中对规范词的使用频率大大超过了非规范词的使用频率。对非规范词使用的进一步分析不仅可以提供补充更新规范词的来源,而且也可以为分析规范词非规范词之间建立对应的浯义关系提供重要的信息来源。 相似文献
7.
基于受控词表互操作的集成词库构建研究 总被引:2,自引:0,他引:2
目前,国内外信息领域都在致力于受控词表的互操作研究.本文以教育类数据为例,通过对检索语言互操作技术的研究,借鉴国内外实现不同受控词表之间互操作的经验和方法,建立一个以<中分表>为核心的兼容体系,即建立一个可以不断扩充的集成词库.为了便于浏览和使用词库数据,采用单机模式、XML格式及本体构建工具对词库兼容数据进行可视化显示,进而为用户提供各种服务. 相似文献
8.
基于概念空间方法的信息检索技术研究 总被引:14,自引:0,他引:14
为了解决词汇差异问题,词表构造在信息检索系统中有着重要意义。概念空间方法是利用计算机自动构造概念语义网络(词表)并以此为基础进行概念检索的一种方法。由词语作为语义网络的节点,词语之间的关联权重以一个给定文档集合中词语的共现率来计算,其大小代表它们之间的相似性。检索时系统采用人工智能方法激活与检索入口词相关的术语或概念,为用户提供交互式的检索用语建议。方法的具体步骤包括文档和对象列表收集、对象过滤和自动标引、共现分析和联想检索四个阶段。这种方法多用于英文检索系统,但对我国的信息检索系统也有重要的借鉴意义。 相似文献
9.
网络信息时代叙词表的编制与应用 总被引:3,自引:1,他引:2
统计我国叙词表的编制情况,分析在网络时代叙词表的发展趋势以及编制和应用特点。认为在叙词表编制方面,将会实现利用海量的数字信息资源,通过计算机抽取相关的专业术语和词间关系,在领域专家人工辅助干预下,建立适合现代网络信息资源特点和大众化的领域用户使用的叙词表。叙词表主要用于计算机系统后台的标引和检索,用户主要为使用网络检索专业信息的普通用户,数字界面和可视化将是叙词表的主要表现形式。 相似文献
10.
鉴于国内医学专业搜索引擎尚处于起步阶段,本文选用十个常用中文WWW搜索引擎分别对医学检索词的检索效果进行了比较研究,并对中文WWW搜索引擎的功能、特点、局限进行了讨论,从中选出对检索医学信息效果较好的几种中文WWW搜索引擎,并对完善中文WWW搜索引擎提出了几点建议. 相似文献