共查询到20条相似文献,搜索用时 78 毫秒
1.
论文全面介绍了索引的发展历程,从古代索引实践,到近、现代索引理论的提出和研究,其中,重点介绍了现代索引理论的各个方面。同时,对网络环境下索引的实践及发展现状进行了深入思考与探索。 相似文献
2.
引文主题与源文献主题具有相关性.基于这一事实,本文提出了一种基于汉语科技文献引文的自动标引法.具体过程是以词典为依据对源文献与引文题名进行抽词处理,并为不同类型引文赋予不同的权重,在此基础上确定用于标引源文献的关键词.本文还对此法的可行性进行了测试,并提出了改进方法. 相似文献
3.
19 自由标引中标引副标题概念词的问题
1 本文用词说明
本文所用“自由标引”一词是指不依据词表的人工标引,属于自然语言标引的范畴。期刊论文的在版标引一般都是自由标引。自由词补充标引是受控标引与自由标引的结合,不包括在本文讨论的范围内。 相似文献
4.
索引的标引,即可索引内容的提取和表达(给予检索标识)的操作过程,一方面,其对索引质量的影响极大;另一方面,其随意性也很大。可以说,这是一种需要智慧的近乎艺术创造的处理过程。虽有一般性的标引规则,但其对可索引内容的提取和表达的规定往往过于原则和简略,对实际标引工作的帮助有限。之所以如此,可能是因为标引规则和方法具有“只可意会,难于言传”的模糊性,很难用简单明了的方式说清楚。 相似文献
5.
本文分析了地方报刊资料索引数据库主题标引存在的问题,并结合工作实践,阐述了符合地方报刊资料索引特点的主题标引方法。 相似文献
6.
施利军 《现代图书情报技术》1992,8(4):42-45
本文介绍了用.数据库管理系统FOXBASE编写的自动标引系统,其中主要介绍的基本思想、实现过程及其特点。文中着重介绍了词标引、主题标引、赋词标引和抽调标引的方法,和在Compaq386机上建立的试验系统。 相似文献
7.
引文主题与源文献主题具有相关性。基于这一事实,本文提出了一种基于汉语科技文献引文的自动标引法。具体过程是以词典为依据对源文献与引文题名进行抽词处理,并为不同类型引文赋予不同的权重,在此基础上确定用于标引源文献的关键词。本文还对此法的可行性进行了测试,并提出了改进方法。 相似文献
8.
书后主题索引的自动编制初探 总被引:1,自引:0,他引:1
针对现有索引软件一般只能进行字面标引而不能实现概念标引的不足,提出了一个基于概念标引的书后主题索引自动编制方案,即将图书章节细化后利用基于单篇文献的自动标引系统进行图书主题标引。通过三种标引系统对实验语料的标引结果统计来选择标引系统;其次通过对篇章结构分析,提出基于标题符号的标引源自动识别方案,同时给各标引源设定权重,提出主题词标引流程;最后还探讨了标引单元确定以及索引地址设计。实验表明,基于N—gram方法的书后主题索引的自动编制方法是可行的。 相似文献
9.
10.
11.
基于多词表的自动标引技术研究——新华社新闻稿自动标引的实验 总被引:9,自引:0,他引:9
避开汉语分词中的技术特点 ,转向基于多词表自动标引抽词研究是当前中文信息自动主题与分类标引可以采取的一种策略 ,也是最为可行的方法。本文以新华社新闻稿中的题名和导语为对象 ,详细介绍了基于多词表自动标引技术中的词表构建、自动抽词、主题标引和自动分类等技术。并成功设计了新闻信息自动标引的实验系统 ,取得了较好的效果。 相似文献
12.
13.
14.
15.
针对中文自动标引过程中经常会产生诸多歧义词,导致检出的信息不切题或漏检这一问题,在论述自动标引中歧义词消除方法的相关研究基础上,提出一种将穷举法和消歧规则相结合的歧义词消除方法。测试结果表明,这是一种行之有效的消除歧义词的方法。 相似文献
16.
统计分析法自动标引的改进 总被引:12,自引:2,他引:10
情报检索的目的是为用户服务,因而标引词的提取应以其与文献主题内容相关程度为标准。文章基于原有的统计分析标引法,对其权值设计予以重新考虑,并与文献词频统计相结合,使分词与标引相统一,标引词更好地反映文献主题概念,提高检索效率。 相似文献
17.
基于集成学习的自动标引方法研究 总被引:1,自引:0,他引:1
目前大多数自动标引方法不能有效利用文本中包含的多个特征.而支持向量机、条件随机场模型等统计机器学习模型能够有效利用文本包含的多种特征进行关键词提取.同时,由于各种自动标引模型性能各异,综合利用各种模型进行集成学习方式的自动标引,能够提高自动标引的质量.为了进一步提高自动标引的质量,本文试图整合统计机器学习模型与集成学习方法的优势,对文档进行基于多分类模型综合投票方式的自动标引.实验结果表明基于集成学习方法的自动标引能提高标引结果的查准率和召回率.另外,集成学习标引模型中,基分类器加权的标引结果,优于基分类器未加权的标引结果. 相似文献
18.
19.
自动标引通用评价模型研究 总被引:1,自引:0,他引:1
目前大多文档都不具有关键词,但手工标引关键词费时费力且主观性较强,因此关键词自动标引是一项值得研究的技术,由此引发的标引结果有效评价问题也成为一个亟需解决的问题.然而,评估关键词自动标引的性能并非一件容易的事情.针对常规自动标引评价方法存在的评价结果不能完全反映真实的标引结果以及评价成本高的情况,本文提出一种通用的自动标引评价模型.该模型可以有效地利用外部资源,在有参照情况下与无参照情况下,分别对标引结果进行评价.实验结果表明,自动标引通用评价模型能增加标引评价的可靠性,并且降低标引评价的成本. 相似文献
20.
题名自动分类标引探讨 总被引:2,自引:0,他引:2
本文重点论述计算机分类标引的一种方法:字面相似度语义逻辑分析法。根据字面相似度值的三种不同情况,通过语义逻辑关系分析,确定A级、B级阈值。A级为归类中心词。从而达到最终归类的目的,使归类结果更具科学性。 相似文献