首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 78 毫秒
1.
论文全面介绍了索引的发展历程,从古代索引实践,到近、现代索引理论的提出和研究,其中,重点介绍了现代索引理论的各个方面。同时,对网络环境下索引的实践及发展现状进行了深入思考与探索。  相似文献   

2.
引文主题与源文献主题具有相关性.基于这一事实,本文提出了一种基于汉语科技文献引文的自动标引法.具体过程是以词典为依据对源文献与引文题名进行抽词处理,并为不同类型引文赋予不同的权重,在此基础上确定用于标引源文献的关键词.本文还对此法的可行性进行了测试,并提出了改进方法.  相似文献   

3.
张琪玉 《中国索引》2006,4(1):55-56
19 自由标引中标引副标题概念词的问题 1 本文用词说明 本文所用“自由标引”一词是指不依据词表的人工标引,属于自然语言标引的范畴。期刊论文的在版标引一般都是自由标引。自由词补充标引是受控标引与自由标引的结合,不包括在本文讨论的范围内。  相似文献   

4.
张琪玉 《中国索引》2006,4(4):41-41
索引的标引,即可索引内容的提取和表达(给予检索标识)的操作过程,一方面,其对索引质量的影响极大;另一方面,其随意性也很大。可以说,这是一种需要智慧的近乎艺术创造的处理过程。虽有一般性的标引规则,但其对可索引内容的提取和表达的规定往往过于原则和简略,对实际标引工作的帮助有限。之所以如此,可能是因为标引规则和方法具有“只可意会,难于言传”的模糊性,很难用简单明了的方式说清楚。  相似文献   

5.
本文分析了地方报刊资料索引数据库主题标引存在的问题,并结合工作实践,阐述了符合地方报刊资料索引特点的主题标引方法。  相似文献   

6.
本文介绍了用.数据库管理系统FOXBASE编写的自动标引系统,其中主要介绍的基本思想、实现过程及其特点。文中着重介绍了词标引、主题标引、赋词标引和抽调标引的方法,和在Compaq386机上建立的试验系统。  相似文献   

7.
引文主题与源文献主题具有相关性。基于这一事实,本文提出了一种基于汉语科技文献引文的自动标引法。具体过程是以词典为依据对源文献与引文题名进行抽词处理,并为不同类型引文赋予不同的权重,在此基础上确定用于标引源文献的关键词。本文还对此法的可行性进行了测试,并提出了改进方法。  相似文献   

8.
书后主题索引的自动编制初探   总被引:1,自引:0,他引:1  
针对现有索引软件一般只能进行字面标引而不能实现概念标引的不足,提出了一个基于概念标引的书后主题索引自动编制方案,即将图书章节细化后利用基于单篇文献的自动标引系统进行图书主题标引。通过三种标引系统对实验语料的标引结果统计来选择标引系统;其次通过对篇章结构分析,提出基于标题符号的标引源自动识别方案,同时给各标引源设定权重,提出主题词标引流程;最后还探讨了标引单元确定以及索引地址设计。实验表明,基于N—gram方法的书后主题索引的自动编制方法是可行的。  相似文献   

9.
针对现有索引软件一般只能进行字面标引而不能实现概念标引的不足,提出了一个基于概念标引的图书内容主题索引自动编制方案,即将图书章节细化后,利用基于单篇文献的自动标引系统进行图书主题标引。通过三种标引系统对实验语料的标引结果统计来选择标引系统;其次通过对篇章结构分析,提出基于标题符号的标引源自动识别方案,同时给各标引源设定权重,提出主题词标引流程;最后还探讨了标引单元确定以及索引地址设计。实验表明,基于N-gram方法的图书内容主题索引的自动编制方法是可行的。  相似文献   

10.
目前,电子在档案工作中的普遍应用,使档案信息检索方式发生了深刻的变革,建立档案机读目录数据库的工作成为档案工作现代化的重要组成部分。  相似文献   

11.
查贵庭  侯汉清 《情报学报》2002,21(3):273-277
避开汉语分词中的技术特点 ,转向基于多词表自动标引抽词研究是当前中文信息自动主题与分类标引可以采取的一种策略 ,也是最为可行的方法。本文以新华社新闻稿中的题名和导语为对象 ,详细介绍了基于多词表自动标引技术中的词表构建、自动抽词、主题标引和自动分类等技术。并成功设计了新闻信息自动标引的实验系统 ,取得了较好的效果。  相似文献   

12.
论自动标引的实际应用   总被引:2,自引:0,他引:2  
探讨电子环境下自动标引的特点、标引观念的转变以及影响自动标引的因素等问题。  相似文献   

13.
汉语自动标引方法述评   总被引:3,自引:0,他引:3  
李培 《津图学刊》2000,(1):10-19
本文对一些典型的汉语自动标引方法进行了研究 ,概述了其处理过程 ,分析了其基本原理 ,并评价了其性能  相似文献   

14.
近五年来自动标引研究在关键词抽取、标引系统设计、自动分类标引、网络信息自动标引、数字图像标引、音频信息标引、视频信息标引、自动标引结果评价等方面取得很大进展,但尚存弱点与不足之处,还不能达到人工标引的效果。今后的研究将朝着探索更优越的语言分析技术、更高端的多媒体信息自动标引方法、高效的知识库智能自学习机制、多种标引方法或模型的互补的集成学习等方向发展。  相似文献   

15.
针对中文自动标引过程中经常会产生诸多歧义词,导致检出的信息不切题或漏检这一问题,在论述自动标引中歧义词消除方法的相关研究基础上,提出一种将穷举法和消歧规则相结合的歧义词消除方法。测试结果表明,这是一种行之有效的消除歧义词的方法。  相似文献   

16.
统计分析法自动标引的改进   总被引:12,自引:2,他引:10  
赵云志 《情报学报》2000,19(4):333-337
情报检索的目的是为用户服务,因而标引词的提取应以其与文献主题内容相关程度为标准。文章基于原有的统计分析标引法,对其权值设计予以重新考虑,并与文献词频统计相结合,使分词与标引相统一,标引词更好地反映文献主题概念,提高检索效率。  相似文献   

17.
基于集成学习的自动标引方法研究   总被引:1,自引:0,他引:1  
目前大多数自动标引方法不能有效利用文本中包含的多个特征.而支持向量机、条件随机场模型等统计机器学习模型能够有效利用文本包含的多种特征进行关键词提取.同时,由于各种自动标引模型性能各异,综合利用各种模型进行集成学习方式的自动标引,能够提高自动标引的质量.为了进一步提高自动标引的质量,本文试图整合统计机器学习模型与集成学习方法的优势,对文档进行基于多分类模型综合投票方式的自动标引.实验结果表明基于集成学习方法的自动标引能提高标引结果的查准率和召回率.另外,集成学习标引模型中,基分类器加权的标引结果,优于基分类器未加权的标引结果.  相似文献   

18.
全文数据库建库原理与应用技术   总被引:21,自引:2,他引:21  
王兰成  蒋丹  刘庆辉 《情报学报》1999,18(4):321-328
全文数据库是处理文献信息中知识与数据的有力工具,近年来得到迅猛发展。本文首先详细分析了全文数据库的特点,提出了建立全文数据库的各种数据结构,系统介绍全文数据库的开发步骤。然后论述全文数据库的标引和检索技术,提出一些新的处理技术。最后就全文数据库实际应用中的一些问题,提供了解决方案。  相似文献   

19.
自动标引通用评价模型研究   总被引:1,自引:0,他引:1  
目前大多文档都不具有关键词,但手工标引关键词费时费力且主观性较强,因此关键词自动标引是一项值得研究的技术,由此引发的标引结果有效评价问题也成为一个亟需解决的问题.然而,评估关键词自动标引的性能并非一件容易的事情.针对常规自动标引评价方法存在的评价结果不能完全反映真实的标引结果以及评价成本高的情况,本文提出一种通用的自动标引评价模型.该模型可以有效地利用外部资源,在有参照情况下与无参照情况下,分别对标引结果进行评价.实验结果表明,自动标引通用评价模型能增加标引评价的可靠性,并且降低标引评价的成本.  相似文献   

20.
题名自动分类标引探讨   总被引:2,自引:0,他引:2  
本文重点论述计算机分类标引的一种方法:字面相似度语义逻辑分析法。根据字面相似度值的三种不同情况,通过语义逻辑关系分析,确定A级、B级阈值。A级为归类中心词。从而达到最终归类的目的,使归类结果更具科学性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号