首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 171 毫秒
1.
书后主题索引的自动编制初探   总被引:1,自引:0,他引:1  
针对现有索引软件一般只能进行字面标引而不能实现概念标引的不足,提出了一个基于概念标引的书后主题索引自动编制方案,即将图书章节细化后利用基于单篇文献的自动标引系统进行图书主题标引。通过三种标引系统对实验语料的标引结果统计来选择标引系统;其次通过对篇章结构分析,提出基于标题符号的标引源自动识别方案,同时给各标引源设定权重,提出主题词标引流程;最后还探讨了标引单元确定以及索引地址设计。实验表明,基于N—gram方法的书后主题索引的自动编制方法是可行的。  相似文献   

2.
图书内容主题索引的自动编制实验   总被引:1,自引:1,他引:0  
针对现有索引软件一般只能进行字面标引而不能实现概念标引的不足,提出了一个基于概念标引的图书内容主题索引自动编制方案,即将图书章节细化后,利用基于单篇文献的自动标引系统进行图书主题标引。通过三种标引系统对实验语料的标引结果统计来选择标引系统;其次通过对篇章结构分析,提出基于标题符号的标引源自动识别方案,同时给各标引源设定权重,提出主题词标引流程;最后还探讨了标引单元确定以及索引地址设计。实验表明,基于N-gram方法的图书内容主题索引的自动编制方法是可行的。  相似文献   

3.
论文全面介绍了索引的发展历程,从古代索引实践,到近、现代索引理论的提出和研究,其中,重点介绍了现代索引理论的各个方面。同时,对网络环境下索引的实践及发展现状进行了深入思考与探索。  相似文献   

4.
现代索引理论与方法概述   总被引:1,自引:1,他引:0  
本文从现代索引法、计算机在索引编制中的应用入手,概括了国内外自动标引、索引生成理论与方法,并对中、英文各种机助索引系统进行了论述.  相似文献   

5.
索引软件在古籍文献研究中,特别是定量统计分析古籍文献时,可以发挥重要作用。利用软件编制古籍索引,速度快、误差少、准确性高。文章以《道德经》两种版本索引的编纂为例,对索引之星、WORD以及自编索引软件等索引工具的应用进行探讨,对古籍索引的自动编纂进行尝试,并利用所编索引对两种版本《道德经》的字频、词频进行分析。  相似文献   

6.
视频信息索引技术研究进展   总被引:5,自引:0,他引:5  
苏新宁 《情报学报》2004,23(4):410-416
本文对视频数据索引的研究现状与技术发展进行了综述 ,介绍了MPEG标准 ;探讨了视频索引所涉及的内容 ,例如 ,视频的标引、分类和摘要等 ;对视频索引涉及到的相关技术和方法 ,如镜头分割、关键帧抽取等进行了阐述。  相似文献   

7.
本文扼要地介绍了日本学者围绕提高情报检索系统的性能,开展自然语言信息处理研究的一些成果:包括以英语科技文摘为对象所进行的自动索引研究和动词的用法分析,以及从混合使用汉字和假名的日语文本中自动抽出日语名词的研究等。  相似文献   

8.
《全国报刊索引》是目前我国唯一的一家搜集全国各学科报刊杂志篇目的综合性检索刊物,该索引的编制工作长期采用手工方式,检索途径单一。为了改变这种落后状况,今年开始采用电子计算机自动编辑排版,自动编制索引。下面就对该索引微机编辑、排版、检索一体化系统作一简介。  相似文献   

9.
徐月英 《中国索引》2006,4(4):22-24
探讨制约索引发展的几种主要因素,分析索引教育存在的问题,以及索引教育面临的机遇与对策。  相似文献   

10.
作者以为,明确提出“检索情报源的索引”和“直接检索事实情报的索引”两个概念作为索引的两大基本类型,对索引学的深入研究具有重大指导意义。并从10个方面比较了两大类型索引的差异,探讨了两大类型索引的命名问题,最后根据两大类型索引的差异,提出关于索引教材内容安排的建议。  相似文献   

11.
论自动标引的实际应用   总被引:2,自引:0,他引:2  
探讨电子环境下自动标引的特点、标引观念的转变以及影响自动标引的因素等问题。  相似文献   

12.
近五年来自动标引研究在关键词抽取、标引系统设计、自动分类标引、网络信息自动标引、数字图像标引、音频信息标引、视频信息标引、自动标引结果评价等方面取得很大进展,但尚存弱点与不足之处,还不能达到人工标引的效果。今后的研究将朝着探索更优越的语言分析技术、更高端的多媒体信息自动标引方法、高效的知识库智能自学习机制、多种标引方法或模型的互补的集成学习等方向发展。  相似文献   

13.
讨论计算机辅助标引文献加工系统中自然语言词表系统的建立过程。基于海量文献人工标引,运用计量分析法对多年来积累的人工标引词从词频、词长、词类型、词共现等多方面进行分析,重点阐述运用字面相似度计算词间关系来建立适用于机标和后控词表的自然语言词表的过程。  相似文献   

14.
针对国内外著名数据库受控标引的标引方式、标引字段的现状和发展趋势进行深入分析,指出目前虽然受控标引以机器辅助标引为主,但自动标引也有成功案例。标引字段除标引文献主题内容外已扩至对文献中的图表、重要数值、化学分子式等进行标引,并采用与分类标引、非受控语言标引相结合的多维度标引模式。最后,基于目前国内外受控标引发展水平的差异,提出国内应从三个方面予以改进。  相似文献   

15.
生物学文献自动标引系统的理论和实践   总被引:4,自引:0,他引:4  
韩客松  王永成  王刚 《情报学报》2000,19(3):259-264
在统计分析生物学中文文献的一些特点和手工标引的经验的基础上 ,本文介绍了以文献标题和摘要为标引源的自动标引方法。文章着重介绍了折半匹配的抽词和基于非线性加权体系的标引词抽取的理论和实践。  相似文献   

16.
查贵庭  侯汉清 《情报学报》2002,21(3):273-277
避开汉语分词中的技术特点 ,转向基于多词表自动标引抽词研究是当前中文信息自动主题与分类标引可以采取的一种策略 ,也是最为可行的方法。本文以新华社新闻稿中的题名和导语为对象 ,详细介绍了基于多词表自动标引技术中的词表构建、自动抽词、主题标引和自动分类等技术。并成功设计了新闻信息自动标引的实验系统 ,取得了较好的效果。  相似文献   

17.
基于EMM中文抽词算法的XMARC主题信息挖掘   总被引:4,自引:0,他引:4  
王兰成 《情报学报》2005,24(1):82-86
本文在分词词典上采用区间最大词长,改进正向减字最大匹配法为“词首 长词匹配 短词推进”自动标引方法,从而有效地减少领域的分词歧义性和缩短标引时间。最后将该研究付诸于XMARC主题信息的挖掘与检索的实现,并证明其在时间和质量综合性能上的优越性。  相似文献   

18.
基于集成学习的自动标引方法研究   总被引:1,自引:0,他引:1  
目前大多数自动标引方法不能有效利用文本中包含的多个特征.而支持向量机、条件随机场模型等统计机器学习模型能够有效利用文本包含的多种特征进行关键词提取.同时,由于各种自动标引模型性能各异,综合利用各种模型进行集成学习方式的自动标引,能够提高自动标引的质量.为了进一步提高自动标引的质量,本文试图整合统计机器学习模型与集成学习方法的优势,对文档进行基于多分类模型综合投票方式的自动标引.实验结果表明基于集成学习方法的自动标引能提高标引结果的查准率和召回率.另外,集成学习标引模型中,基分类器加权的标引结果,优于基分类器未加权的标引结果.  相似文献   

19.
针对中文自动标引过程中经常会产生诸多歧义词,导致检出的信息不切题或漏检这一问题,在论述自动标引中歧义词消除方法的相关研究基础上,提出一种将穷举法和消歧规则相结合的歧义词消除方法。测试结果表明,这是一种行之有效的消除歧义词的方法。  相似文献   

20.
针对中文学术文献,提出一种新的自动标引方法,该方法基于文献之间的引用关系,利用被引文献的标引词,对遗传算法进行改进,实现自动标引,避免利用文献正文、标题等内部文本特征进行自动标引的局限性。通过在大规模真实测试集(中文学术文献)上进行实验,验证该方法的有效性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号