共查询到20条相似文献,搜索用时 171 毫秒
1.
书后主题索引的自动编制初探 总被引:1,自引:0,他引:1
针对现有索引软件一般只能进行字面标引而不能实现概念标引的不足,提出了一个基于概念标引的书后主题索引自动编制方案,即将图书章节细化后利用基于单篇文献的自动标引系统进行图书主题标引。通过三种标引系统对实验语料的标引结果统计来选择标引系统;其次通过对篇章结构分析,提出基于标题符号的标引源自动识别方案,同时给各标引源设定权重,提出主题词标引流程;最后还探讨了标引单元确定以及索引地址设计。实验表明,基于N—gram方法的书后主题索引的自动编制方法是可行的。 相似文献
2.
图书内容主题索引的自动编制实验 总被引:1,自引:1,他引:0
针对现有索引软件一般只能进行字面标引而不能实现概念标引的不足,提出了一个基于概念标引的图书内容主题索引自动编制方案,即将图书章节细化后,利用基于单篇文献的自动标引系统进行图书主题标引。通过三种标引系统对实验语料的标引结果统计来选择标引系统;其次通过对篇章结构分析,提出基于标题符号的标引源自动识别方案,同时给各标引源设定权重,提出主题词标引流程;最后还探讨了标引单元确定以及索引地址设计。实验表明,基于N-gram方法的图书内容主题索引的自动编制方法是可行的。 相似文献
3.
论文全面介绍了索引的发展历程,从古代索引实践,到近、现代索引理论的提出和研究,其中,重点介绍了现代索引理论的各个方面。同时,对网络环境下索引的实践及发展现状进行了深入思考与探索。 相似文献
4.
5.
机编古籍索引探讨——以《道德经》语词索引自动编纂为例 总被引:1,自引:0,他引:1
索引软件在古籍文献研究中,特别是定量统计分析古籍文献时,可以发挥重要作用。利用软件编制古籍索引,速度快、误差少、准确性高。文章以《道德经》两种版本索引的编纂为例,对索引之星、WORD以及自编索引软件等索引工具的应用进行探讨,对古籍索引的自动编纂进行尝试,并利用所编索引对两种版本《道德经》的字频、词频进行分析。 相似文献
6.
视频信息索引技术研究进展 总被引:5,自引:0,他引:5
本文对视频数据索引的研究现状与技术发展进行了综述 ,介绍了MPEG标准 ;探讨了视频索引所涉及的内容 ,例如 ,视频的标引、分类和摘要等 ;对视频索引涉及到的相关技术和方法 ,如镜头分割、关键帧抽取等进行了阐述。 相似文献
7.
邵品洪 《现代图书情报技术》1994,10(3):26-28
本文扼要地介绍了日本学者围绕提高情报检索系统的性能,开展自然语言信息处理研究的一些成果:包括以英语科技文摘为对象所进行的自动索引研究和动词的用法分析,以及从混合使用汉字和假名的日语文本中自动抽出日语名词的研究等。 相似文献
8.
《全国报刊索引》是目前我国唯一的一家搜集全国各学科报刊杂志篇目的综合性检索刊物,该索引的编制工作长期采用手工方式,检索途径单一。为了改变这种落后状况,今年开始采用电子计算机自动编辑排版,自动编制索引。下面就对该索引微机编辑、排版、检索一体化系统作一简介。 相似文献
9.
10.
张琪玉 《图书馆理论与实践》2006,(5):28-29
作者以为,明确提出“检索情报源的索引”和“直接检索事实情报的索引”两个概念作为索引的两大基本类型,对索引学的深入研究具有重大指导意义。并从10个方面比较了两大类型索引的差异,探讨了两大类型索引的命名问题,最后根据两大类型索引的差异,提出关于索引教材内容安排的建议。 相似文献
11.
12.
13.
杨贺杨奕虹乔晓东李宁朱礼军 《现代图书情报技术》2010,26(6):17-24
讨论计算机辅助标引文献加工系统中自然语言词表系统的建立过程。基于海量文献人工标引,运用计量分析法对多年来积累的人工标引词从词频、词长、词类型、词共现等多方面进行分析,重点阐述运用字面相似度计算词间关系来建立适用于机标和后控词表的自然语言词表的过程。 相似文献
14.
15.
16.
基于多词表的自动标引技术研究——新华社新闻稿自动标引的实验 总被引:9,自引:0,他引:9
避开汉语分词中的技术特点 ,转向基于多词表自动标引抽词研究是当前中文信息自动主题与分类标引可以采取的一种策略 ,也是最为可行的方法。本文以新华社新闻稿中的题名和导语为对象 ,详细介绍了基于多词表自动标引技术中的词表构建、自动抽词、主题标引和自动分类等技术。并成功设计了新闻信息自动标引的实验系统 ,取得了较好的效果。 相似文献
17.
基于EMM中文抽词算法的XMARC主题信息挖掘 总被引:4,自引:0,他引:4
本文在分词词典上采用区间最大词长,改进正向减字最大匹配法为“词首 长词匹配 短词推进”自动标引方法,从而有效地减少领域的分词歧义性和缩短标引时间。最后将该研究付诸于XMARC主题信息的挖掘与检索的实现,并证明其在时间和质量综合性能上的优越性。 相似文献
18.
基于集成学习的自动标引方法研究 总被引:1,自引:0,他引:1
目前大多数自动标引方法不能有效利用文本中包含的多个特征.而支持向量机、条件随机场模型等统计机器学习模型能够有效利用文本包含的多种特征进行关键词提取.同时,由于各种自动标引模型性能各异,综合利用各种模型进行集成学习方式的自动标引,能够提高自动标引的质量.为了进一步提高自动标引的质量,本文试图整合统计机器学习模型与集成学习方法的优势,对文档进行基于多分类模型综合投票方式的自动标引.实验结果表明基于集成学习方法的自动标引能提高标引结果的查准率和召回率.另外,集成学习标引模型中,基分类器加权的标引结果,优于基分类器未加权的标引结果. 相似文献
19.
针对中文自动标引过程中经常会产生诸多歧义词,导致检出的信息不切题或漏检这一问题,在论述自动标引中歧义词消除方法的相关研究基础上,提出一种将穷举法和消歧规则相结合的歧义词消除方法。测试结果表明,这是一种行之有效的消除歧义词的方法。 相似文献
20.
针对中文学术文献,提出一种新的自动标引方法,该方法基于文献之间的引用关系,利用被引文献的标引词,对遗传算法进行改进,实现自动标引,避免利用文献正文、标题等内部文本特征进行自动标引的局限性。通过在大规模真实测试集(中文学术文献)上进行实验,验证该方法的有效性。 相似文献