首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
本文主要介绍利用微机通用管理系统ISIS的PASCAL语言开发的并集成于该系统的“汉语科技文献自动标引系统CADAIS”的系统构成,功能,自动标引原理,词典结构与建立方法,标引算法和实验情况等。  相似文献   

2.
再探文献的自动标引   总被引:1,自引:0,他引:1  
从文献自动标引检索语言的选择,建立文献自动标引系统的基本路径及关键词的选词措施等三个方面,探讨了文献实施微机自动标引的基本方略。  相似文献   

3.
本文介绍了几种自动标引加权方法,以及把这几种方法应用于汉语文献自动标引试验的情况,给出了试验的有关数据、基于数据的分析和推出的结论,并对汉语科技文献自动标引中的若干问题进行了探讨。  相似文献   

4.
两种自动标引法的比较及改造   总被引:5,自引:0,他引:5  
本文主要对汉语文献自动标引的两种方法——切分标记法和单汉字标引法在标引和检索实现上的不同作了比较, 并对两种方法的算法实现提出了一些建议和设想, 旨在推进对自动标引的进一步研究和完善。  相似文献   

5.
为缓解海量文献关键词标引的巨大压力,文章构建了用于海量文献关键词标引的计算机辅助加工系统,对标引数据预处理规范、自动标引核心工作区和人工标引校对平台进行了具体阐述。文章采用数据测试方法确定了自动标引软件,在单一软件不能满足标引要求后探索了多种机标结果后处理方式提升机标质量,最终由人工标引校对平台保证海量文献关键词标引质量的同时,将机标出现的问题和改进意见反馈给软件设计和词表维护,保证了计算机辅助加工系统的持续改进。  相似文献   

6.
关于中医临床文献自动主题标引系统的研究   总被引:2,自引:0,他引:2  
中医临床文献自动主题标引系统针对中医药文献的特点,结合手工标引和自动标引的长处,在自动标引的基础上,再由人工利用计算机辅助对机器自动标引的结果进行干预,从而在真正意义上将计算机的快速、准确和人脑的智慧结合起来,大大缩短了建设数据库的中间过程,提高了文献标引的质量和效率。  相似文献   

7.
书后主题索引的自动编制初探   总被引:1,自引:0,他引:1  
针对现有索引软件一般只能进行字面标引而不能实现概念标引的不足,提出了一个基于概念标引的书后主题索引自动编制方案,即将图书章节细化后利用基于单篇文献的自动标引系统进行图书主题标引。通过三种标引系统对实验语料的标引结果统计来选择标引系统;其次通过对篇章结构分析,提出基于标题符号的标引源自动识别方案,同时给各标引源设定权重,提出主题词标引流程;最后还探讨了标引单元确定以及索引地址设计。实验表明,基于N—gram方法的书后主题索引的自动编制方法是可行的。  相似文献   

8.
为了解决中国化学文献数据库(CCDOC) 的建库时差和数据库质量问题, 我们研制了一个在微机 WINDOWS 环境下运行的机助标引软件, 并用该软件建立了微机机助标引系统。本文为总论部分, 论述了软件研制的意义、软件的功能以及机助标引系统的建立对我们目前进行的自由词标引- 后控规范工作带来的益处, 并简述了系统的发展方向。  相似文献   

9.
档案主题标引实用算法   总被引:2,自引:1,他引:1  
本文介绍了档案文献主题词自动标引算法,该算法合理地构造了主题词切分词典,并将切分关键词和标引主题词的实现过程融为一体,使标引与检索算法变得简单清晰。本文还给出了主题词切分词典的维护算法,以及自动扩缩检算法。利用本算法思路编制的软件已用于实际的档案管理系统中。  相似文献   

10.
图书内容主题索引的自动编制实验   总被引:1,自引:1,他引:0  
针对现有索引软件一般只能进行字面标引而不能实现概念标引的不足,提出了一个基于概念标引的图书内容主题索引自动编制方案,即将图书章节细化后,利用基于单篇文献的自动标引系统进行图书主题标引。通过三种标引系统对实验语料的标引结果统计来选择标引系统;其次通过对篇章结构分析,提出基于标题符号的标引源自动识别方案,同时给各标引源设定权重,提出主题词标引流程;最后还探讨了标引单元确定以及索引地址设计。实验表明,基于N-gram方法的图书内容主题索引的自动编制方法是可行的。  相似文献   

11.
汉语分词技术综述   总被引:2,自引:1,他引:1  
首先介绍了汉语自动分词技术及基于词索引的中文全文检索技术,接着分别从文献自动标引、文摘自动生成、文本自动分类、文本信息过滤、自然语言检索接口和智能检索等方面详细地阐述了汉语自动分词技术在中文全文检索中的应用,并对目前汉语自动分词技术存在的局限性进行了分析,提出了发展思路,最后对汉语自动分词技术在中文全文检索中的应用前景进行了预测。  相似文献   

12.
中文农业科技文献自动标引系统SDIC/CASDAIS   总被引:1,自引:0,他引:1  
本文介绍了一个中文农业文献自动标引系统SDIC/CASDAIS,它集自动主题标引与自动分类标引于一体,采用主题词表、预匹配词表和停用词表相结合的词典法方案,匹配中采取正向增字跳字最长匹配的算法,末二字回溯,制订大量规则以降低错标。该系统可完成主题标引和分类标引,能处理农业文献中常见的缩略语和科技术语不规范现象,具备动态构词功能。SDIC/CASDAIS系统采用特征词析取方法处理不包含在词表中的品种、物质名称和地名等关键词,其自由词判定规则还可以判别标题的部分自由词,通过词频统计可作为更新词表的依据。SDIC/CASDAIS系统的标引速度为3000条标题/小时,平均标引深度略大于4,主题标引精度98%,分类标引基本吻合率80%。  相似文献   

13.
微机辅助文献标引系统的设计与研究 3. 自动标引研究   总被引:2,自引:0,他引:2  
在微机辅助文献标引系统中引入了自动标引方法, 进一步提高了标引的速度和质量。自动标引的基本思想是: 以机内主题词典为依据, 采用遍历扫描和相似性匹配两种方法, 从标题和文摘中抽词, 本文介绍了这一自动标引技术, 并对自动标引的结果进行了分析和讨论。  相似文献   

14.
用于汉语文献自动标引的词典结构研究   总被引:1,自引:0,他引:1  
用于汉语文献自动标引的词典组织结构对自动标引的效率有很大影响,自动标引中运用的词典查找算法有其自身的特点,符合这种特点的词典结构能提高自动标引过程中分词的速度。本文在分析了几种常用的词典结构的空间效率和时间效率之后,提出了一种通用而高效的词典组织方法。采用这种方法的词典,其体积可以减小到原来的0.4倍,分词速度提高到原来的2.5倍。  相似文献   

15.
文章首先介绍了汉语科技词系统的体系结构和功能,其次设计了自动赋词标引研究的整体思路,完成了自动赋词标引的系统功能实现,包括标引知识库的格式转换、算法实现和系统实现,并收集语料进行测试。最后对自动赋词标引的结果进行了分析,并且总结了该自动赋词标引研究的特点和不足,介绍了未来的工作设想。  相似文献   

16.
主题概念评价方法的分析   总被引:1,自引:0,他引:1  
本文指出了目前自动标引所存在的问题,给出了一种基于多因素的主题概念综合评价方法。通过其在高校档案文献主题词自动标引系统──AISCAU中的具体应用,表明该方法具有较好的“聚焦”特性,可得到如下统计结果:标引综合评价指标92%,人工与自动标引的平均标引深度比为5:6.3。  相似文献   

17.
由《中图法》编委会和北京丹诚软件有限责任公司共同开发研制的《中图法》(第四版 )电子版 ,将于 2 0 0 1年 4月由北京图书馆出版社正式出版。它的出版标志着《中图法》已步入文献信息分类电子化时代。它既适用于传统文献的分类标引 ,快速查找类目 ,又适用于电子信息的有序组织 ,为实现机助标引和智能自动标引奠定了基础 ;它既适用于传统图书馆的文献资料的处理 ,又适应于虚拟图书馆、网络信息平台等信息分类组织的需要 ;它既适用于文献信息脱机标引 ,又适用于文献信息联机网络标引。《中图法》电子版主要包括两大部分 :类目检索部分和类目…  相似文献   

18.
引文主题与源文献主题具有相关性。基于这一事实,本文提出了一种基于汉语科技文献引文的自动标引法。具体过程是以词典为依据对源文献与引文题名进行抽词处理,并为不同类型引文赋予不同的权重,在此基础上确定用于标引源文献的关键词。本文还对此法的可行性进行了测试,并提出了改进方法。  相似文献   

19.
自动标引“匹配标引法”原理袁庆华现已开发出来的自动标引系统,大都是应用“抽词标引法”原理,从文献题名中抽出部件词,按词性组配成主题词完成文献主题标引的。由总后档案馆和后勤科研所应用“匹配标引法”原理研制的《档案主题自动标引系统》,避开了词性分析和部件...  相似文献   

20.
一、简介 本软件是依据国内图书情报界公认的、最具权威性的著者号码表--《通用汉语著者号码表》、结合《汉字属性字典》、《现代汉语词典》、《中国图书馆图书分类法》(第三版)作为标引工具开发研制的"通用汉语著者号码表自动配号系统".于1996年底通过了河南省科委成果鉴定,荣获河南省教委科技进步二等奖,并于1997年6月在"全国图书馆通用汉语著者号码表学术研讨会"上进行演示,赢得了众代表的赞许.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号