首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 0 毫秒
1.
基于标引经验和机器学习相结合的多层自动分类   总被引:6,自引:0,他引:6  
由于《中国图书馆分类法》类目数目庞大且各类目上文献分布不均衡,导致基于机器统计学习的自动分类技术在这种多层分类体系上力不从心。基于人工标引经验的自动分类试图通过情报检索语言兼容互换的原理解决这一问题,然而直接应用标引词串对分类进行匹配在实际应用中产生了一系列的问题。本文试图通过将两种分类技术相结合的方法对信息资源进行分类,提出了用相关度来测定关键词和类目概念之间的关联,构建关键词、分类器的构建原理、构建方法以及分类流程,并对该方法存在的不足进行了分析。  相似文献   

2.
以国家图书馆和上海图书馆的分编数据为依据,就当前人物传记分类中存在的主要问题进行了探讨,并指出正确的分类标引方法.  相似文献   

3.
文学作品在图书馆馆藏中占有很大比重,因此厘清其分类问题十分必要。通过分析《中国图书馆分类法》中涉及文学作品分类的著者国籍变化、海外华人、改编、时代复分问题,提出如下改进建议:(1)编目人员需熟知文学类的列类标准和分类规则;(2)涉及国籍变化和海外华人作品时,应按照著作初版或作品发表时的作者国籍执行分类,并尽量保持不同版本的分类一致性;(3)改编类文学作品的归类应考虑著作宗旨;(4)存在时代复分的作品应尽可能以其创作的时代为准。参考文献8。  相似文献   

4.
顾颖  何琳 《图书情报工作》2012,(19):109-113
认为中文文献数据库中存在大量的分类号与关键词(或主题词)对应的人工标引记录。通过对这些标引记录信息进行聚合处理,可以实现计算机自动编制分类主题词表。比较两种分类主题词表的编制模式,讨论机编分类主题词表的优势,针对机编分类主题词表已有的成果——知识库的不足之处提出改进方案。改进方案在小规模测试集中取得了良好的效果。最后分析将机编分类主题词表技术应用于新一代《中国分类主题词表》升级改造的良好前景。  相似文献   

5.
用于中文信息自动分类的《中图法》知识库的构建   总被引:4,自引:0,他引:4  
中文文献数据库中存在着大量的分类号与关键词(或主题词)对应的人工标引记录。通过对这些数据的加工整理,以《中图法》类目体系为主干,组织各学科领域的语词,从而构建出反映分类号与语词概念对应关系的《中图法》知识库,用以实现信息的自动标引和自动分类。构建《中图法》知识库面临着一些难题:异构数据的整合;原始数据中分类号与主题词或词串之间一对多、多对多关系的筛选;标引词串与知识库中的词串的相符性比较等。图2。参考文献8。  相似文献   

6.
用于中文信息自动分类的《中图法》知识库的构建   总被引:1,自引:0,他引:1  
分类号、主题词、关键词是三种主题概念标识,三者之间存在着概念对应关系,即兼容关系。中文文献数据库中存在着大量的分类号与关键词(或主题词)对应的人工标引记录。通过对这些数据的加工整理,以《中图法》类目体系为主干组织各学科领域的语词,从而构建出反映分类号与语词概念对应关系的《中图法》知识库,用以实现信息的自动标引和自动分类。本文详细讨论了该知识库的构建原理、结构、编制使用的关键技术以及主要应用等。  相似文献   

7.
从目前数字图书馆的实际困难出发,提出一个依托《军事信息资源分类法》,挖掘人工标引经验,用之于自动分类的方案。  相似文献   

8.
《中国档案分类法》(以下简称《中档法》)第一版1987年12月出版一年多后,我院就开始按它进行档案分类标引了.实践证明,《中档法》第一版所设类目太粗,远远不能满足实际标引需要.1997年12月出版了《中档法》第二版,把类目由一版的5千条扩展到10万条,基本能满足全国档案分类标引需要,但我们在使用中仍发现不少问题有待解决.  相似文献   

9.
《中文新闻信息分类》标准经过历时一年8个月的研制及反复检测论证,在2005年9月2日专家评审会上,标准审查委员会一致通过对《中文新闻信息分类》国家标准(送审稿)的审查,建议标准起草组尽快形成报批稿,上报国家标准化管理委员会作为推荐性国家标准发布实施。作为我国第一部即将上报的新闻信息分类标准,《中文新闻信息分类》标准的研制工作取得了初步的成果,但能否在业界真正实现应用,达到整合全球中文新闻信息的目的,最为关键的是下一步技术支撑的构建。因此,只有建立自动标引系统,实现自动分类,《中文新闻信息分类》标准的现实价值才能真正体现。本文提出了实现自动标引的整体构想,希望为《中文新闻信息分类》标准下一步的研究与实际应用有所贡献。  相似文献   

10.
于新国 《当代图书馆》2005,(4):35-37,44
从加“0”三字规则及其使用说明、加“0”过程对比分析、加“0”例释、与加“0”规则有关的不加“0”例释和对《中图法》的修订建议6方面,论述了《中图法》分类标引加“0”三字规则。  相似文献   

11.
本文依照分类标引的四个质量标准:准确、一致、适度和实用要求,详细评析了中文图书在版编目数据中分类标引存在的各种常见问题,如分类号不够准确、分类标引过于粗略、复分与仿分不准确、分类标引不一致、笔误或印刷错误等引起的分类标引质量不高,最后提出了加快电子在版编目(E—CIP)的进程,提高在版编目数据质量的建议。  相似文献   

12.
基于语料和基于标引经验的自动分类模式比较   总被引:1,自引:0,他引:1  
以传统文献分类体系为框架,构建知识库或分类器来实现信息的自动分类是信息加工自动化的一个发展方向。这种自动分类系统一般有两种模式:基于训练语料和基于人工标引经验。我实验室分别在这两种模式的基础上设计开发了两个不同的自动分类系统。本文将详细介绍这两个自动分类系统的结构、设计及其构建,然后分别从原理、知识库构建、分类算法等方面对这两者进行比较分析。  相似文献   

13.
本文通过实例,探讨了确定图书分类号的基本原则,以及判断分类是否恰当的方法和技巧。  相似文献   

14.
中文信息自动分类用知识库的设计与构建   总被引:9,自引:2,他引:9  
侯汉清  薛鹏军 《情报学报》2003,22(6):681-686
在计算机智能处理技术远未成熟的情况下 ,基于概念语义网络的自动分类采用知识库技术 ,仍将是一种实用的选择。本项研究根据分类语言、主题语言、自然语言三者兼容互换的原理 ,以众多标引员的主题标引和分类标引的经验 ,即文献数据库实体中大量存在的文献分类号和主题词双重标引数据为基础 ,建立一个以《中图法》为基础的的分类知识库———分类法与主题词表对照数据库。论文对构建分类知识库的思路、步骤及主要技术 ,包括关联度测度方案、标引词模式匹配、新词增补等进行了讨论  相似文献   

15.
通过对我国最具代表性的11种音乐学术期刊的调查发现:音乐学术期刊论文分类标引存在引用标准不统一及标引不全、标引错误、标引深度不够等问题。在分析原因的基础上,提出通过修订期刊编排规则,兼顾音乐文献编目的特殊需求,加强期刊分类标引人员培训以及开展部门专业协作的方式以有效提高音乐学术论文分类标引的质量。  相似文献   

16.
文榕生 《河北科技图苑》2004,17(1):45-48,69
从《中图法》的设类、层累制、复分的原理入手,综合探讨了《中图法》“第四版”关于文学作品集标引出现的加“0”与归类一系列问题,并认为无论是分类法的修订者还是分类法的使用者,如果从分类法的作用、目的、原理、类目设置等方面综合考虑,兼顾当前与将来,准确与稳定,可能比较容易取得一致。  相似文献   

17.
基于知识库的网页自动标引和自动分类系统的设计   总被引:15,自引:0,他引:15  
针对中文网页文本信息特征,提出了信息标引和组织方案,并构建了一个基于知识库的网页自动标引和自动分类系统。中文网页的自动标引和自动分类思想主要基于知识库进行。知识库实际上是一个基于《中图法》的专家知识系统,包括了中图法库、汉表库、分类号主题词对应库、同义词库、关键词库等若干数据库。在确定网页基本信息标引源的基础上,中文网页主题标引运用了基于词频的统计加权法;通过与分类号一主题词对应库主题词串的词面相似度计算,进一步完成中文网页的分类标引。最后还讨论了新词识别等技术问题。  相似文献   

18.
本文探讨了基于自动标引的《中国分类主题词表》(简称《中分表》)改造的模式、结构以及关键技术。在原《中分表》分类体系的框架之上,收集标引经验库中分类标引和主题标引的双重标引数据及其他相关数据,应用支持度、置信度和相关度等筛选处理方法,最终得出分类号与关键词(串)的最佳对应关系组合。本文从收词量、相符度、专指度、标引深度、主题标引能力和分类标引能力6个方面详细地对改造后的《中分表》进行了测试,结果表明改造后的《中分表》在编制方式、类目设置、收词量、全面性和专指性等方面都具有一定优势。建议在《中分表》的更新改造中,尽量采用立体化的整体结构,保证完备的收词量,进行必要的分级化控制并扩大用户交互。  相似文献   

19.
《中图法》(第五版)存在的问题和建议   总被引:1,自引:0,他引:1  
指出了《中图法》(第五版)存在的类号错误,并在类号划分、类名表述、类目设置等方面提出建议,以及“依中国地区表分”中的疑惑。  相似文献   

20.
蔡振华 《图书馆》2003,(6):70-72,48
本文对1212/217类目分类标引出现的几种不同意见和观点进行了分析和评述,指出应当如何理解该类及其专类表的涵义,以及如何正确地进行分类标引。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号