期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

文献分类是图书馆学情报学领域的一个传统研究问题。实用化的中图法自动分类系统最重要的一个要求就是能够将文献精确地自动分类到三级或四级类目之下,这意味着需要将特定文献较为精确地自动分类到上千个类目之下。为了构建面向实际应用的科技文献中图法自动分类引擎,本文基于层次分类思想,设计和实现了一个基于多层分类器集群的科技文献自动分类引擎系统,并重点解决了科技文献自动分类引擎建设中的四个关键问题:①如何获取并构建大规模高质量分类训练数据以提升自动分类效果;②如何设计和实现多层分类器集群以有效解决上千个类目自动分类的准确性;③如何面向现实要求来优化处理流程以提升分类速度;④如何设计和开放接口以支撑引擎的开放调用。最终构建了科技文献自动分类引擎,各项指标达到了实用化要求,初步实现了基于中图法的自动分类系统的实际应用。图4。表7。参考文献16。 相似文献

8.

英文文献自动摘要系统研究 总被引：2，自引：1，他引：2

史磊王永成《情报学报》1999,18(6)

信息爆炸和Internet的迅速普及 ,使得英文文献摘要的自动编制工作越来越重要。本文对英文文献自动摘要系统的结构进行了研究 ,介绍了该系统的体系结构、主要构成、设计思想及其基本原理。相似文献

9.

浅谈文献信息分类与网络信息分类 总被引：1，自引：0，他引：1

李曙光尹爱蓝《图书情报论坛》2003,(1):12-13,44

相似文献

10.

文献自动分类的一种算法

徐进鸿《现代图书情报技术》1993,9(3):25-28

本文讨论了通过关键词自动给文献确定分类号的一种模型 ,并对枚举式分类法和组面式分类法给出了分类的算法和数据结构。相似文献

11.

一种自动分类系统学习功能的实现方法

李伟王永成蔡巍尹中航《情报学报》2003,22(3):302-305

迅速而准确地更新自动分类系统的知识库是自动分类系统能投入使用的重要条件。本文在考察人类学习过程的基础上 ,提出一种能够在人的参与下 ,更新完善机器自动分类知识库的学习方法。通过实验 ,证实了该方法可以准确迅速地更新分类知识库 ,从而提高自动分类系统的分出率和分准率。相似文献

12.

多范畴信息系统的自动分类方法研究 总被引：1，自引：0，他引：1

卢致杰徐维军《情报学报》2005,24(1):53-58

为解决传统自动分类方法中的多范畴信息处理能力弱的问题,本文提出了一种基于多范畴属性约简和复合相似度计算的多范畴信息自动分类方法,该方法首先在分类中引入决策属性,然后计算各范畴的决策类和广义决策类,获得多范畴分类属性的约简集族,并依此集族分别计算多范畴信息系统分类对象的复合相似度,依据复合相似度的计算结果对分类对象进行排序和标引,实现自动分类。此方法有效地解决了多范畴不完备信息系统的自动分类问题,通过与Google自建系统的对比分析可知建立在此方法基础之上的多范畴信息分类系统在查全率和查准率方面明显优于传统的自动分类系统。相似文献

13.

基于Heritrix的网络学术文献获取研究

白如江王效岳亢丽芸《图书情报工作》2012,56(11):99-108

通过分析研究网络学术文献的主要来源、常用文件格式及Heritrix的工作原理,制定基于Heritrix的网络学术文献获取方案,从种子站点选择或抓取任务配置、文件类型和大小过滤以及学术文献判定等方面对整体方案进行具体设计和分析,并搭建实验平台,编写相关程序进行实验以验证该方案的可行性,最后指出后续研究方向。相似文献

14.

关于自动化技术文献分类的研究（续）

白国应《晋图学刊》2005,(2):8-14

文章研究了自动化技术文献分类的三个问题:自动化技术文献的分类标准;自动化技术文献的分类体系;自动化技术文献的分类方法。相似文献

15.

基于Uni LM模型的学术文摘观点自动生成研究

曾江峰刘园园程征段尧清《图书情报工作》2023,67(2):131-139

[目的 /意义]将海量学术文本观点提取工作由人工转向机器,提高效率的同时又能够保证观点提取的准确性、客观性。[方法 /过程]使用UniLM统一语言预训练模型,训练过程中对模型进行精调,以人工标注数据集进行机器学习。将学术文摘作为长度为a的文本序列,经过机器学习,生成长度为b的句子序列(a≥b),并且作为学术论文观点句输出。[结果 /结论 ]研究结果表明：UniLM模型对于规范型文摘、半规范型文摘、非规范型文摘观点生成精准度分别为94.36%、77.27%、57.43%,规范型文摘生成效果最好。将机器学习模型应用于长文本观点生成,为学术论文观点生成提供一种新方法。不足之处在于本文模型依赖文摘的结构性,对非规范型文摘观点生成效果有所欠缺。相似文献

16.

跨语言术语自动分类方法及其实证

宋培彦李俊莉王芳《图书情报工作》2013,57(16):20-24

提出一种基于英汉术语语义推导和归并的术语自动分类方法。以英汉术语库为基本语料,通过语义传导和词形规范为英文术语自动推荐候选分类,进而采用投票机制对推荐结果进行遴选和归并。实验结果表明,本方法对英文术语自动分类的准确率较高,具有一定的应用价值。相似文献

17.

基于词语上下文关系的文本自动分类方法研究

郭少友《现代图书情报技术》2008,24(5):44-49

用词上下文向量来表达文本集内一个词语与其他词语之间的上下文关系,并在词上下文向量的基础上生成分类器中所有类别的类别特征向量,以及待分类文本的特征向量,最后由分类器给出待分类文本的所属类别。实验显示,在类别特征向量和文本向量中融入词语上下文关系有助于改善文本分类效果。相似文献

18.

中国古代图书分类的学术价值

王琼《江西图书馆学刊》2008,38(2):6-8

中国古代各个时期占主导地位的图书分类法是在学术发展的基础上形成的。有一定的学术性,反映了学术发展的趋势,并且在一定程度上推动了学术的发展。论述了中国古代学术分类与图书分类的关系,总结了中国古代的分类思想,指出了中国古代图书分类的学术价值还体现在类叙、提要的撰写。互著、别载的运用上。相似文献

19.

基于标引经验和机器学习相结合的多层自动分类 总被引：6，自引：0，他引：6

何琳侯汉清白振田张雪英《情报学报》2006,25(6):725-729

由于《中国图书馆分类法》类目数目庞大且各类目上文献分布不均衡,导致基于机器统计学习的自动分类技术在这种多层分类体系上力不从心。基于人工标引经验的自动分类试图通过情报检索语言兼容互换的原理解决这一问题,然而直接应用标引词串对分类进行匹配在实际应用中产生了一系列的问题。本文试图通过将两种分类技术相结合的方法对信息资源进行分类,提出了用相关度来测定关键词和类目概念之间的关联,构建关键词、分类器的构建原理、构建方法以及分类流程,并对该方法存在的不足进行了分析。相似文献