首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 78 毫秒
1.
为减少人工分类的不确定性和分类错误,将文本分类技术引入专利自动分类系统,采用径向基函数神经网络(RBFNN)算法完成专利文本的训练和分类,并进行相关测试分析。实验结果表明,采用RBFNN分类器在专利文本自动分类中具有较理想的性能,测试平均F1值在70%以上。  相似文献   

2.
提出一种基于英汉术语语义推导和归并的术语自动分类方法。以英汉术语库为基本语料,通过语义传导和词形规范为英文术语自动推荐候选分类,进而采用投票机制对推荐结果进行遴选和归并。实验结果表明,本方法对英文术语自动分类的准确率较高,具有一定的应用价值。  相似文献   

3.
基于机器学习的中文书目自动分类研究   总被引:2,自引:1,他引:1  
面对与日俱增的图书出版量,图书馆编目人员的手工书目分类显得力不从心,如何实现由计算机自动完成图书分类成为数字图书馆建设中亟待解决的关键问题之一。本文尝试将BP神经网络和支持向量机等机器学习算法引入到书目分类中,建立了面向中图法的基于机器学习的书目层次分类系统模型,提出了采用特征加权方式描述书目和浅层次分类体系构建的设计思路,并通过大规模实验验证了该模型的可行性和合理性,基本上解决了没有主题标注情况下书目的自动分类问题。图9。表5。参考文献14。  相似文献   

4.
杨敏  谷俊 《图书情报工作》2012,56(9):114-119
将文本自动分类技术应用于图书书目的自动分类中,利用ICTCLAS分词系统对书名和摘要信息进行中文分词,为标题和摘要的特征词赋予不同的权重。在构建基于文本特征矩阵的基础上,结合SVM算法对实验语料进行学习和测试。为了验证TFIDF权重对分类结果的影响,还对词频特征矩阵、TFIDF特征矩阵和混合特征矩阵进行测试和对比。实验证明,基于混合特征矩阵的SVM算法具有良好的分类效果。据此,构建基于SVM的书目自动分类系统。  相似文献   

5.
基于概率神经网络的文本自动分类研究   总被引:10,自引:2,他引:10  
施洁斌 《情报学报》2004,23(2):147-151
本文提出了将一种径向基网络的重要变形———概率神经网络应用于文本自动分类的研究 ,与常用的K 最邻近法相比 ,具有一定的优势 ,特别是在训练集中各类的训练样本数很不平衡时 ;与BP等其他神经网络相比 ,其特点是需调节的参数少 ,不需确定隐层数、隐层中的神经元数量等网络结构 ,比较容易使用。此外 ,从研究中的不同特征选择的评价函数来看 ,它们对分类有一定的影响 ,应用X2 统计进行特征选择的分类正确率最高 ,其次是文本证据权 ,而期望交叉熵的效果最差 ,说明特征选择在文本自动分类中也是非常重要的。  相似文献   

6.
基于机器学习的文本自动分类研究进展   总被引:6,自引:0,他引:6  
张雪英 《情报学报》2006,25(6):730-739
文本自动分类是目前最常用的文本信息自动处理技术,也是机器学习、自然语言处理和信息检索领域的研究热点之一。本文比较全面、深入地论述了基于机器学习的文本自动分类所涉及的相关问题及解决方法,并提出了当前该领域面临的主要研究问题。  相似文献   

7.
基于层次分类体系的知识地图自动构建方法研究   总被引:1,自引:0,他引:1  
知识地图是组织实施知识管理的有效工具.随着组织中知识资源存储量的日益增加,手工编制知识地图的方式显得非常低效,甚至难以完成.针对组织中以文本形式大量存在的显性知识,提出了一种基于层次分类体系的知识地图结构,并提出了一个以层次分类方法为核心的知识地图自动生成方法,用来自动构建符合组织需求的知识地图.最后通过实验验证了该层次分类方法的有效性,并给出结论.  相似文献   

8.
基于机器学习的自动文本分类模型研究   总被引:2,自引:0,他引:2  
基于机器学习的方法是自动文本分类中非常重要的一大类方法。本文先给出了形式化的定义,提出了自动文本分类的流程模型,然后选取了支持向量机(Support Vector Machine,SVM)算法作为一个典型例子进行分析,最后作者通过一个中文文本分类实验评价了该算法的效果。  相似文献   

9.
自动分类技术研究   总被引:1,自引:0,他引:1  
以网络环境下网络信息资源的分类体系作为研究对象,分析了自动分类的类型和程序,比较分析了档自动分类的向量模型。  相似文献   

10.
王涛 《图书馆学研究》2007,(12):40-43,46
本文简要介绍了国内外文本自动分类的发展概况,论述了自动分类的定义,自动归类和自动聚类的几种常见方法,并对应用实例进行了分析。  相似文献   

11.
文章研究了自动化技术文献分类的三个问题:自动化技术文献的分类标准;自动化技术文献的分类体系;自动化技术文献的分类方法。  相似文献   

12.
李伟  王永成  蔡巍  尹中航 《情报学报》2003,22(3):302-305
迅速而准确地更新自动分类系统的知识库是自动分类系统能投入使用的重要条件。本文在考察人类学习过程的基础上 ,提出一种能够在人的参与下 ,更新完善机器自动分类知识库的学习方法。通过实验 ,证实了该方法可以准确迅速地更新分类知识库 ,从而提高自动分类系统的分出率和分准率。  相似文献   

13.
共识与分歧:透析网络信息资源分类组织研究   总被引:1,自引:0,他引:1  
张丽静 《图书情报工作》2005,49(12):108-110
分析网络信息组织的研究现状,总结业内专家对网络信息分类组织、网络信息分类法及网络分类体系建设等方面所达成的共识;同时指出业内专家在网络分类法制定等方面存在的分歧,并对其有争议的问题,如建立统一网络分类法、网络分类法原则的制定等进行详细阐述。  相似文献   

14.
按知识流失度可将知识分类成易流失知识和常识性知识.这对组织具有重要意义,也是知识管理的一个重要研究内容.本文从定量的角度出发,提出用超网络模型计算知识流失度,再根据这个客观指标对组织知识进行分类.先按照不同类型的数据,分别建立人员网络、物质载体网络和知识网络,再根据各个网络间的关系构建超网络模型.在超网络中,首先依据知识网络与人员网络之间的关系计算出知识流失度,然后依据知识流失度对组织知识进行分类.在此基础上,又将组织知识的领域划分成易流失领域和常识性领域.最后给出一个实例对构建的模型和方法进行了验证.  相似文献   

15.
互联网的快速发展,导致网络信息激增与用户获取信息能力有限之间的矛盾产生。针对这种形势,文章从网络环境下用户需求的角度,对目前流行的网络自编分类体系在类型、特点及不足方面进行深入的探讨,并根据自编分类体系中存在的缺陷给出几点建议。  相似文献   

16.
用词上下文向量来表达文本集内一个词语与其他词语之间的上下文关系,并在词上下文向量的基础上生成分类器中所有类别的类别特征向量,以及待分类文本的特征向量,最后由分类器给出待分类文本的所属类别。实验显示,在类别特征向量和文本向量中融入词语上下文关系有助于改善文本分类效果。  相似文献   

17.
基于深度学习的中文专利自动分类方法研究   总被引:2,自引:0,他引:2  
[目的/意义]面向当前国内专利审查和专利情报分析工作中对于海量专利分类的客观需求,设计了7种基于深度学习的专利自动分类方法,对比各种方法的分类效果,从而助力专利分类效率和效果的提升。[方法/过程]针对传统机器学习方法存在的缺陷,基于Word2Vec、CNN、RNN、Attention机制等深度学习技术,考虑专利文本语序特征、上下文特征以及分类关键特征,设计Word2Vec+TextCNN、Word2Vec+GRU、Word2Vec+BiGRU、Word2Vec+BiGRU+TextCNN等7种深度学习模型,以中国专利为例,选取IPC主分类号的"部"作为分类依据,对比这7种模型与3种传统分类模型在中文专利分类任务中的效果。[结果/结论]实证研究效果显示,采用考虑语序特征、上下文特征及强化关键特征的深度学习方法进行中文专利分类具有更优的分类效果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号