首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 0 毫秒
1.
随着Internet的发展,互联网上的学术文献数量呈指数增长,很难为科研工作者所利用,因此亟需一种方法对海量的网络学术文献进行自动的搜集、整理、分类。在前期充分的实验论证后,设计实现一个海量网络学术文献自动分类系统,该系统使用模块化设计,包括学术文献自动抓取模块、学术文献词-文档矩阵处理模块、本体集成模块以及基于语义驱动的分类模块。实验证明,该系统可以有效地完成海量学术文献的自动抓取、处理和分类工作。  相似文献   

2.
3.
4.
本文以代数学方法定义了文献信息空间模型、文献和类目的隶属度,以此为基础,实现文献信息的计算机自动分类。探讨了计算机分类过程中特征词提取和加权方法、计算机分类知识的自学习和自维护方法。  相似文献   

5.
文献题名自动抽词--分类标引系统   总被引:5,自引:2,他引:5  
本文对“文献题名自动抽词-分类标引系统”作了概述,并给出了全部程序。这是一种比较简易实用的自然语言检索法。  相似文献   

6.
文献分类是图书馆学情报学领域的一个传统研究问题。实用化的中图法自动分类系统最重要的一个要求就是能够将文献精确地自动分类到三级或四级类目之下,这意味着需要将特定文献较为精确地自动分类到上千个类目之下。为了构建面向实际应用的科技文献中图法自动分类引擎,本文基于层次分类思想,设计和实现了一个基于多层分类器集群的科技文献自动分类引擎系统,并重点解决了科技文献自动分类引擎建设中的四个关键问题:①如何获取并构建大规模高质量分类训练数据以提升自动分类效果;②如何设计和实现多层分类器集群以有效解决上千个类目自动分类的准确性;③如何面向现实要求来优化处理流程以提升分类速度;④如何设计和开放接口以支撑引擎的开放调用。最终构建了科技文献自动分类引擎,各项指标达到了实用化要求,初步实现了基于中图法的自动分类系统的实际应用。图4。表7。参考文献16。  相似文献   

7.
本文讨论了通过关键词自动给文献确定分类号的一种模型 ,并对枚举式分类法和组面式分类法给出了分类的算法和数据结构。  相似文献   

8.
论文结合《中图法》和《中国分类主题词表》,分析其内容、结构,形成自动分类因果推理规则,实现文献的自动分类,从而解决目前自动分类的瓶颈问题。  相似文献   

9.
一种基于N-Gram技术的中文文献自动分类方法   总被引:6,自引:2,他引:6  
何浩  杨海棠 《情报学报》2002,21(4):421-427
本文介绍一种基于n gram技术的、与语言无关的文献分类方法K meansaxiales (KMA) ,及其在中文文献自动分类中的应用。这种方法将文献转换成由n gram(n个连续的字符 )频次构成的向量。为压缩存储空间、提高处理速度 ,我们运用哈希函数将n gram映射为哈希码 ,对文献的分析实际上以哈希码频次为基础运行。采用KMA算法 ,我们对一个中文数据库进行了自动分类的实验研究 ,在比较实验结果的基础上 ,我们对KMA算法初始参数的选择进行了初步探讨。  相似文献   

10.
中文文献自动分类研究   总被引:13,自引:1,他引:12  
本文对作者开发的两个中文文献自动分类系统的工作原理、方法、数学模型和实现技术进行了比较全面的介绍。  相似文献   

11.
以医学类、农学类学位论文为例,构建基于BERT模型的学位论文自动分类器,得到TSAS(双显性主题)、TWAS(题名隐性摘要显性主题)、TSAW(题名显性摘要隐性主题)3种分类类型,进而提出从夯实数据质量、规范写作方式、拓宽信息来源3个方面提高学位论文自动分类效果。  相似文献   

12.
文章在阐述自动分类与手工分类的概念、自动分类与手工分类的工作程序及对自动分类与手工分类比较之后,提出自动分类优越于手工分类,自动分类最终将取代手工分类,成为图书资料分类史上的又一里程碑。  相似文献   

13.
自动分类研究进展   总被引:10,自引:0,他引:10  
在对自动分类研究状况进行概述和分析的基础上, 指出了自动分类研究的主要发展方向。  相似文献   

14.
文本分类作为处理和组织大量文本数据的关键技术,在信息过滤、信息检索、搜索引擎、数字图书馆等领域有着广泛的应用前景.基于文献计量法对1999~2008年间文本分类相关研究论文作了统计分析,按基础理论研究和应用研究两部分分别进行了深入的探讨,前者涉及了文本分类过程中的各种关键技术:文本预处理、文本表示、特征降维、分类算法、效果评估,后者则包括文本分类在各领域的应用研究和文本分类系统的设计与开发.文章深入地揭示了文本分类研究内容、发展历程、研究热点和理论成果,并对未来的研究趋势进行了预测.  相似文献   

15.
王涛 《图书馆学研究》2007,(12):40-43,46
本文简要介绍了国内外文本自动分类的发展概况,论述了自动分类的定义,自动归类和自动聚类的几种常见方法,并对应用实例进行了分析。  相似文献   

16.
专利文献的分类与检索   总被引:1,自引:0,他引:1  
  相似文献   

17.
WWW中文信息自动分类方法研究   总被引:6,自引:0,他引:6  
郑家恒  宋文中 《情报学报》2002,21(5):532-536
本文采用一种基于词的归类技术。在类别词专指度的计算中 ,考虑了类别词在语料中的频度、集中度和分布性等因素。根据HTML语言的标记特性 ,应用三维加权分类算法计算类别权值。采用Bayes公式变型 ,计算WWW中文信息文件归类可信度 ,并按可信度最大归类。对 10 8篇试语料进行测试 ,封闭测试的归类正确率为98 1% ,开放测试的正确率为 83 3%。  相似文献   

18.
英文文献自动摘要系统研究   总被引:3,自引:1,他引:2  
信息爆炸和Internet的迅速普及 ,使得英文文献摘要的自动编制工作越来越重要。本文对英文文献自动摘要系统的结构进行了研究 ,介绍了该系统的体系结构、主要构成、设计思想及其基本原理。  相似文献   

19.
试论地方文献及其分类   总被引:5,自引:0,他引:5  
田平 《图书馆学刊》2006,28(1):74-75
地方文献是文献资源的重要组成部分。通过对地方文献的涵义、特征、收藏和分类进行分析,提出《中图法》是地方文献分类的依据。  相似文献   

20.
浅谈文献信息分类与网络信息分类   总被引:1,自引:0,他引:1  
  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号