首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 218 毫秒
1.
基于控制词集的中文信息动态自动聚类研究   总被引:1,自引:0,他引:1  
以专用词典为切分工具,建立以概念为基础的、具有主题分类特点的类目结构是中文信息动态自动聚类的一种适用方式。该文探索了基于控制词集的中文信息动态自动聚类技术,包括专用控制词集的构建,动态有限环境下的自动聚类程序、聚类算法,以及结合控制词集对聚类结果进行优化控制等,最后对实验结果给出了概要评价。  相似文献   

2.
聚类就是指按照事物间的相似性对事物进行区分和分类的过程,是在没有教师指导下自动进行的无监督的分类。本文通过实现常用的K-mean算法和FCM算法,在对测试数据进行反复聚类后,对聚类算法进行了对比与分析。  相似文献   

3.
王涛 《图书馆学研究》2007,(12):40-43,46
本文简要介绍了国内外文本自动分类的发展概况,论述了自动分类的定义,自动归类和自动聚类的几种常见方法,并对应用实例进行了分析。  相似文献   

4.
为了提高海量新闻信息分类的效率,本文探索研究基于Transformer(转换器)模型和《中文新闻信息分类与代码》标准的自动分类标引,包括自动归类、聚类、检索标志的智能抽取,以及人工标引和自动标引的互相结合。Transformer模型训练数据特征效率更高,适应能力更强。基于标准的自动分类表更灵活,更高效,自动标引具有广泛的应用前景。  相似文献   

5.
文本聚类结果描述研究综述   总被引:1,自引:0,他引:1  
首先对文本聚类结果描述的研究背景和相关的研究情况进行说明,分析自动标引、自动文摘、概念聚类与文本聚类结果描述的关系,定位文本聚类结果描述的研究内容;然后根据文本聚类结果描述的具体要求,对该问题进行形式化;最后给出文本聚类结果描述的评价方法。  相似文献   

6.
中文文献自动分类中的知识库构造及其仿人算法   总被引:4,自引:2,他引:2  
刁倩  张惠惠  王永成  何骥 《情报学报》2000,19(3):248-253
本文阐述了自动分类中的仿人思想 ,并用分类域模型来描述中文信息自动分类中的分类法 ,通过计算类别特征项在分类域中的Hamming距离 ,对类别特征项依据其在分类域中的类别分布进行聚类 ,从而实现对向量分类法中的特征向量维数的压缩 ,并进一步构造用于中文自动分类的知识库。  相似文献   

7.
Web内容挖掘在数字图书馆中的应用   总被引:3,自引:1,他引:3  
黎琳  赵英 《图书馆学研究》2006,(2):19-21,24
Web信息是数字图书馆数字资源的重要来源,文章详细阐述了对Web内容中的文本信息的挖掘,包括:文本自动摘要、文本分类和文本聚类。在挖掘过程中基于用户需求和用户特征,针对文本分类,重点分析了分类过程和在数字图书馆中的应用;针对文本聚类,介绍两种基本聚类原理以及与文本分类的不同之处,重点论述其在数字图书馆中如何应用。最后提出内容挖掘与用户挖掘的结合更有助于服务用户。  相似文献   

8.
档案自动分类算法研究   总被引:10,自引:3,他引:7  
作者从实用角度出发,研制了一种汉语档案文献自动分类算法──多因素加权分类法。该算法采用了聚类加权、判别归类以及责任者认证定类等多种手段,力图获得正确的分类结果。该算法已在实际档案管理系统中得到应用。  相似文献   

9.
一种使用自动聚类思想的自动文摘方法   总被引:5,自引:0,他引:5  
杨建林 《情报学报》2001,20(5):532-536
本文提出了一种使用自动聚类思想的自动文摘方法 ,这种方法是进行自动文摘研究的一种新的有益的尝试。该方法首先利用词频统计方法得到文献的关键词向量、每个段落的关键词向量 ,然后利用自动聚类的方法将文献分为若干个段落类 ,从中选出与文献主题相关的段落类作为候选的用来挑出文摘句的段落类 ,最后从候选段落类中选出文摘句构成文摘  相似文献   

10.
多语言文本聚类研究综述   总被引:1,自引:0,他引:1  
对多语言文本聚类问题进行综述,说明多语言文本聚类的作用、多语言聚类方法的分类、现有方法存在问题以及今后的研究趋势.  相似文献   

11.
与传统静态聚类系统相比,动态自动聚类系统有以下特点:聚类是动态进行的,它是在检索结果返回的基础上进行的实时操作;每次聚类的文献对象数量有限;用来作为聚类依据的文献数据只是文献的局部;参与聚类的资源在整个资源集合中的分布是随机的。动态自动聚类方法有:直接将专指性短语作为揭示类目相似性识别的依据;更多使用线性聚类策略;使用等级显示、多维聚类的形式;采用优化算法;扩大预处理的应用。表1。图1。参考文献12。  相似文献   

12.
读者需求分析中的数据挖掘技术   总被引:4,自引:0,他引:4  
针对高校图书馆读者借阅文献类型、流量实时监测问题,提出了一种基于数据挖掘中聚类算法的自动分类和统计分析方法.以方法开发出流量分类统计和预报应用系统,在大庆石油学院图书馆进行了实际应用,结果证明了该算法是有效和可靠的.  相似文献   

13.
Web中文文本聚类研究及实现*   总被引:5,自引:0,他引:5  
采用Web文本自动聚类技术,提出一种将HAC(Hierarchical Agglomerative Clustering)聚类算法与K-Means聚类算法相结合的两阶段文本聚类框架,并通过实验对该框架进行评估。  相似文献   

14.
本文提出一个基于本体论网络信息的自动分类方案,通过对网络信息的分类,提高检索的精度,减轻用户网络使用负担,使用户更加方便地利用网络信息。  相似文献   

15.
关键词自动标引是一种识别有意义且具有代表性片段或词汇的自动化技术。关键词自动标引可以为自动摘要、自动分类、自动聚类、机器翻译等应用提供辅助作用。本文利用基于知网的词语语义相关度算法对词汇链的构建算法进行了改进,并结合词频和词的位置等统计信息,进行关键词的自动标引。实验证明,该方法可以有效的进行关键词的自动标引。  相似文献   

16.
Subject classification arises as an important topic for bibliometrics and scientometrics, searching to develop reliable and consistent tools and outputs. Such objectives also call for a well delimited underlying subject classification scheme that adequately reflects scientific fields. Within the broad ensemble of classification techniques, clustering analysis is one of the most successful.Two clustering algorithms based on modularity – the VOS and Louvain methods – are presented here for the purpose of updating and optimizing the journal classification of the SCImago Journal & Country Rank (SJR) platform. We used network analysis and Pajek visualization software to run both algorithms on a network of more than 18,000 SJR journals combining three citation-based measures of direct citation, co-citation and bibliographic coupling. The set of clusters obtained was termed through category labels assigned to SJR journals and significant words from journal titles.Despite the fact that both algorithms exhibited slight differences in performance, the results show a similar behaviour in grouping journals. Consequently, they are deemed to be appropriate solutions for classification purposes. The two newly generated algorithm-based classifications were compared to other bibliometric classification systems, including the original SJR and WoS Subject Categories, in order to validate their consistency, adequacy and accuracy. In addition to some noteworthy differences, we found a certain coherence and homogeneity among the four classification systems analysed.  相似文献   

17.
李伟  王永成  蔡巍  尹中航 《情报学报》2003,22(3):302-305
迅速而准确地更新自动分类系统的知识库是自动分类系统能投入使用的重要条件。本文在考察人类学习过程的基础上 ,提出一种能够在人的参与下 ,更新完善机器自动分类知识库的学习方法。通过实验 ,证实了该方法可以准确迅速地更新分类知识库 ,从而提高自动分类系统的分出率和分准率。  相似文献   

18.
数字图书馆与数字化分类法   总被引:12,自引:0,他引:12  
数字化分类法不仅要能够适合传统文献的分类检索 ,也应能适应各种信息尤其是网络信息的分类和检索。它应借鉴搜索引擎构建多维的分类体系和多途径检索 ,吸收我国已有的信息分类编码成果 ,具有自动搜索、分析、标引和著录的智能性。参考文献 6。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号