期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

文本自动聚类技术研究 总被引：1，自引：0，他引：1

王伟《情报杂志》2009,28(2)

自动聚类作为一种自动化程度较高的无监督机器学习技术,在信息检索和数据挖掘领域得到了广泛的应用.探讨了文本聚类的定义和步骤,依据文本自动聚类的步骤分别对文本的处理、自动聚类算法以及文本聚类结果的评价进行了阐述. 相似文献

2.

马慧芳祁云平杨小东《情报杂志》2007,26(3):67-69

讨论了一种运用于搜索引擎中的多文档自动摘要技术。传统搜索引擎返回结果繁杂,常用的解决方案是使用聚类技术将内容相似的网页集合归类,然而聚类后的结果数目庞大,依然无法体现该类的主题。提出一种新的基于文本关系图的多文档自动摘要技术,对每类返回结果依主题思想自动提取多文档摘要,提高搜索引擎使用效率。分析了该系统的结构和算法,评价了实验结果,指出了未来的研究方向。相似文献

3.

文档自动分类的方法探讨

田甜《情报杂志》2006,25(2):77-78

介绍了国内外自动分类研究的发展概况、自动归类与自动聚类的几种常用方法模型,并对其应用实例进行了分析。相似文献

4.

共词分析法研究(三)——共词聚类分析法的原理与特点 总被引：20，自引：3，他引：17

钟伟金李佳杨兴菊《情报杂志》2008,27(7)

共词聚类分析法采用聚类的计算方法,对文章中共观的词对(主题词或关键词)的关联性进行运算,将关系密切的词聚集归类,从而达到挖掘隐舍信息的目的.通过对聚类原理的分析,认为该方法具有客观性、科学性、敏感性的特点.并讨论了共词聚类分析法的不足以及其解决办法,最后介绍了共词聚类分析法的最新研究进展. 相似文献

5.

文本知识的自动分类方法初探

范宇中张玉峰《情报科学》2003,21(1):103-105

本文结合运用信息管理和人工智能的原理与技术，探讨了文本知识的自动分类方法，包括：自动归类与聚类方法、基于实例的学习分类方法和基于特征值的元学习方法。相似文献

6.

海量数据信息中的迭代聚类过程的改进研究

《科技通报》2016,(4)

对海量数据信息进行迭代聚类能够为数据挖掘提供准确的依据,具有重要的应用价值。传统算法对于初始参数的选取过于敏感,从而降低了迭代聚类的准确率。提出基于并归聚类的海量数据信息中的迭代聚类方法。采用离差隶属度进行数据信息聚类中心的计算,确定数据信息的聚类中心;采用类间距离作为并归聚类判别的标准,用于判定数据信息特征与聚类中心的距离;对海量数据信息特征与聚类中心的计算结果进行归类处理,直至所有的数据信息的聚类中心都结束并归,从而获得准确的迭代聚类结果。仿真实验结果表明,改进算法能够提高海量数据信息中的迭代聚类结果,效果令人满意。相似文献

7.

基于聚类划分的增量式关联规则研究

赵杰文原娇杰《科协论坛》2008,(8)

数据挖掘是目前信息领域和数据库技术领域的前沿研究课题,它涉及到数理统计、模糊理论、神经网络和人工智能等多种技术,技术含量比较高,实现难度也较大.本文研究了关联规则挖掘技术的基本概念、过程和算法等,为提高数据挖掘效率,提出了基于聚类划分的增量式关联规则挖掘算法.即运用快速聚类方法实现数据划分、运用改进的FP-growth算法实现关联规则的挖掘和运用增量FP-growth挖掘算法实现增量数据挖掘的关联规则挖掘算法. 相似文献

8.

中文Blog热门话题检测技术研究

张欣《人天科学研究》2011,(9):6-9

利用话题检测技术将Blog信息按照所表达的话题进行归类和组织,可以使Blog信息更加有效、准确地为用户使用。研究了话题检测模型中的词频统计、权重计算以及相似度计算,把简单聚类算法与ISODATA算法相结合,并应用到中文Blog热门话题检测系统中,实验结果表明,文本分类的效果有了进一步的提高。相似文献

9.

基于文本信息的聚类方法研究

安靖《人天科学研究》2013,(8):40-42

随着信息技术和Web技术的发展,如何从海量的Web文本信息中找到自己所需信息已成为一个重要的研究领域。在众多信息获取方法中,聚类技术是一种被广泛应用的方法。总结了文本聚类算法的研究现状,比较了算法的主要差异和整体思想,并分析了各种方法的优劣,同时指出了文本聚类研究今后的发展趋势,即在粒子群聚类过程中融入其它传统聚类方法的思想,以提高聚类性能。相似文献

10.

基于人工免疫增量的聚类算法

谢静苏一丹《大众科技》2010,(12):38-39

文章提出了一种基于人工免疫增量的聚类算法。该算法在人工免疫可更新聚类算法的基础上,结合蚁群增量聚类算法的思想,将原聚类得到的记忆抗体矩阵作为初始矩阵,调用人工免疫聚类算法处理增量数据,然后采用类解体机制处理类内误差超过规定阈值的聚类。相似文献