首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 0 毫秒
1.
彭博  程流  陈丽祥 《内江科技》2010,31(11):24-24,8
聚类是分类方法的一种,但是它有别于其他方法在于对于所研究的对象类属是未知的,需要我们通过各个对象之间的参数比较将其划分为不同的集合。本文主要利用聚类方法对多个油页岩样本研究,根据所得的"亲疏关系"划分油页岩,进而为判断该区油气成因、寻找主要的烃原岩系的位置、建立合理的含油气系统作铺垫。  相似文献   

2.
江苏省城镇居民消费支出结构分析与预测   总被引:5,自引:0,他引:5  
欧邦才  王慧敏  李金祥 《预测》2002,21(1):25-28
居民家庭消费支出结构反映了人们对各类商品的需求结构。影响居民家庭消费支出的因素很多,但其中收入水平变化起决定性作用。本文利用扩展线性支出系统模型(ELES),着重分析江苏省居民家庭消费支出结构变化与收入变化的关系,从而提示江苏省居民家庭消费支出结构的量变特性,并对其“十五”时期消费结构作出预测。  相似文献   

3.
卢雨婵 《科技创业月刊》2013,26(5):48-49,53
文章利用2008-2012年的统计数据,通过对八大类消费支出状况进行分析,并在这些分析的基础上为孝感市城镇居民消费结构的优化及产业结构的调整提供有益的咨询依据。  相似文献   

4.
郭文娟 《科技风》2022,(4):63-65
针对传统的K-means算法运行的结果依赖于初始的聚类数目和聚类中心,本文提出了一种基于优化初始聚类中心的K-means算法。该算法通过量化样本间距离和聚类的紧密性来确定聚类数目K值;根据数据集的分布特征来选取相距较远的数据作为初始聚类中心,避免了传统K-means算法的聚类数目和聚类中心的随机选取。UCI机器学习数据库数据集的实验证明,本文所提出的改进的聚类算法获得了良好的聚类效果,同时获得较高的聚类准确率。  相似文献   

5.
王洋 《科技通报》2021,37(5):26-30
为了提高电子商务网站安全分析精度,提出混合聚类算法的电子商务网站安全分析算法.首先采集电子商务网站安全分析数据,选取能够描述电子商务网站安全状态的特征,然后将超网络聚类算法和K-means聚类算法组合成混合聚类算法,并采用混合聚类算法根据特征设计电子商务网站安全状态划分的树型结构,建立电子商务网站安全分析模型,判断电子...  相似文献   

6.
文本自动聚类技术研究   总被引:1,自引:0,他引:1  
自动聚类作为一种自动化程度较高的无监督机器学习技术,在信息检索和数据挖掘领域得到了广泛的应用.探讨了文本聚类的定义和步骤,依据文本自动聚类的步骤分别对文本的处理、自动聚类算法以及文本聚类结果的评价进行了阐述.  相似文献   

7.
本文简要介绍了聚类算法在国外信息检索领域中的应用概况,并详细介绍了聚类算法在国内该领域的应用情况。列举了应用得较多的几种聚类算法,给出了在多种信息检索中聚类算法的应用过程。  相似文献   

8.
刘娟娟 《科技管理研究》2007,27(10):106-108
聚类分析用于高校科技活动的评价体现了简捷、实用的特点,是高校科技实力评估的一种可行的新途径。本文以江苏省15所部委和省属重点高校1998年至2002年科技统计指标为例,分别用动态聚类和静态聚类的方法进行分析,研究动态聚类和静态聚类用于高校科技统计指标分析时的不同特点和不同用途。  相似文献   

9.
英汉双语文本聚类是一项非常有价值的研究。使用单语言文本聚类算法,在英汉双语新闻语料基础上,对基于中文单语、英文单语和英汉双语混合的方法进行了文本聚类比较研究,实验结果表明,基于英汉双语混合的文本聚类方法可以取得较好的聚类结果。  相似文献   

10.
文本聚类算法的质量评价   总被引:4,自引:0,他引:4  
文本聚类是建立大规模文本集合的分类体系实例的有效手段之一。本文讨论了利用标准的分类测试集合进行聚类质量的量化评价的手段,选择了k-Means聚类算法、STC(后缀树聚类)算法和基于Ant的聚类算法进行了实验对比。对实验结果的分析表明,STC聚类算法由于在处理文本时充分考虑了文本的短语特性,其聚类效果较好;基于Ant的聚类算法的结果受参数输入的影响较大;在Ant聚类算法中引入文本特性可以提高聚类结果的质量。  相似文献   

11.
12.
基于LDA模型的文本聚类研究   总被引:1,自引:0,他引:1  
在Web2.0时代,网络文本数据呈现爆炸式增长,传统的文本聚类模型存在数据维数过高,数据稀疏,缺乏语义理解等问题。针对以上问题,本文提出了一种基于LDA模型,通过Gibbs算法估计文本的主题概率分布,利用JS(Jensen-Shannon)距离作为文本的相似性度量,然后采用层次聚类法进行聚类。实验得到较高的聚类纯度(Purity)和Fscore值,表明该方法是有效的。  相似文献   

13.
核聚类算法研究   总被引:1,自引:0,他引:1  
徐小峰  朱杰  张舒 《大众科技》2010,(9):24-24,23
聚类算法是数据挖掘的基本算法之一,核聚类方法通过引入核方法,把输入空间的数据非线性映射到高维特征空间,增加了数据点的线性可分概率,扩大数据类之间的差异,使得到的聚类结果更准确的反应分布的情况。  相似文献   

14.
在传统聚类中,各特征权重或均相同或需由专家给出.并在各分类中同等使用。针对特征权重在聚类中的重要性,突出各维特征对聚类的不同影响.为此提出一种权重自动生成.在动态聚类过程中得以优化,并且各子集中特征权重互不相同。通过IRIS真实测试实验,说明使用此特征加权聚类会提高聚类精确度。  相似文献   

15.
限制性聚类是一种试图将用户监督信息加入到已有聚类算法中的一种分类技术,目前已经被广泛应用于K-means算法和层次聚类算法中.在本文中,提出一种将限制条件加入到谱聚类算法的半监督聚类方法,利用正约束和负约束限制来构造约束矩阵,通过它们来引导聚类过程,并结合最优化技术,达到聚类的目的.数据实验验证了这种方法具有很好的精确度.  相似文献   

16.
梅梦 《科技广场》2007,(11):26-27
本文对聚类分析中聚类算法的基本理论进行了详细分析研究,并在此基础上,提出了一个聚类算法的通用算法框架。  相似文献   

17.
在分析folksonomy概念空间构建的可行性的基础上,对基于向量空间模型的传统聚类方法和概念空间模型的标签聚类方法进行比较,提出了基于概念空间模型的folksonomy聚类方法,并使用学术资源标注网站CiteUlike的真实标签数据集进行试验.  相似文献   

18.
针对客户行为的不确定性和模糊性,将模糊聚类集成技术应用于CRM中的客户细分研究,以提高客户聚类的精度.以模糊C均值(FCM)算法作为基本的聚类器,应用模糊t-范式对生成的多个聚类器进行集成,从而获得最终的客户聚类结果.最后,在1O个UCI数据集上进行聚类测试,结果表明,基于模糊t-范式的模糊聚类集成方法的聚类精度要高于常用的客户聚类FCM和K-means方法.在客户信用卡数据集Australian上的学习曲线还表明,聚类集成方法具有更稳定的聚类性能.  相似文献   

19.
在阐明文献聚类的基本概念和重要作用的基础上,介绍了当前最流行的两种文献聚类方法:层次聚类和划分聚类;论述了三种主要的文献聚类评价函数:F—measure、平均查准率、熵;指出了文献聚类函数的优缺点。  相似文献   

20.
付淇  黎虹  李广振 《科技广场》2010,(1):237-240
流数据挖掘技术是数据挖掘领域的新研究方向之一,而聚类研究又是其重要的内容。本文介绍了流数据基本特点,在统一流聚类表示模型的基础上,对现有流数据聚类算法进行了总结,并进一步提出了流数据聚类技术的研究方向和前景。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号