首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 0 毫秒
1.
K-means算法是解决聚类问题的经典算法,在满足一定的条件情况下,聚类的结果比较好.但这种算法对初始聚类中心敏感,聚类结果随不同的初始输入而波动.针对这种缺陷,提出了一种新的基于数据样本分布选取初始聚类中心的算法.  相似文献   

2.
互联网时代,网络焦点话题讨论对当代高校学生的思想有很大影响,因此对高校舆情进行监测具有十分重要的意义。通过改进的K-means算法对高校舆情进行聚类,获取舆情热点。通过聚类算法获取热点话题,进而对热点舆情话题进行引导,对改进高校学生思想政治工作作用显著。对改进算法进行实验,结果表明该算法准确率达到75%,比传统算法高出8%,改善了传统算法的聚类效果。  相似文献   

3.
陈琍 《钦州学院学报》2006,21(6):36-37,41
从数据挖掘方法中常用的聚类算法的基本原理,将聚类算法中的K—means算法用于客户关系管理系统中,实现客户分类.并且对K—means算法进行了改进,根据客户信用特征对客户进行预分类,提高了算法的效率.  相似文献   

4.
重点讨论了聚类分析方法中K-means聚类算法在客户价值分析中的作用,通过对客户的现有价值和潜在价值进行分析,对客户进行细分。在此基础上,企业可结合行业的特征找出各类客户的特点,实行差异化服务策略,让更好的资源和服务提供给最有价值客户,从而达到顾客满意、企业盈利的目的。  相似文献   

5.
6.
针对传统协同过滤推荐算法中存在的数据稀疏性问题,提出了一种基于二分K means的协同过滤推荐算法。该算法在K means算法的基础上,为了降低初始质点选择对聚类结果的影响,在运行中逐个添加质点。首先初始化评分数据并将其作为初始簇,然后选择合适的簇随机产生两个质点将簇分裂为两个簇,重复上述步骤,直到聚类完成。最后为了降低不同用户评分标准差异,将用户评分的平均值和用户同簇内相互间的相似度相结合,计算预测评分矩阵,生成推荐结果。实验结果表明,改进后的算法较好地解决了数据稀疏问题,提高了推荐质量。  相似文献   

7.
聚类分析广泛应用于商务智能、图像模式识别、Web搜索、生物学等领域,是一种无指导的观察式学习。然而,绝大多数聚类分析算法都面临着一个非常棘手的问题——最佳聚类数的确定。K-means是典型的基于划分的聚类方法,它需要用户输入聚类数K,但这通常非常困难。聚类数的确定是决定聚类质量的关键因素。虽然有许多被用来估计最优聚类数的聚类评价指标,但对于不同的聚类算法,不同的评价指标效果差异很大。为确定针对K-means聚类算法效果最好的评价指标,采用4种典型的不同聚类结构特征的人工模拟数据以及来自UCI的真实数据集对7种评价指标的性能进行实验比较,结果表明CH指标和I指标在评估K-means算法的最佳聚类数时效果较好。  相似文献   

8.
传统的K—means算法对初始聚类中心敏感,聚类的结果随不同的初始输入而波动.为了消除这种敏感性,提出了一种改进的K-means算法,改善聚类算法中选取初值的依赖性,提高聚类结果的稳定性.仿真实验结果表明:改进后的K-means算法优于原始算法.  相似文献   

9.
沈泓  刘顺 《教育技术导刊》2017,16(3):103-107
阐述了如何使用数据分析模型进行数据收集分析和处理,以及如何通过K-means聚类算法及线性回归模型建立合理预估模型。电能在从发电厂传输到用户的过程中,在输电、变电、配电以及营销管理的各环节中会产生电能损耗,如果线路损耗较高,则会对电网运行的安全性与经济性造成直接影响,同时也会加快线路老化或损坏速度。合理分析预估模型,可以找出差异性较大的台区着重进行管理与监测,并于用户操作区的Web端进行展示,进而有效预测出哪些台区可能存在偷窃电行为或其它影响正常供电的不合理行为,为供电工作提供有效辅助。  相似文献   

10.
随着智慧农业的发展,农业生产中海量数据不断涌现。在海量数据中难免存在噪声数据,这些数据不仅难以提供有效价值,还会影响信息挖掘。针对该问题,采用基于密度的DBSCAN聚类算法进行异常数据处理。鉴于DBSCAN算法对参数敏感,结合数据集本身特性与统计学思想以绘制各点之间的距离升序曲线,预估出DBSCAN的Eps参数。仿真实验结果表明,改进算法平均准确率达到99.6%,较传统算法提高了1.7个百分点,并且在10次检测中,改进算法只有3个数据判定错误,证明该参数设置方法对异常数据处理准确率更高,稳定性也更好。  相似文献   

11.
在对免疫聚类类型和流程分析的基础上,结合混沌变量的遍历性和聚类融合方法,提出了基于改进aiNet(artificial immune net)聚类算法CO-aiNet(Chaos optimization of artificial immune net)的异常检测算法ICDA(Immune clustering based Anomaly detection)。CO-aiNet算法在引入权重矢量、相关度等基础上,采用模拟退火算法和概率准则优化监测数据,优化了聚类效果;引入异常因子概念,通过对多次聚类融合后的数据按照异常标记次数排序,得到异常数据集。实验表明,CO-aiNet算法聚类效果优于同类算法,基于聚类融合的异常检测准确性和稳定性显著提升。  相似文献   

12.
介绍了web日志挖掘概念,利用改进后k-means聚类算法对网吧web日志挖掘,对网吧用户行为聚类分析,找出用户的偏爱,以便网吧管理员更好定制网吧网络管理策略.  相似文献   

13.
传统的异常检测方法要求训练数据集完全由已标记为正常的实例所构成,但在实际应用中,很难得到这样的训练数据集。本文提出了一种基于聚类分析的非监督式异常检测方法,该方法的优点在于不需要任何标记数据,并且能够实现网络连接数据的实时检测。实验采用KDD99数据集进行测试,结果表明,该方法具有比较高的检测性能。  相似文献   

14.
分析几种主要线损计算方法优缺点及线损分析中数据挖掘算法应用,提出基于线损时域特征指标和改进K-means算法的馈线线损计算方法。充分利用线损信号中的时域信息,获取线损信号中的平均线损率、线损率变异系数、线损率变化趋势等表征线损信号的非平稳特征。使用该算法对区域889条馈线线损进行计算分析,取轮廓系数最大时对应的k值进行聚类分析,经过65次迭代得到8个聚类结果,其中第7类平均线损率高达33.5%,第5类线损率为17.8%,但线损率变化趋势达308。可以进一步对该类馈线上的用电客户负荷曲线进行跟踪分析,确定是否存在窃漏电行为。  相似文献   

15.
K-means算法在聚类过程中随机选取k个初始聚类中心,容易造成聚类结果不稳定。针对该问题,提出PCA-TDKM算法:使用主成分分析法对数据对象集合的属性进行降维,提取出主属性,去掉无关属性,从而加速聚类过程;基于最小生成树算法及树的剪枝方法将数据对象划分为k个初始聚类簇,然后进行剪枝生成k棵子树,计算每棵子树中所有数据对象的均值,作为初始聚类中心;利用基于密度与最大最小距离的算法思想进行聚类。将PCA-TDKM算法与K-means、KNE-KM、QMC KM、CFSFDP-KM在UCI数据集上进行聚类比较,结果表明该算法聚类结果稳定、聚类准确率高。  相似文献   

16.
文献著者消歧是人名消歧的一种,近年来引起了学术界的广泛关注。其中,文献聚类方法是文献著者消歧的重要方法,但其实验效果往往不佳。基于此,对文本聚类K-means方法进行改进,并在此基础上来实现文献著者消歧。实验结果表明,改进的K-means算法能有效提高文献著者消歧的实验效果。  相似文献   

17.
基于模糊C均值的异常流量检测模型   总被引:1,自引:0,他引:1  
对网络进行流量异常检测,流量出现异常后再对数据包进行分析,通过这种方法能够降低系统开销,聚类算法是一种有效的异常入侵检测方法,可用在网络流量异常检测中,用于判定当前网络流量是否出现异常,本文将模糊C均值算法应用于流量异常检测模型中,通过实验,该模型能够有效检测出流量的异常状态.  相似文献   

18.
《柳州师专学报》2015,(6):108-110
K-means算法是一种基于划分的方法,该算法对初始聚类中心的选取依赖性极大,初始中心值的不同导致聚类效果不稳定.为此,本文利用几何概率的思想,认为每个数据点都是等概率的存在于数据集,通过计算每个数据点的点概率值,结合距离因素,选择K个点作为初始聚类中心.实验证明,改进后的K-means算法聚类效果更好.  相似文献   

19.
针对传统检测方法对焊接缺陷图像识别的缺点,提出基于改进粒子群算法优化的K-means聚类的焊接缺陷图像识别方法。运用HOG算法提取焊接缺陷图像的特征,利用IPSO算法对K-means聚类模型的聚类点数K进行参数寻优,从而实现对焊接缺陷的检测识别,实验验证表明,该方法能够有效提高焊接缺陷图像的识别效果,总体识别准确度达到94%。  相似文献   

20.
随着人类产生的数据量呈指数级增长,数据的海量、多样化等特征使传统的聚类算法无法处理这些数据,而近来较为流行的Hadoop平台在处理数据的速度上也达到瓶颈。因此,专家们想要研究一种更为适合的处理平台来处理遇到的海量数据,Spark平台应运而生。首先介绍了聚类算法定义与分类,随后提出了Spark平台,包括Spark核心技术(RDD)、Spark和Hadoop的对比,并介绍了K means在Spark平台上的实现,最后总结了Spark的应用现状并对其未来发展进行了展望。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号