首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 125 毫秒
1.
互联网的快速发展,使得网络成为公众发布信息和交流观点的主要平台,网络舆情成为社会舆情的重要组成部分,网络舆情数据的获取与分析为舆情态势和预警提供了技术支持,对政府掌握最新舆情动态以及我国民主法治建设、精神文明建设具有重要意义。通过对比分析,对近年来网络舆情热点的获取方法进行了研究,在理解K-means聚类算法基础上进一步改进该算法,对新闻中的关键词进行聚类分析以获得舆情热点,并给出算法实现过程。该方法为引导网络舆情发展方向提供了依据,也可以及时防范误导性言论对社会公众的消极影响。  相似文献   

2.
K-means算法是解决聚类问题的经典算法,在满足一定的条件情况下,聚类的结果比较好.但这种算法对初始聚类中心敏感,聚类结果随不同的初始输入而波动.针对这种缺陷,提出了一种新的基于数据样本分布选取初始聚类中心的算法.  相似文献   

3.
陈琍 《钦州学院学报》2006,21(6):36-37,41
从数据挖掘方法中常用的聚类算法的基本原理,将聚类算法中的K—means算法用于客户关系管理系统中,实现客户分类.并且对K—means算法进行了改进,根据客户信用特征对客户进行预分类,提高了算法的效率.  相似文献   

4.
随着人类产生的数据量呈指数级增长,数据的海量、多样化等特征使传统的聚类算法无法处理这些数据,而近来较为流行的Hadoop平台在处理数据的速度上也达到瓶颈。因此,专家们想要研究一种更为适合的处理平台来处理遇到的海量数据,Spark平台应运而生。首先介绍了聚类算法定义与分类,随后提出了Spark平台,包括Spark核心技术(RDD)、Spark和Hadoop的对比,并介绍了K means在Spark平台上的实现,最后总结了Spark的应用现状并对其未来发展进行了展望。  相似文献   

5.
为改善网络舆情态势感知与预警中舆情信息分析不准确的问题,提出基于 Spark 技术的均值漂移(MS)算法,利用该算法原理分析 Spark 框架特性,给出该算法在 Spark 框架中的实现过程,包括舆情信息预处理、特征提取、特征向量模型构建和算法聚类设计。在相同数据集下将 MS 算法和 K-means 算法聚类效果进行对比,实验结果显示,K-means 算法聚类结果受 k 值选取的影响,存在聚类结果不准确的问题;基于 Spark 的 MeanShift 算法在没有任何先验条件下舆情聚类效果优于 K-means 聚类算法,且符合预期期望。  相似文献   

6.
由于价值观念的多元化,各种思想对青年大学生产生冲击等多种原因,团组织在高校共青团员中影响力不断弱化,地位逐渐降低。试图将改进的K-means聚类算法用于高校团组织的建设中,为建立更加适合高校学生的基层团组织提供科学的依据。  相似文献   

7.
从新闻网页中自动获取大量舆情数据,经过热点提取算法划分到不同话题簇中,并获取网络舆情最新热点。通过网络舆情变动周期把握舆情随时间发展情况,利用中文分词提取每篇新闻关键词,并对网页集合利用改进K-Means算法进行分析获得热点,从而获取某事件由出现到消亡过程中的热点迁移。改进的K-Means算法能有效分析获取的热点,有利于政府通过网络舆情热点掌握最新舆论动态,引导公众正确看待问题,营造积极、健康的社会氛围。  相似文献   

8.
K-means算法作为较为普遍的聚类算法,聚类效果受孤立点、噪声点和初始聚类中心影响较大。结合Isolation Forest算法计算数据中每个样本的异常度系数,根据离群值过滤比例计算得到异常度系数阈值,对高度异常值加以隔离,并对隔离后的数据集使用平均插值法求得初始聚类中心。运用改进K-means算法对真实数据集进行聚类分析,与此同时,通过比较多个离群值过滤比例下的聚类结果,找到离群值过滤比例的最优取值。仿真结果表明,相比于原始算法,新算法显著提升了聚类准确性,聚类效果更佳。  相似文献   

9.
传统的K—means算法对初始聚类中心敏感,聚类的结果随不同的初始输入而波动.为了消除这种敏感性,提出了一种改进的K-means算法,改善聚类算法中选取初值的依赖性,提高聚类结果的稳定性.仿真实验结果表明:改进后的K-means算法优于原始算法.  相似文献   

10.
聚类分析广泛应用于商务智能、图像模式识别、Web搜索、生物学等领域,是一种无指导的观察式学习。然而,绝大多数聚类分析算法都面临着一个非常棘手的问题——最佳聚类数的确定。K-means是典型的基于划分的聚类方法,它需要用户输入聚类数K,但这通常非常困难。聚类数的确定是决定聚类质量的关键因素。虽然有许多被用来估计最优聚类数的聚类评价指标,但对于不同的聚类算法,不同的评价指标效果差异很大。为确定针对K-means聚类算法效果最好的评价指标,采用4种典型的不同聚类结构特征的人工模拟数据以及来自UCI的真实数据集对7种评价指标的性能进行实验比较,结果表明CH指标和I指标在评估K-means算法的最佳聚类数时效果较好。  相似文献   

11.
K-means聚类算法研究   总被引:2,自引:0,他引:2  
聚类分析是模式识别中一个重要研究领域,是一种将数据划分或分组处理的重要手段和方法.K-means算法是聚类算法中主要算法之一,文章介绍了K-means聚类算法的实现方法,并对其优点和缺点进行了详细的分析.  相似文献   

12.
高校作为人才培养、知识创新、服务经济发展的高地,更承担着文化传承与创新的使命,随着高等教育大众化的深入发展,高校与地方社会发生的关系越来越多,高校网络舆情关注的话题也日益突破校内范围,因此高校网络舆情无论是舆情信息发布的主体,还是舆情关注的话题,都在不断地扩大。因此,高校网络管理工作越来越引起高校管理者的重视。  相似文献   

13.
重点讨论了聚类分析方法中K-means聚类算法在客户价值分析中的作用,通过对客户的现有价值和潜在价值进行分析,对客户进行细分。在此基础上,企业可结合行业的特征找出各类客户的特点,实行差异化服务策略,让更好的资源和服务提供给最有价值客户,从而达到顾客满意、企业盈利的目的。  相似文献   

14.
政府公文数量巨大,不同政府网站公文分类规则不一 ,在引用和参考公文时可能发生混淆 。针对该问题,基于政府公文题目、摘要和正文内容,采用 K-means 算法对公文进行分类。首先对政府公文进行分词及去停用词等数据预处理操作,再通过词频—逆文档频率(TF-IDF)权值计算方法,将处理后的政府文本信息转换成二维矩阵,然后采用 K-means 算法进行聚类。使用清华大学 THUCTC 文本分类系统对公文聚类结果进行测试。实验结果表明,采用 K-means 算法对公文进行聚类,准确率达到 82.93%,远高于政府网站公文分类准确率。  相似文献   

15.
潜在舆论是相对大众舆论来说的,潜在舆论分为两类:正常潜在舆论与非正常潜在舆论。正常的潜在舆论是在通畅的社会舆论形成渠道中,通过充分的讨论和交流形成的?它具有非主流性、个体性、反社会性及群体特征。所谓非正常潜在舆论是指由于社会舆论形成的渠道不畅所形成的潜在舆论,非正常潜在舆论具有一定正义性、突发性和破坏性。研究潜在舆论有利干更好地进行大众传播的效果研究,有利于更好地指导大众传媒的工作,有利于更好地做好社会管理工作。  相似文献   

16.
大学生舆情预警机制   总被引:1,自引:0,他引:1  
面对高校发展的新形势,建立和健全大学生舆情预警机制对于及时了解大学生的思想动态,分析和解决思想问题,把大学生培养成为一代新人具有重要的意义.本文分析了大学生舆情的特征,设计了大学生舆情预警机制:舆情信息机制和舆情解决机制.  相似文献   

17.
随着校园网络在现实生活中应用的日益深入,随之在校园网络舆论上出现的问题,要引起高校德育工作者的注意,并有必要加强对校园网络舆论的引导.高校要积极开展校园网络文化活动,进一步拓展高校校园网站内容与服务功能,增强网络德育工作的时效性、主动性、针对性.  相似文献   

18.
网络舆论与公共决策   总被引:1,自引:0,他引:1  
中国传统媒介的上层建筑属性使得“传统媒介舆论”在维护政权合法性以及树立榜样和塑造群众道德风貌方面发挥了主要作用,但由于其自身的缺陷,使得它不能很充分地反映民意,从而影响公共决策的科学性和合理性。而网络舆论,由于其自身优势,恰好弥补了这一缺陷,为公共决策进程、反馈以及决策修正的科学化提供了坚实的舆论基础。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号