共查询到20条相似文献,搜索用时 0 毫秒
1.
聚类分析在涉及多维数据分析或处理的学科中都是很普遍的。由于计算机视觉领域中的图像分割经常表示成一个聚类问题,所以聚类方法在模式识别、图像处理、信息检索中的应用越来越受关注。结合采样技术、分块技术及数据压缩技术,研究了层次聚类算法在图像处理中的应用。 相似文献
2.
针对传统协同过滤推荐算法在大数据环境下存在数据稀疏性及计算复杂性等问题,提出一种双向聚类协同过滤推荐算法。该算法首先从用户维度和项目维度两个方向分别进行属性聚类,然后在目标用户和目标项目所在类簇中分别使用改进后的相似度计算方法进行协同过滤推荐,最后通过平衡因子综合预测评分并形成最终推荐列表。在 MovieLens 公开数据集上进行实验,结果表明,该算法(DCF)相比传统协同过滤推荐算法(TCF)、基于用户聚类的协同过滤推荐算法(UCF)以及基于项目聚类的协同过滤推荐算法(ICF),在平均绝对误差上分别降低了 16%、8.1%、7.5%,有效提高了推荐精度。 相似文献
3.
4.
互联网的快速发展,使得网络成为公众发布信息和交流观点的主要平台,网络舆情成为社会舆情的重要组成部分,网络舆情数据的获取与分析为舆情态势和预警提供了技术支持,对政府掌握最新舆情动态以及我国民主法治建设、精神文明建设具有重要意义。通过对比分析,对近年来网络舆情热点的获取方法进行了研究,在理解K-means聚类算法基础上进一步改进该算法,对新闻中的关键词进行聚类分析以获得舆情热点,并给出算法实现过程。该方法为引导网络舆情发展方向提供了依据,也可以及时防范误导性言论对社会公众的消极影响。 相似文献
5.
6.
7.
8.
9.
聚类算法在B2C电子商务客户细分中的应用 总被引:1,自引:0,他引:1
郭媛香 《忻州师范学院学报》2009,25(2)
B2C电子商务的竞争对个性化服务提出更高的要求,聚类分析是在数据挖掘的基础上,根据Web用户的行为模式,将具有相似属性的用户分为一簇.最大最小距离算法按照 某种策略,选取离得尽可能远的客户作为初始中心,努力得到客户群一个比较好的初始划分,显著提高聚类质量,为电子商务企业了解客户、挖掘客户、制定营销策略,提供有力帮助. 相似文献
10.
随着人类产生的数据量呈指数级增长,数据的海量、多样化等特征使传统的聚类算法无法处理这些数据,而近来较为流行的Hadoop平台在处理数据的速度上也达到瓶颈。因此,专家们想要研究一种更为适合的处理平台来处理遇到的海量数据,Spark平台应运而生。首先介绍了聚类算法定义与分类,随后提出了Spark平台,包括Spark核心技术(RDD)、Spark和Hadoop的对比,并介绍了K means在Spark平台上的实现,最后总结了Spark的应用现状并对其未来发展进行了展望。 相似文献
11.
客户是企业的重要资源和宝贵财富,是企业赖以生存和发展的基础。了解客户的需求,提升客户的满意度,成为众多企业关注的焦点。以某宾馆客户满意度分析为例,使用模糊C—均值聚类算法对客户满意度进行分析发现,客户最关心的是地理位置、服务态度、客房设施和员工素质等因素;较为关注前台服务、环境绿化、安全设施、客房服务、停车设施等因素;不太关注娱乐设施、周边环境、餐厅服务等因素;不关注会议设施和商务服务等因素。 相似文献
12.
李玉梅 《天津职业院校联合学报》2011,13(2):78-81
论文提出了一种基于蚁群动态模糊聚类算法的计算机图像分割方法,有效地利用蚁群算法的聚类分析能力,克服了FCM算法对初始化的敏感,动态地确定了聚类数目和中心。然后利用蚁群聚类算法得到的模型进行修改,再进行模糊聚类弥补蚁群算法的不足。最后将该算法应用到计算机图像分割技术。对比实验表明,该算法实验表明该算法速度快、划分特性好,可以准确地分割出目标。 相似文献
13.
近年来,数据挖掘技术的研究备受国内外关注,其主要原因是信息技术发展产生了大量分散的数据,迫切需要将这些数据转换成有用的信息和知识.此前的研究,主要集中于分类算法及应用方面的研究,但某些特殊领域,如生物信息学研究等,需要通过聚类方法解决一些实际问题.本文从横向深入分析了数据挖掘技术中聚类算法的发展,对层次法、划分法、模糊法,以及量子聚类、核聚类,基于密度和网格等10种聚类算法的原理、过程和特点等都进行了比较详细的分析论述. 相似文献
14.
张浩 《温州职业技术学院学报》2013,(1):84-86
在传统聚类模型的基础上,提出一种基于向量空间模型的层次聚类算法,用于文本数据的挖掘。实验结果表明,基于向量空间模型的层次聚类算法从挖掘的准确率上更具有性能优势。 相似文献
15.
K 均值算法(K-Means)是聚类算法中最受欢迎且最健壮的一种算法,然而在实际应用中,存在真实数据集划分的类数无法提前确定及初始聚类中心点随机选择易使聚类结果陷入局部最优解的问题。因此提出一种基于最大距离中位数及误差平方和(SSE)的自适应改进算法。该算法根据计算获取初始聚类中心点,并通过 SSE 变化趋势决定终止聚类或继续簇的分裂,从而自动确定划分的类簇个数。采用 UCI 的 4 种数据集进行实验。结果表明,改进后的算法相比传统聚类算法在不增加迭代次数的情况下,聚类准确率分别提高了17.133%、22.416%、1.545%、0.238%,且聚类结果更加稳定。 相似文献
16.
17.
18.
针对Web挖掘,首先论述了Web挖掘的基本理论,接着分析数据挖掘中的聚类算法,讨论了聚类分析的数据结构和数据类型,以及聚类算法的分类,详细介绍了数据挖掘中用到的主要聚类算法,最后对评价聚类结果的方法进行了分析。 相似文献
19.
20.
张戎秋 《淮南师范学院学报》2015,(3)
基于内容的图像检索研究的目的是实现自动地、智能地检索图像,研究的对象是使查询者可以方便、快速、准确地从图像数据库中查找特定图像的方法和技术。通过把分层聚类策略与传统的相关反馈算法相结合,提出一种新的图像检索方式,并通过实验加以验证。 相似文献