首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 0 毫秒
1.
聚类分析在涉及多维数据分析或处理的学科中都是很普遍的。由于计算机视觉领域中的图像分割经常表示成一个聚类问题,所以聚类方法在模式识别、图像处理、信息检索中的应用越来越受关注。结合采样技术、分块技术及数据压缩技术,研究了层次聚类算法在图像处理中的应用。  相似文献   

2.
针对传统协同过滤推荐算法在大数据环境下存在数据稀疏性及计算复杂性等问题,提出一种双向聚类协同过滤推荐算法。该算法首先从用户维度和项目维度两个方向分别进行属性聚类,然后在目标用户和目标项目所在类簇中分别使用改进后的相似度计算方法进行协同过滤推荐,最后通过平衡因子综合预测评分并形成最终推荐列表。在 MovieLens 公开数据集上进行实验,结果表明,该算法(DCF)相比传统协同过滤推荐算法(TCF)、基于用户聚类的协同过滤推荐算法(UCF)以及基于项目聚类的协同过滤推荐算法(ICF),在平均绝对误差上分别降低了 16%、8.1%、7.5%,有效提高了推荐精度。  相似文献   

3.
欠定稀疏盲分离算法主要是采用"两步法":第一步用混叠信号估计混叠矩阵;第二步根据估计的混叠矩阵求解源信号.在两步法中,C-均值聚类算法和模糊C-均值聚类算法常用来估计混叠矩阵,这两种聚类的研究理论都较成熟,故它们得到很大的应用.该文在欠定稀疏盲分离中,比较了这两种算法.试验结果表明,模糊C-均值聚类算法比C-均值聚类算法估计混叠矩阵更加精确,恢复源信号精度更高,但算法复杂,分离的时间长.  相似文献   

4.
互联网的快速发展,使得网络成为公众发布信息和交流观点的主要平台,网络舆情成为社会舆情的重要组成部分,网络舆情数据的获取与分析为舆情态势和预警提供了技术支持,对政府掌握最新舆情动态以及我国民主法治建设、精神文明建设具有重要意义。通过对比分析,对近年来网络舆情热点的获取方法进行了研究,在理解K-means聚类算法基础上进一步改进该算法,对新闻中的关键词进行聚类分析以获得舆情热点,并给出算法实现过程。该方法为引导网络舆情发展方向提供了依据,也可以及时防范误导性言论对社会公众的消极影响。  相似文献   

5.
针对K means聚类算法,结合市政绩效评估的需要进行改进。以稳定K means聚类算法中心和选取最优聚类个数为目的,提出基于Kruskal算法和轮廓系数法的K means聚类算法。针对区县不同结构实际市政绩效评估数据,按照商业智能和IQR规则进行预处理,然后利用改进的K means聚类算法对预处理后的数据进行聚类分析。实验结果表明,该算法能够有效地确立各市政事件、部件的发生频数等级,帮助市政管理者发现各市政事件、部件之间关联关系,提高其科学决策能力。  相似文献   

6.
7.
针对原始类电磁机制算法中采用的局部搜索方法过于简单且寻优效率低的缺点,提出了一种改进类电磁机制算法,并用于解决大规模、非线性的阵列天线综合优化问题。改进类电磁机制算法结合稀疏阵列天线综合问题的内在机理,引入一种基于阵元状态切换的局部搜索方法来代替原有的随机线性搜索方法,能够有效地加快算法搜索速度并增强算法的全局搜索能力。二维稀疏面阵的仿真结果表明,与线性规划、模拟退火算法和混合遗传算法相比,改进后的类电磁机制算法能够获得更优的稀疏阵列。  相似文献   

8.
利用基于密度的CURD聚类算法,对不同知识点的不同媒体形式的访问数据做聚类分析,最终可以得到不同学生的媒体偏好等学习特征。这样,教师可以及时地了解学生的兴趣爱好、个性特征等信息,给予适当的建议,提供个性化的学习风格等服务,最终实现智能个性化教学。  相似文献   

9.
聚类算法在B2C电子商务客户细分中的应用   总被引:1,自引:0,他引:1  
B2C电子商务的竞争对个性化服务提出更高的要求,聚类分析是在数据挖掘的基础上,根据Web用户的行为模式,将具有相似属性的用户分为一簇.最大最小距离算法按照 某种策略,选取离得尽可能远的客户作为初始中心,努力得到客户群一个比较好的初始划分,显著提高聚类质量,为电子商务企业了解客户、挖掘客户、制定营销策略,提供有力帮助.  相似文献   

10.
随着人类产生的数据量呈指数级增长,数据的海量、多样化等特征使传统的聚类算法无法处理这些数据,而近来较为流行的Hadoop平台在处理数据的速度上也达到瓶颈。因此,专家们想要研究一种更为适合的处理平台来处理遇到的海量数据,Spark平台应运而生。首先介绍了聚类算法定义与分类,随后提出了Spark平台,包括Spark核心技术(RDD)、Spark和Hadoop的对比,并介绍了K means在Spark平台上的实现,最后总结了Spark的应用现状并对其未来发展进行了展望。  相似文献   

11.
客户是企业的重要资源和宝贵财富,是企业赖以生存和发展的基础。了解客户的需求,提升客户的满意度,成为众多企业关注的焦点。以某宾馆客户满意度分析为例,使用模糊C—均值聚类算法对客户满意度进行分析发现,客户最关心的是地理位置、服务态度、客房设施和员工素质等因素;较为关注前台服务、环境绿化、安全设施、客房服务、停车设施等因素;不太关注娱乐设施、周边环境、餐厅服务等因素;不关注会议设施和商务服务等因素。  相似文献   

12.
论文提出了一种基于蚁群动态模糊聚类算法的计算机图像分割方法,有效地利用蚁群算法的聚类分析能力,克服了FCM算法对初始化的敏感,动态地确定了聚类数目和中心。然后利用蚁群聚类算法得到的模型进行修改,再进行模糊聚类弥补蚁群算法的不足。最后将该算法应用到计算机图像分割技术。对比实验表明,该算法实验表明该算法速度快、划分特性好,可以准确地分割出目标。  相似文献   

13.
近年来,数据挖掘技术的研究备受国内外关注,其主要原因是信息技术发展产生了大量分散的数据,迫切需要将这些数据转换成有用的信息和知识.此前的研究,主要集中于分类算法及应用方面的研究,但某些特殊领域,如生物信息学研究等,需要通过聚类方法解决一些实际问题.本文从横向深入分析了数据挖掘技术中聚类算法的发展,对层次法、划分法、模糊法,以及量子聚类、核聚类,基于密度和网格等10种聚类算法的原理、过程和特点等都进行了比较详细的分析论述.  相似文献   

14.
在传统聚类模型的基础上,提出一种基于向量空间模型的层次聚类算法,用于文本数据的挖掘。实验结果表明,基于向量空间模型的层次聚类算法从挖掘的准确率上更具有性能优势。  相似文献   

15.
K 均值算法(K-Means)是聚类算法中最受欢迎且最健壮的一种算法,然而在实际应用中,存在真实数据集划分的类数无法提前确定及初始聚类中心点随机选择易使聚类结果陷入局部最优解的问题。因此提出一种基于最大距离中位数及误差平方和(SSE)的自适应改进算法。该算法根据计算获取初始聚类中心点,并通过 SSE 变化趋势决定终止聚类或继续簇的分裂,从而自动确定划分的类簇个数。采用 UCI 的 4 种数据集进行实验。结果表明,改进后的算法相比传统聚类算法在不增加迭代次数的情况下,聚类准确率分别提高了17.133%、22.416%、1.545%、0.238%,且聚类结果更加稳定。  相似文献   

16.
主要就聚类算法研究中的一些基本问题做了深入分析,明确了在应用聚类算法、改进算法或者开发新的算法时的一些基本要求,并在最后列出了各种常用算法的特点,评价了各类算法的性能。  相似文献   

17.
仿射传播聚类算法是一种比较新的基于质心的聚类算法,在图像分割领域得到了广泛应用。仿射传播聚类算法最终聚类数目会受到偏向参数P(Preference)的影响,得到的聚类数目往往偏多,影响分割质量。鉴于此,提出一种改进的仿射传播聚类的图像分割算法,该算法将仿射传播聚类算法与CURE层次聚类算法相结合,CURE算法能够对仿射传播聚类算法的分割结果进行优化。实验验证表明,改进后的算法图像分割效果更好。  相似文献   

18.
针对Web挖掘,首先论述了Web挖掘的基本理论,接着分析数据挖掘中的聚类算法,讨论了聚类分析的数据结构和数据类型,以及聚类算法的分类,详细介绍了数据挖掘中用到的主要聚类算法,最后对评价聚类结果的方法进行了分析。  相似文献   

19.
文本聚类是聚类方法的一个重要应用,是近年研究热点。对文本聚类定义、流程、相关问题进行了阐述,对其主要算法及应用领域进行了详细介绍。  相似文献   

20.
基于内容的图像检索研究的目的是实现自动地、智能地检索图像,研究的对象是使查询者可以方便、快速、准确地从图像数据库中查找特定图像的方法和技术。通过把分层聚类策略与传统的相关反馈算法相结合,提出一种新的图像检索方式,并通过实验加以验证。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号