首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
文章概述了多目标优化方法解决机器学习问题的现状,重点对基于Pareto的多目标优化方法进行分析,通过有监督学习中的分类问题和无监督学习中的聚类问题,表明使用基于Pareto多目标优化方法解决机器学习问题的优点,得到对所解决问题的更深的认识。  相似文献   

2.
在生物学研究中,需要对基因进行分类,以获得对种群固有结构的认识,有效鉴别基因表示数据的模式是研究DNA序列的重要基础。在已有最大树聚类理论基础上,引入模糊聚类思想,提出了最大树基因聚类算法,同时将该方法用于基因的聚类分析,实验结果表明它们是有效可行的。  相似文献   

3.
网格化管理是高校学生工作发展的必然趋势之一。本文构建了高校学生行为规范预警系统,将学生的行为划分为模范带头行为、典型失常行为和失联可疑行为三大类,典型失常行为又根据学生的晨跑签到、食堂就餐、上网时长和晚归时长等信息分为四小类。并根据聚类分析模型和判别分析模型探讨各类行为对应学生群体的分类准则,最后利用计算机仿真进行系统的检验,结果显示本文构建的模型和系统具有较好的实用性。  相似文献   

4.
传统的分类算法大多假定用来学习的数据集是平衡的,但实际应用中真正面临的数据集往往是非平衡数据。针对非平衡数据,利用传统的分类方法往往不能获得良好的性能。文章提出了一种新的基于聚类的非平衡分类算法,通过聚类生成多个聚类体,在每个聚类体中选取一定数量的数据作为训练样本,有效地处理了样例数据的不平衡问题,在相关数据集上的实验验证了本方法的有效性。  相似文献   

5.
利用数据挖掘中的分类、关联规则和聚类等技术,完成了对系统审计数据的分析、分类规则的学习及入侵模型的建立,实现了对入侵攻击及系统异常行为的检测。通过对测试结果的分析,验证了将数据挖掘理论融入安全审计分析是可行和有效的。  相似文献   

6.
利用SPSS软件对柚类20个品种的19个叶片性状进行了Q型聚类及其R型聚类,结果表明,20个柚品种可分为4个组群;19个性状可以分为3个组群。试验结果与其他学者的分类结果相补充,为今后更好的利用形态学指标评定柚类品种及根据分类结果来丰富育种材料提供了更多的依据。  相似文献   

7.
有序样本的聚类关键是建立合理的分类指标。将系统聚类法与Fisher算法相结合,引入样本一阶自相关系数描述相邻样本间的相关关系,并以此为分类指标,进行分类。最后运用离差平方和确定最优分类数及分类结果,分类结果符合实际。  相似文献   

8.
针对低维多流形非相似结构数据,提出一种基于变化率聚类的算法。首先观察数据,按结构对数据进行分类,然后在同构的数据点之间按变化率进行划分,最终实现数据聚类。实验结果证明,该算法能够有效对低维多流形非相似结构数据进行聚类分析,聚类效果明显优于LRR、SSC等传统算法,且时间复杂度较低,有较强的适用性。  相似文献   

9.
为了解决数据高维、海量导致聚类算法处理效果不佳的问题,提出将流形学习理论引入客户关系管理进行聚类研究。为了较好的分析客户价值,在Kmeans聚类的基础上引入流形学习理论。客户价值分析一般包含数据的抽取、探索以及预处理、模型建立几个步骤。在模型建立过程中一般采用Kmeans聚类实现。使用流形学习的谱聚类来替代Kmeans聚类。使用泰迪杯数据挖掘大赛中的数据进行试验,通过实验的雷达图可以看出,谱聚类与Kmeans聚类具有相似的分类构成。同时对于分类后的数据进行规约并绘制散点图,比较后发现,谱聚类后的数据类间相似度比Kmeans高,表明将流形学习方法引入客户价值分析,对于聚类稳定性有一定改善。  相似文献   

10.
本文对群体多目标规划(Group Multiobjective Programming)(GMP)的群体一致Pareto有效解和群体一致Pareto弱有效解的存在性进行了初步探讨,并引进了(GMP)的群体一致p—Pareto(弱)有效解定义.  相似文献   

11.
介绍了一种基于目标重要度的多目标优化非劣解的模糊决策方法,本方法通过权系数的随机变化而得到了在目标空间内分布均匀数量众多的Pareto最优解集,并通过Pareto最优解其自身信息对解集进行分类,给出代表个体,方便决策者从中选择适合自己的Pareto最优解.  相似文献   

12.
基于K-均值算法的模糊分类器具有很好的分类效果,用它可以很准确的对训练样本进行分类,此方法是将K-均值算法应用于训练数据的聚类,对每个聚类的半径和聚类的中心都是可计算的,而模糊系统设计方法就是用模糊度来描述聚类,对训练数据进行高效且准确的分类,这种方法有下面几个特点:(a)不要预定义参数;(b)训练时间短;(c)简单;最后用一个例子对这种模糊分类器进行分析验证。  相似文献   

13.
为了使基于网格的聚类技术适用于多密度数据集,提出一种基于局部密度的聚类算法。算法提出将数据单元格密度分类的方法,使得具有不同密度的单元格使用不同密度阈值的进行聚类。同时给出了边界单元的处理方法以提高聚类结果的精度。实验结果表明,GLD算法比其他类似算法有较高的聚类精度和效率。  相似文献   

14.
地理位置作为用户生活轨迹的具体表现,在人群分类中有着举足轻重的作用。地理位置数据具有高维稀疏性,已有人群分类方法需对位置数据进行特征选择并提前确定特征数,实际应用中存在不便。针对该问题,提出基于地理位置人群分类的一种非参数聚类方法。该方法首先利用分层狄利克雷过程(Hierarchical Dirichlet Process,HDP)无监督学习出最佳特征个数;然后利用潜在狄利克雷分布(Latent Dirichlet Allocation,LDA)对位置数据进行特征选取,同时得到功能特征概率矩阵;最后将其作为聚类权向量计算用户间的相似度,利用亲和力聚类(Affinity Propagation,AP)实现人群分类。实验结果表明,该方法较传统方法消耗时间更少、占用内存更低,且同时具有较高的F measure。  相似文献   

15.
随着宏基因组学的不断发展,揭示了微生物菌群在研究中的重要作用。采用K-Means聚类算法对来源于北平顶猴阴道微生物群落OTUs数据集的27个样本进行研究,并与PCA主成分分析法进行对比。K-Means聚类将OTUs数据集分成4个Cluster,而PCA将OTUs数据集划分成5个Cluster。此外,结合样本的元数据-pH,发现样本间的pH值相似性更能与K-Means聚类的分类保持一致。相较于PCA主成分析方法,K-Means聚类能更精确地对OTUs数据集进行分类。  相似文献   

16.
基于数据挖掘的医学图像分类方法研究是多媒体数据挖掘的一个重要组成部分。在分析和总结了现有各种特征提取方法的基础上,提出了基于核密度估计聚类和关联规则的医学图像分类算法和关联规则的医学图像分类器框架。该算法先用核密度估计的聚类算法实现医学图像的聚类,在聚类的结果上提取局部特征,在局部特征上用关联规则实现医学图像的分类。实验结果表明可以较好的提高医学图像分类的准确率。  相似文献   

17.
实验室耗材管理是实验室科学管理的重要组成部分,也是关系到检验结果正确与否、实验室人员安全以及环境负荷的一项重要工作。实验室耗材一般分为试剂类耗材和非试剂类耗材。针对非试剂类耗材提出两种分类方法,即根据用途的分类法和基于价值的ABC分类法。进而,结合多年的工作实践对非试剂类耗材从采购至出库的全过程管理进行了介绍。最后,对非试剂类耗材的信息化管理进行了讨论。  相似文献   

18.
传统的舆情分析多采用文本聚类和分类技术,但是由于自然语言自身表达的复杂性和灵活性,文本聚类和分类技术很难从根本上反映话题评论人员对待话题的真实态度。针对文本聚类和分类技术的局限性,设计了应用于公司舆情分析的改进概念图算法。改进的概念图能表示部分概念节点的倾向性,利用改进的概念图计算每条评论的健康度,可有效地从语义分析角度计算评论语句的健康度。研究结果表明,应用于公司舆情分析的改进概念图算法,其正确率普遍高于基于文本聚类和分类技术的舆情分析方法。  相似文献   

19.
数据流聚类和传统的聚类有很大不同,本文首先介绍了数据流的定义和窗口模型的分类,然后比较了几种具有代表性的数据流聚类算法,最后展望了数据流聚类的发展.  相似文献   

20.
聚类分析是数据挖掘中的一个重要研究领域,是一种数据划分或分组处理的重要手段和方法。通过基于迭代思想的聚类算法,可对给定的数据对象集合进行层次分解,最终将样本空间分类成有聚类集合。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号