共查询到20条相似文献,搜索用时 15 毫秒
1.
郑继绍 《廊坊师范学院学报(自然科学版)》2014,14(4)
使用一种模仿人类形象思维的图像特征提取方法,把图像映射为高维空间的一个点,并以此作为特征向量.计算高维特征空间中的点之间的距离,并在此基础上,使用K近邻算法进行图像分类.实验表明,与使用其他方法的特征提取下的K近邻算法相比,该方法具有优越性. 相似文献
2.
面向高维数据的聚类分析是当今数据挖掘研究的重要领域,其中的关键问题在于如何对高维数据的聚类结果进行高效率的可视化分析。针对这一问题首先使用了数据聚合树(DA树)作为代表高维数据集的数据结构,并将一个新的聚集算法(CLUK算法)应用于该数据集,获得聚类分析的结果,然后搭建了一个可视化平台(Hvis),最后利用平行坐标法在... 相似文献
3.
为了降低偶然因素的影响,提出了一种基于改进预测强度的大数据K 均值聚类方法,其基本思想是:首先将数据集若干等分,每一等分轮流作为测试集,取其平均预测强度,然后根据预测强度确定聚类数和聚类变量,再用K 均值聚类方法对数据集进行聚类。用上述方法研究了访客在某网站各栏目的平均停留时间,结果表明,基于预测强度的聚类方法较常规聚类方法更适宜于大数据的聚类分析。 相似文献
4.
《绵阳师范学院学报》2018,(8):107-111
本文研究的内容是通过改变适应度的选取方式,通过累计各个接节点的适应度,利用加权计算求取适应度,在结合SVM决策树组成CFGA-SVM,通过这种算法计算出来的结果相比较GA-SVM取得了很大的进步,并且这种方法适应的样本量度更大,在发展遗传计算求解的过程中,未来还会具有很好的发展. 相似文献
5.
基于K-均值算法的模糊分类器具有很好的分类效果,用它可以很准确的对训练样本进行分类,此方法是将K-均值算法应用于训练数据的聚类,对每个聚类的半径和聚类的中心都是可计算的,而模糊系统设计方法就是用模糊度来描述聚类,对训练数据进行高效且准确的分类,这种方法有下面几个特点:(a)不要预定义参数;(b)训练时间短;(c)简单;最后用一个例子对这种模糊分类器进行分析验证。 相似文献
6.
药物研发是一个难度系数大、耗费时间长的工作。根据结构活性关系规则,具有相似结构的化合物可能具有相似特性。因此,准确地对化合物进行分类具有十分重要的意义。回顾了SVM与比较常用的化合物分类方法及各自的优缺点,阐述了对分类方法进行的改进与优化,展望了化合物分类的发展方向。 相似文献
7.
分类在数据挖掘中是一项非常重要的任务,决策树方法是一种常用的分类算法,所建立的树形结构模型很直观,易于理解,特别适合处理各种分类问题。就决策树方法展开深入的研究,提出了“懒散的基于模型的分类”的思想。 相似文献
8.
基于层次的模糊K均值聚类算法研究 总被引:1,自引:0,他引:1
苏瑞 《安阳师范学院学报》2010,(2):47-50
通过对K均值聚类算法的研究,本文提出了一种基于层次聚类与模糊聚类思想的K均值聚类算法。算法首先使用层次方法对数据进行初始聚类,然后用得到的聚类数作为模糊K均值聚类中的K值,对聚类进行修正。最后通过实验,验证了该算法不需要人为假设聚类算法中的K值,而且引入了模糊隶属关系使类别的划分更接近于事实,从而证明了该算法的有效性。 相似文献
9.
10.
组织专家对一定数量但不同授课水平教师的课堂教学进行评价,使用这些小样本数据对多分类sⅧ模型进行训练,使其具有专家的评价能力,并能结合学生评价数据智能地评定其他任课教师的教学质量。本方法可以克服学生评教的局限性,使评价结果更加符合实际,经过数据实证,该方法可靠方便。 相似文献
11.
分析了基于支持向量机(SVM)的文本分类方法,在此基础上,提出一种由SVM和概率统计方法相结合的文本分类方法。详细介绍该方法的实现原理、算法描述和工作流程,并进行实验测试。 相似文献
12.
SVM(Support Vector Machine,支持向量机)是由Vapnik等人提出的一种新的机器学习方法。以结构误差理论、条件二次优化理论与核空间理论作为理论基础,能够较地的解决机器学习的问题,如模型选择、过学习、非线性问题和灾难维数等,很适合应用在文本分类领域。针对文本分类技术的新问题,研究了已有的主动学习方法并对其进行改进,提出了一种新的主动学习算法,很好地解决了小规模标注样本集的分类问题。该方法尤其在难以获得大量类标签或者标注样本耗费较大的领域,更能显示出它的优越性,适合日新月异的互联网的应用。 相似文献
13.
词向量在自然语言处理中起着重要作用,近年来受到越来越多学者关注。然而,在词向量研究中,基于Word2vec词向量的应用研究居多,对于GloVe词向量的应用研究却很少。因此,将GloVe词向量模型与支持向量机(SVM)相结合,利用GloVe词向量模型进行特征提取与选择,利用SVM进行分类,并与Word2vec词向量结合SVM作实验对比。实验结果表明,GloVe词向量特征提取与SVM分类相结合的方法能够取得较好的准确率、召回率及F值,因此在新闻文本分类中具有一定应用价值。 相似文献
14.
传统欠采样方法在处理不平衡数据问题时只考虑多数类样本的绝对位置而忽略了其相对位置,从而使产生的平衡数据集存在边界模糊问题。提出一种改进 K 均值聚类的不平衡数据欠采样算法(UD-PK)。该算法首先利用改进的 PSO 算法迭代寻找全局最优解作为 K-means 聚类所需初始值,然后通过 K-means 进行聚类,再按照每个类别中多数类与少数类的比例定义所取多数类样本个数,并根据多数类样本与簇心距离择优选择参与平衡数据集构造。在 UCI 数据集上的对比试验表明,该算法在少数类准确率上较一些经典算法有很大提升。 相似文献
15.
朴素贝叶斯分类是贝叶斯分类中较简单并且常见的一种分类方法,已经被广泛地应用于各领域。通过尝试利用朴素贝叶斯算法对鸢尾花数据集进行剖析,介绍了朴素贝叶斯算法的原理和基本过程。基于贝叶斯算法在依据特征独立的假设下,对鸢尾花数据集进行分类计算,准确度达到84.21%,实验结果表明朴素贝叶斯算法具有较好的分类速度和分类效果。 相似文献
16.
17.
C4.5 算法是数据分类的经典数据挖掘算法。整合并规范了临床确诊病例中的糖尿病并发症数据,同时进行了粗糙集约简,并运用C4.5算法实现了分类。研究表明,该方法能很好地实现决策分类,以辅助临床诊断。 相似文献
18.
如何从小样本、高维度特性的功能磁共振成像(fMRI)数据中识别出内在的脑区活动模式,对理解人脑意义重大。随着模式识别技术和机器学习算法的发展,fMRI的分类研究也引起了人们的重视。提出一种对fMRI数据分类的加权随机SVM集群(WRSVMC)算法。该算法分为两步,首先通过随机选择样本和特征建立多个SVM,以构建集成分类器;然后在投票过程中,对每个SVM赋权重,以优化模型的集成性能。结合fMRI数据和图论特征,采用WRSVMC算法对轻度认知障碍(MCI)患者数据展开分类研究。结果表明,准确率最高可达87.67%。该方法能帮助医师对MCI患者进行辅助诊断。 相似文献
19.
《昭通师范高等专科学校学报》2019,(5):12-16
利用对某网络公司的客户数据使用K均值聚类方法,针对数据中存在的缺失和变量共线性严重的情况,对数据进行预处理。通过选择出符合分类目的的变量得出可用于聚类的完整数据集。然后通过建模对客户进行分类,利用已人为分类的100个样本为训练集。 相似文献
20.
基于SVM的分类方法及其应用 总被引:1,自引:0,他引:1
罗坚 《浙江工贸职业技术学院学报》2008,8(3)
本文对支持向量机的原理、核函数及分类方式进行了详细的介绍,给合实例探讨了支持向量机在分类中的具体应用,并根据应用结果指出了支持向量机的优缺点,最后展望了支持向量机在分类应用的前景。 相似文献