首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 15 毫秒
1.
提出改进的并行化谱聚类算法。该算法对于距离矩阵与相似度矩阵进行了改进,并在其中加入了kd树技术以对大规模数据进行稀疏化处理;然后在进行数据特征计算时,将数据以拉普拉斯矩阵的方式存入Hadoop之中,通过运行Lanczos分布计算的形式得到了其向量特征;最后运用在聚类算法中的较为高效的k-means聚类算法对向量特征的转置矩阵进行处理从而得到了需要的聚类结果。仿真实验结果表明,本文所提出的谱聚类并行算法能够为大规模的数据挖掘工作带来性能的巨大提升。  相似文献   

2.
模糊支持向量机(FSVM)具有很好的抗噪声能力,受到了很多专家的重视。然而模糊支持向量机算法的时间复杂度通常较高。针对这一不足,本文提出了一种基于核聚类的模糊支持向量机算法。首先根据核聚类算法对每一类原始样本进行聚类,然后对每一簇求样本中心,用样本中心作为新的样本点替换该类别的原始样本。最后本文算法利用中心距离型计算新样本的模糊权重,并利用模糊支持向量机算法进行求解。实验充分验证了本文算法相对于传统模糊支持向量机方法具有更快的分类速度。  相似文献   

3.
提出一种基于共轭梯度对数分解的大数据分类数学仿真模型。构建基于K-means算法的数据分类目标数据生成模型,采用共轭梯度对数分解方法对大数据集进行规范化处理,构建数据融合适应度矩阵,基于Lagrange定理,全局搜索性寻找聚类中心的最佳值求得聚类目标函数,确定边界隶属度特征的一个初始值,实现对大数据分类模型优化设计。仿真实验表明,采用该分类模型,数据分类寻优性能较好,各类数据的特征分类准确,收敛性较高。  相似文献   

4.
【目的/意义】通过概念层次关系自动抽取可以快速地在大数据集上进行细粒度的概念语义层次自动划分, 为后续领域本体的精细化构建提供参考。【方法/过程】首先,在由复合术语和关键词组成的术语集上,通过词频、篇 章频率和语义相似度进行筛选,得到学术论文评价领域概念集;其次,考虑概念共现关系和上下文语义信息,前者 用文献-概念矩阵和概念共现矩阵表达,后者用word2vec词向量表示,通过余弦相似度进行集成,得到概念相似度 矩阵;最后,以关联度最大的概念为聚类中心,利用谱聚类对相似度矩阵进行聚类,得到学术论文评价领域概念层 次体系。【结果/结论】经实验验证,本研究提出的模型有较高的准确率,构建的领域概念层次结构合理。【创新/局限】 本文提出了一种基于词共现与词向量的概念层次关系自动抽取模型,可以实现概念层次关系的自动抽取,但类标 签确定的方法比较简单,可以进一步探究。  相似文献   

5.
研究多源语义特征分层数据库中的大数据聚类方法,实现数据的分类识别。多源语义特征分层数据库中由于路由冲突,在链路负载较大的情况下,不能有效实现对大数据语义特征的并行搜索。提出一种基于增广链同态解析的链路分流方法避免路由冲突,实现增广链修复下大数据并行搜索聚类。构建大数据聚类的语义相似度融合模型,基于跨层链路分流算法实现增广链路分流,进行语义本体模型构建,选择采用高阶贝塞尔函数累积量作为增广链修复检验统计量,确定节点数据包的置信度,确立置信区间,在进行缓冲区溢出修复时,进行功率谱幅度特征提取,实现大数据的并行搜索聚类,进行语义本体模型构建,为离群点新建一个簇,依次对每个文档的主题词集进行处理,将每个主题词自动添加入形式背景的属性集中,采用并行搜索算法实现对语义大数据的优化聚类算法改进。仿真结果表明,采用该算法进行大数据聚类,契合度较高,误分率较低,性能优越。  相似文献   

6.
由于学生的不同,他们对高等数学的接受能力也不同,因此统一的教学无法在众多的学生中适用。对此,本文设计了一种以初始化去噪和质心优化K-means聚类算法为基础的高等数学教学分层模型,这一模型首先将噪处理标准K-means聚类算法的初始化数据,之后再改进算法的初始化数据,这一过程主要是借助优化聚类中心的方法进行。最后再在高等数学教学分层中应用这一改进后的算法。仿真实验结果证明,本文提出的以质心优化K-means聚类算法以及数据初始化去噪为基础的教学分层模型具有较好的收敛性,并且可以较好地在高等数学教学中实现分层。  相似文献   

7.
提出基于非线性Kdv-KSV方程平衡泛函的优化聚类算法,运用非线性kdv-ksv方程式定义映射集范数设置初始类聚中心,通过泛函空间完成聚类数据的中心向量数域计算,划分聚类数据目标函数,利用隶属矩阵判断划分得到最优聚类的过程。仿真实验表明,基于非线性Kdv-KSV方程平衡泛函的优化聚类算法,数据收敛速度更快,动态特性跟踪效果更好,并且降低了聚类计算对初始值的依赖性。提高了处理高维数据的能力。  相似文献   

8.
基于多因素方差分析的文本向量特征挖掘算法   总被引:2,自引:0,他引:2  
文本向量特征挖掘应用于信息资源组织和管理领域,在大数据挖掘领域具有较大应用价值,传统算法精度不好。提出一种基于多因素方差分析的文本向量特征挖掘算法。使用多因素方差分析方法得到多种语料库的特征挖掘规律,结合蚁群算法,根据蚁群适应度概率正则训练迁移法则,得到种群进化最近时刻获得的数据集有效特征概率最大值,基于最优划分的K-means初始聚类中心选取算法,先对数据样本进行划分,然后根据样本分布特点来确定初始聚类中心,提高文本特征挖掘性能。仿真结果表明,该算法提高了文本向量特征的聚类效果,进而提高了特征挖掘性能,具有较高的数据特征召回率和检测率,时间耗时较少,在数据挖掘等领域应用价值较大。  相似文献   

9.
针对传统的混合蛙跳聚类算法在差分进化时,随着迭代次数的增加,聚类中心矢量向模糊边缘贴近,导致搜索精度不高,陷入局部最优的问题。提出一种基于最小二乘算法的混合蛙跳优化聚类算法,引入模糊集合贴近度运算,对聚类中心矢量执行全局更新,避免模糊边缘的局部最优解贴近。仿真测试采用合成的二维数据进行数据聚类实验并应用到软件故障预测模型中,实验结果表明,采用该算法进行目标数据聚类,具有更好的寻优进化性能,聚类精度提高明显,在数据分类识别等领域具有很好的应用价值。  相似文献   

10.
为了提高模糊支持向量机在入侵检测数据集上的训练效率,提出了一种基于聚类的模糊支持向量机入侵检测算法.该方法可以对训练数据进行剪枝,有效地减少远离分类面的聚类边缘点的数量,同时在分类面附近保持较多的样本点,以靠近判别边界的聚类中心集合作为有效的训练样本集合对模糊支持向量机进行训练,减少了样本的训练时间,提高了算法的效率.实验结果表明该方法提高了模糊支持向量机的训练效率,而且对入侵检测是非常有效的.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号