共查询到20条相似文献,搜索用时 273 毫秒
1.
将信息熵对信息和数据的不确定性分析来度量数据所带来的不确定性程度,利用数据挖掘算法中的蚁群聚类算法,结合信息熵理论对网络客户数据进行分析,其中,信息熵理论中的不确定性分析,可以较好的帮助聚类数据对象,数据在此基础上进行再重组,其结果可进一步提高决策的有效性。 相似文献
2.
《科技通报》2015,(8)
对大数据的分层建树聚类,提高对大数据的检测和大数据应用系统的故障分析能力。传统方法中对大数据的分层聚类采用K-Means聚类算法,容易陷入局部收敛,聚类效果不好。提出一种基于核向量机的数据的分层建树聚类。采用四叉树算法对多维数据进行数据预处理,进行KNN中心区域的聚类中心扩展处理,针对大数据的类域交叉性进行了一次核向量机差分比较,得到KNN模糊划分矩阵,根据所属类别的不同对已知样本进行分层,得到一维差分分层建树模型和二维差分分层建树模型,计算数据核向量之间的相似度特征,实现矩阵的数据点数模糊集合贴近度填充,实现聚类算法改进。仿真结果表明,该算法具有优越的大数据聚类性能,收敛性好,应用到网络在线故障诊断中,实现对故障信号的和恢复跟踪,提高了故障诊断效益,展示了较好的应用价值。 相似文献
3.
4.
5.
提出一种新的选择性聚类融合算法,该算法主要基于分形维数来处理一些高维数据,选择策略则是主要基于互信息,考虑到已选聚类成员的重要程度与聚类成员的质量和多样性,此算法比较适用的数据聚集类为任意形状的,聚类融合可通过加权定义实现。仿真实验中在UCI数据集环境运用本文提出的选择性聚类融合算法,实验结果表明该算法具有良好的有效性。 相似文献
6.
对缓冲区的溢出类漏洞的线性预测是提高漏洞挖掘效率的重要一环,传统方法采用粒子群扰动聚类方法进行溢出类漏洞的预测和挖掘,存在预测精度不准的问题。提出一中基于模因组融合信息度传递的缓冲区溢出漏洞线性预测方法,实现对安全漏洞的准确检测。采用四叉树算法对混合粒子群多维数据进行数据预处理,采用模因组融合信息度传递,结合高斯变异对其进行扰动以代替随机产生新粒子个体的操作,实现对海量多模态数据的优化聚类和线性预测。实验结果表明,算法能准确跟踪溢出类漏洞的演化轨迹,实现对溢出类漏洞的线性预测,预测精度提高24.3%,漏洞挖掘性能提高,保证了应用信息应用环境安全。 相似文献
7.
8.
9.
《科技通报》2016,(8)
二阶锥规划是在有限个二次锥的笛卡尔空间仿射变换交集上的极小化和极大化线性函数,采用修正的二阶锥规划模型,结合二阶锥的凸优化条件,进行大数据聚类算法改进,提高数据的聚敛性。传统方法中对大数据聚类的二阶锥规划模型采用线性对偶锥规划方法,对数据聚类的路径跟踪性能不好。提出一种基于修正的齐次二阶锥规划模型的大数据聚类算法。进行数据的特征挖掘和信息流模型构建,从大量的、有噪声的、模糊的数据中进行大数据的功率谱密度特征提取,采用粗糙概念格方法对大数据信息流进行二阶锥规划模型构建,结合齐次二阶锥规划模型算法有限收敛性,对每一数据聚类样本进行可靠性衡量,实现数据聚类中心的准确搜索。对聚类误差函数求最优解,使得误差收敛到零。仿真结果表明,该算法进行数据聚类的精度较高,收敛性较好,避免了出现局部最优解,性能优越于传统算法。 相似文献
10.
11.
目前提出的大多数聚类融合算法在策略选择上未能同时兼顾聚类成员的多样性及质量,而且对高维数据的聚类结果均不理想,针对以上问题,本文提出一种改进的投影聚类融合算法,该算法主要在以往经典的投影聚类算法的基础上进行了改进,将投影聚类与分形维数结合,可对高维数据集进行降维聚类处理;而且该算法将选出最优参照成员,并设计出合理的选择策略,对部分优质成员进行选择,以得到一个更加准确的最终结果。高维数据聚类仿真实验结果表明,本文提出的改进的投影聚类融合算法与其他经典数据聚类融合算法相比,提高了聚类的有效性,大大提高了数据融合性能。 相似文献
12.
《科技通报》2016,(3)
研究多源语义特征分层数据库中的大数据聚类方法,实现数据的分类识别。多源语义特征分层数据库中由于路由冲突,在链路负载较大的情况下,不能有效实现对大数据语义特征的并行搜索。提出一种基于增广链同态解析的链路分流方法避免路由冲突,实现增广链修复下大数据并行搜索聚类。构建大数据聚类的语义相似度融合模型,基于跨层链路分流算法实现增广链路分流,进行语义本体模型构建,选择采用高阶贝塞尔函数累积量作为增广链修复检验统计量,确定节点数据包的置信度,确立置信区间,在进行缓冲区溢出修复时,进行功率谱幅度特征提取,实现大数据的并行搜索聚类,进行语义本体模型构建,为离群点新建一个簇,依次对每个文档的主题词集进行处理,将每个主题词自动添加入形式背景的属性集中,采用并行搜索算法实现对语义大数据的优化聚类算法改进。仿真结果表明,采用该算法进行大数据聚类,契合度较高,误分率较低,性能优越。 相似文献
13.
14.
攻击容忍系统通过对病毒入侵路径和频率进行扫频实现对病毒的挖掘,传统的扫频方法采用相位和频率特征匹配方法进行,对网络病毒非规则方向入侵不能起到较好的掩盖作用,扫频效果不好。提出一种采用病毒传播方向聚类分析的攻击容忍系统扫频方法,构建病毒传播路径分析模型,建立病毒传播的方向性空间搜索属性序列,分析病毒传播方向聚类演化模型,实现对病毒传播和入侵传播方向聚类过程的建模,求解病毒传播方向的聚类属性的信息熵,实现攻击容忍扫频改进算法。实验结果表明,算法能有效实现对病毒传播和扩散的时间和频率等信息进行扫频分析,病毒时频特征得到有效挖掘,通过扫频检测准确率较传统该方法提高13.6%。 相似文献
15.
研发项目是涉及顾客需求、产品功能和部件、团队等多知识领域的复杂系统,与大数据技术相关的知识图谱方法可以更加客观全面地展示、分析不同领域间的关联,为此,本文提出新产品开发(NPD)知识图谱,并将其与依赖结构矩阵(DSM)等方法相结合,以识别研发项目中多领域间的相互依赖关系。首先,本文建立依据NPD知识图谱测度顾客需求优先序的模型,并采用DSM和质量功能展开(QFD)方法,建立由“需求-功能”QFD关联推导功能间依赖关系强度的模型。然后,采用“功能-产品”多领域矩阵(MDM)推导部件间的依赖关系强度。最后,对DSM进行聚类,为提高聚类算法的稳定性,采用改进的信息熵,建立了改进的基于信息熵的两阶段DSM聚类模型,算例分析表明,该方法可明显降低类间的协调复杂性并提高算法的稳定性。 相似文献
16.
针对知识发现中的信息模糊查询问题,提出了一种基于神经网络的信息聚类及联想实现方法。首先按照信息分类对所要查询的信息进行量化编码,然后对编码后的数据进行规整处理。对于信息聚类采用均值聚类算法,而信息联想采用Hopfield网络实现。将基于上述算法开发出的信息模糊查询系统应用于图书信息查询,实验结果证明了该方法的有效性。 相似文献
17.
针对传统的K-means算法运行的结果依赖于初始的聚类数目和聚类中心,本文提出了一种基于优化初始聚类中心的K-means算法.该算法通过量化样本间距离和聚类的紧密性来确定聚类数目K值;根据数据集的分布特征来选取相距较远的数据作为初始聚类中心,避免了传统K-means算法的聚类数目和聚类中心的随机选取.UCI机器学习数据... 相似文献
18.
为了实现对提取边界后剩余数据对象的聚类,提出一种由图像边缘出发进行聚类的算法。该算法首先采用深度优先搜索的策略将已知的边界对象进行分类,并计算各边界曲线的最小外包矩形区域;然后运用夹角和法去除内边界类;最后依据近邻原则对每一个核心对象进行归类。实验结果表明,对于含有噪声、密度均匀的数据集,算法可以识别出各种形状的聚类,且聚类质量和时间性能较好。 相似文献
19.
针对知识发现中的模糊信息查询问题 ,提出了一种基于知识挖掘中神经网络技术的模糊信息聚类及联想设计方法。首先按照分类对信息源进行量化编码 ,然后对编码后的数据进行规整处理。对于信息聚类采用均值聚类算法 ,而模糊信息联想采用Hopfield网络实现。将基于上述算法开发出的模糊信息查询系统应用于图书信息查询 ,实验结果证明了该方法的有效性。 相似文献
20.
文章提出了一种基于人工免疫增量的聚类算法。该算法在人工免疫可更新聚类算法的基础上,结合蚁群增量聚类算法的思想,将原聚类得到的记忆抗体矩阵作为初始矩阵,调用人工免疫聚类算法处理增量数据,然后采用类解体机制处理类内误差超过规定阈值的聚类。 相似文献