基于Hadoop的多核果蝇-Kmeans聚类算法期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

基于Hadoop的多核果蝇-Kmeans聚类算法

作者姓名：	李小川刘媛华

作者单位：	上海理工大学管理学院，上海 200093

摘要：	针对Kmeans算法对海量数据聚类效率过低的不足，基于Hadoop的分布式架构思想，提出一种多核果蝇-Kmeans聚类算法（MKFOA-Kmeans）。以每次迭代后果蝇位置为聚类中心进行一次Kmeans聚类算法，综合了果蝇优化算法强全局搜索能力以及Kmeans算法强局部搜索能力的优点。MapReduce框架简化了算法执行过程，避免了由于存储空间不足而造成的算法失效。在由普通硬件搭建的Hadoop平台下进行仿真实验，表明MKFOA-Kmeans算法对大数据的聚类准确率高，并且随着数据量的增加，聚类效率优势也愈加明显。
关键词：	大型数据聚类 Hadoop 果蝇算法多核 Kmeans算法

	点击此处可从《教育技术导刊》浏览原始摘要信息
	点击此处可从《教育技术导刊》下载全文