首页 | 本学科首页   官方微博 | 高级检索  
     检索      

一种基于MapReduce的频繁项集挖掘算法
引用本文:孙兵率.一种基于MapReduce的频繁项集挖掘算法[J].教育技术导刊,2015,14(4):75-77.
作者姓名:孙兵率
作者单位:西安工程大学 计算机科学学院,陕西 西安 710048
摘    要:随着大数据时代的到来,针对Apriori算法和FP Growth算法在挖掘海量规模数据频繁项集时,存在内存不足、计算效率低等问题,提出一种Aggregating_FP算法。该算法结合MapReduce并行计算框架与FP Growth算法,实现频繁项集的并行挖掘,对每个项进行规约合并处理,仅输出包含该项的前K个频繁项集,提高了海量数据决策价值的有效性。在Hadoop分布式计算平台上对多组规模不同的数据集进行测试。实验结果表明,该算法适合大规模数据的分析和处理,具有较好的可扩展性。

关 键 词:频繁项集  MapReduce  Hadoop  可扩展性  

A Algorithm for Mining Frequent Itemsets Based on MapReduce
Abstract:
Keywords:
本文献已被 CNKI 万方数据 等数据库收录!
点击此处可从《教育技术导刊》浏览原始摘要信息
点击此处可从《教育技术导刊》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号