共查询到20条相似文献,搜索用时 15 毫秒
1.
2.
3.
序列模式挖掘是数据挖掘领域的研究课题之一,针对传统算法对处理大数据普遍存在扩展性问题。为了改进扩展性,本文提出云模式下基于MapReduce的序列模式挖掘算法(SPAMC),本文设计出迭代MapReduce框架来高效生成候选模式,并在构建词法序列树时进行修剪。该框架不仅将树结构的子任务分给并行排列的独立映射机,而且能实现对支持计数的并行处理。选用32台虚拟机构建云环境,对多达1300万个交易序列进行了全面实验,实验结果表明SPAMC可大大缩短大数据的挖掘时间,达到极高的可扩展性,并提供云聚集的理想负载平衡。 相似文献
4.
在大数据背景下进行数据挖掘越来越受到重视,针对Apriori挖掘算法中存在消耗时间长,算法效率低的特点,采用添加数据库、改进频繁1-项集,改进频繁2-项集和引入动态存储空间等措施,提高Apriori算法的性能,仿真实验中,本文算法在时间消耗、CPU耗能和挖掘效果上都取得了良好的效果。 相似文献
5.
6.
时间序列的相似性度量是时间序列数据挖掘研究中的一个重要问题,是进行序列查询、分类、预测的一项基础工作。寻求一种好的度量对提高挖掘任务的效率和准确性有着至关重要的意义。目前从事这方面的研究除了少许理论论述外,几乎都采用一种固定的方法,即提出具体要求并提供实验数据。然而,大多数实验方法不是使用范围有限就是侧重点不同。为了提供一个比较全面的实验验证,用1NN分类算法进行了大量的时间序列交叉验证实验,重新评估了其中的弹性度量,并使用不同应用领域的28个时间序列数据集进行比较,结果表明,该方法具有更高的准确性。 相似文献
7.
本文主要研究了基于改进指数平滑算法的气温预测问题。首先引入时间序列模型概念,对常用气温预测模型进行简要分析,另外对一阶指数平滑算法进行相关推导,同时提出了自适应指数平滑算法;其次,结合广西容县近30年月均气温实测数据,分别建立BP神经网络预测模型、传统指数平滑算法预测模型以及改进后的基于自适应指数平滑算法的预测模型,对2016年气温数据进行预测并分析模型优势;最后,将改进模型用于预测2017年和2018年中未知月份的月平均气温值,并针对实验结果进行数据分析修正。通过对不同预测模型的比较和仿真实验,结果表明基于自适应指数平滑算法的气温预测模型预测精度较高,实用性强,具有一定的推广性。 相似文献
8.
提出一种基于模式的兴趣挖掘算法,通过查询日志获取访问序列,使用本体中的概念描述用户兴趣,提出一种计算兴趣得分公式,并根据兴趣得分将用户兴趣序列划分为不同的兴趣模式。本文算法实验结果显示,算法能够有效地实现用户兴趣挖掘。 相似文献
9.
个性化信息服务中用户偏好的动态挖掘 总被引:2,自引:0,他引:2
基于个性化信息服务中用户偏好随时间变化的特性,采用聚类、关联规则等技术,对用户偏好进行动态挖掘.通过追踪用户需求序列,最终产生Top-N产品推荐,旨在提高推荐系统的推荐质量.然后选取协同过滤算法作对照,并采用MovieLens站点提供的测试数据集.通过对召回率和精度两项指标的分析,表明该动态挖掘算法具有较高的推荐准确度和全面性. 相似文献
10.
11.
12.
13.
采集大型火电系统短路数据,并将其转换成为时间序列数据,然后将时间序列数据输入到最小二乘支持分类集中进行训练,训练过程中引入最小二乘支持向量机对布谷鸟算法进行优化,用改进的布谷鸟算法对火电系统的短路位置数据进行距离聚类,从而预测出火电系统的短路地点。仿真结果表明本文算法能更加准确的预测了大型火电系统短路位置的变化态势,提高了大型火电系统短路位置的预测精度。 相似文献
14.
萤火虫算法是一种新的智能算法,被广泛的使用在优化问题的解决方面,针对算法存在收敛速度慢,求解精度低的缺点,提出了引入人工鱼群算法中的聚群行为和追尾行为改进算法,仿真实验采用3个经典测试函数来测试本文算法和萤火虫算法,实验结果说明了本文算法能够有效的提高性能。 相似文献
15.
16.
在对大型图像数据库的特征挖掘优化过程中,利用传统算法进行特征挖掘,假设图像数据库中的图像属性差异较大,将极大的降低挖掘精度,难以获取精确的挖掘结果。为了弥补上述弊端,提出了一种大型图像数据库特征挖掘优化方法。利用局部二维模式纹理分析方法,提取数据库图像中的纹理特征,同时融合渐变计算方法,根据数据库中图像纹理特征,完成图像数据库特征挖掘。实验结果表明,利用改进算法进行大型图像数据库的特征挖掘,能够提高挖掘速度与精确度,可以获取准确的挖掘结果,满足大型图像数据库运行过程中的实际需求。 相似文献
17.
研究主要针对PageRank只考虑链接关系,而不考虑相关性的缺点进行了一些改进,把Web数据挖掘技术的内容挖掘应用到PageRank算法中,基于超链接文本和内容与主题的相关性,提出了PageRank算法的优化算法,并通过实验仿真,实验结果表明改进后的方法对提高更高相关性的网页的排名是有效的,符合人们的期望。 相似文献
18.
19.
20.
针对免疫克隆算法中存在的算法精度低,全局收敛速度快问题,本文提出了一种改进的免疫克隆算法,通过基本免疫算法中的疫苗策略和局部搜索中采用的高斯变异,使得算法的精度提高,降低了全局收敛速度,提高了局部最优解的范围,通过3个测试函数说明本文算法相比基本免疫克隆算法提高了算法的性能,提高了算法精度。 相似文献