共查询到20条相似文献,搜索用时 109 毫秒
1.
随着信息技术的不断发展,应用商业智能技术进行数据挖掘与分析对商家来说也越来越重要,分类回归树和神经网络算法是数据挖掘的经典算法,其广泛运用在数据分析、预测和评估等方面。文章分别运用分类回归树和神经网络算法对零售商品采取促销方案后收入变化的数据进行分析,并建立相应的模型对促销方案效果进行预测。 相似文献
2.
3.
4.
线损自动生成系统是电力市场化不可缺少的组成部分,是管理现代化电网的重要技术手段,在电力的安全生产和商业化运营中具有越来越重要的作用.为提高电力市场化的应用水平,供电公司开发了线损自动生成系统,并依据电网发展的需要不断的测试、更新.但是由于各个终端电量的历史数据、物理因素和其它各种相关因素,一直影响线损自动生成系统预测与分析方面的准确性.本文将数据挖掘技术中的聚类算法应用到系统中,并在数据预处理阶段对历史数据进行坏数据辨识和调整.预测的精确度很大程度上取决于历史数据的准确性,然而,由于线损自动生成系统中的各种信息存在着大量的随机信号而且具有明显的不确定性,对线损系统线损预测与窃电分析造成困扰.因此,为了保证电量预测的精确度,必须对历史数据进行分析,对脏数据进行修正.本文将数据挖掘的离群数据算法应用到线损自动生成系统,着重研究了用聚类的各种分析方式识别和修正异常数据. 相似文献
5.
采用最高气温、最低气温、平均气温以及降雨情况作为本地区电力系统中最主要的影响参数,基于SVM算法进行数据预测,将输入的参量数据映射到一个高维的特征空间中,对空间状态向量进行线性回归计算,得到参数向量与电力负荷关系,得出电力预期负荷。仿真实验表明算法能最小化经验风险,结合多参量特征数据挖掘算法在多维数据空间中计算的优势,降低SVM算法的计算时间,预测误差是小于1%,完全达到了准确预测的要求,在电力负荷预测和管理领域具有广泛的应用前景。 相似文献
6.
7.
隐私数据挖掘是数据挖掘的一个重要研究方向,它旨在研究在数据挖掘过程中如何保护私有的和敏感的数据不被泄露。文章阐述几种常用的隐私数据挖掘算法,分析它们的技术特点,文末对几种隐私数据挖掘技术进行总结与展望。 相似文献
8.
提出了一种能够提高负荷预测精度的方法。在对历史电网运行数据进行处理时引入大数据挖掘技术,并且使用了支技向量机来进行电力系统短期负荷的预测新方式,对基于粒子群优化的支持向量算法进行了改进,提出基于相似日聚类的支持向量机的方法以对电网的负荷状态进行预测。以湘潭市的电力负荷数据为测试数据,进行两种算法结果的对比。结果表明:本文的算法在对比中具有较大的优势,数据预处理在预测的精度上有着非常重要的关联。 相似文献
9.
为开发高效的数据挖掘算法,实现模糊集聚类算法的高效性,将BIRCH聚类算法思想与模糊集算法进行融合。通过对模糊集算法处理的数据进行二次聚类计算,细化群边缘,最后加载判别函数进行数据定位,完成数据挖掘。最后使用KDDCUP2011数据库进行仿真实验,对目标数据进行挖掘,证实了融合BIRCH聚类算法思想的模糊集算法具有可行性,对比改进前的算法在数据挖掘方面效率更高。 相似文献
10.
11.
提出一种数据挖掘算法,在数据挖掘的同时进行数据预处理,这种算法保证了数据的真实性,省略了数据预处理环节,规避了粗糙集算法对数据规范性的严格要求. 相似文献
12.
13.
《科技创业月刊》2017,(5)
随着计算机技术和互联网的飞速发展,Web2.0的成熟与广泛应用,数据呈现爆炸式增长,传统的数据挖掘算法在处理海量数据时效率低下,云计算的出现为其改进带来了新的方式。云计算通过集群威力,实现了对海量数据的可靠存储和高速计算。Hadoop作为一款比较成熟的开源云计算框架,以其高效、可扩展、低成本等优点在数据挖掘的相关领域得到了广泛应用。通过对改进算法的详细阐述和设计,结合实例论证了改进算法的可行性,并对改进算法进行了分析。通过实例分析,得到改进算法具有更高的效率,降低了时间复杂度和空间复杂度。云计算给数据挖掘算法的改进带来了新的方式,数据挖掘将成为未来的研究趋势。 相似文献
14.
【目的/意义】针对多组时间序列的海量数据集和以预测为目标的信息分析方法,提出了基于数据挖掘技术 的预测模型,在大数据环境下,提高了预测精度,以期在其他领域的信息分析和情报预测能有所借鉴。【方法/过程】 以集装箱海运价格预测为例,提出集装箱海运价格预测模型,设计自适应的网格搜索策略,高效准确地确定数据挖 掘算法中的超参数组合,提出基于时间序列留出法的评估方法,降低了集装箱运价这种多组时间序列数据集在数 据挖掘结果上的泛化误差,针对海量运价信息,对GBDT算法进行并行计算设计和预排序后的损失函数迭代计算 优化策略,提高了算法在大数据环境下的计算效率。【结果/结论】模型和算法运行结果仿真显示:对于传统的时间 序列问题,基于数据挖掘方法的预测模型取得了比传统时间序列方法更优的结果。 相似文献
15.
16.
17.
基于J2EE的Web数据挖掘系统框架评价体系研究 总被引:1,自引:0,他引:1
本文简要介绍了Web挖掘的概念以及数据挖掘技术与算法,阐述数据挖掘系统结构,并对其框架及实现方法进行了探讨,讨论基于J2EE平台的MVC设计框架下Web数据挖掘系统体系结构。最后将对系统进行评价分析。 相似文献
18.
19.
目前,IT行业中,数据时代越来越受到关注,塞班智能手机企业已经开始着手准备将数据挖掘应用于Symbian系统。而Andriod手机是全球最多使用者的智能手机,应该及时跟紧大数据时代,设计合理的应用,开发基于Andriod手机的数据挖掘算法。本文通过分析Andriod手机数据挖掘的需要性,对Apriori算法如何应用于Andriod手机进行研究。 相似文献
20.
提出一种基于数据挖掘的微博热门话题预测方法,在对微博词汇进行基于词频的热门分类基础上,通过热点发现、特征提取、发现学术领袖、热点追踪、关注学术领袖和热点分析6个阶段对预测进行分析和处理。通过统计的方法实现热门预测结果输出。采用一组网络词汇进行实际的热门预测仿真分析,结果显示,基于数据挖掘的微博热门话题预测方法能够更好的实现微博热门话题的预测,预测结果聚类特性优于传统预测方法,算法收敛特性好,具有很好的预测使用价值。 相似文献