首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
针对关联规则挖掘算法中存在事务之间的某种关联性的数据无法区分的问题,本文将蚁群算法和加权概念引入到挖掘算法中,首先分析了目前加权关联规则挖掘算法的不足,提出了将蚁群算法引入到加权关联规则中,并对蚁群算法中的应度函数,状态转移规则和信息素更新的改进,并采用矩形向量作为事务存储结构进行连接和剪枝。仿真实验中与基本Apriori算法进行比较,并通过将本校的课程资源作为挖掘对象,结果说明本文算法具有良好的挖掘效果。  相似文献   

2.
针对目前网络攻击越来越频繁,现有的IDS系统检测分析不够精准,IDS系统数据库的防御已经无法满足入侵防御需求的现状。采用数据挖掘技术中的C4.5算法和序列模式挖掘算法,对系统的获取的数据包进行数据挖掘,其中C4.5算法针对的是描述系统缺陷和已知攻击方法的数据,而序列模式挖掘算法针对的是系统调用序列数据,提高数据分析的准确性。实验表明,本文对IDS系统数据规则库的改进,大大提高了系统对入侵数据分析的准确性。  相似文献   

3.
序列模式挖掘是数据挖掘领域的研究课题之一,针对传统算法对处理大数据普遍存在扩展性问题。为了改进扩展性,本文提出云模式下基于MapReduce的序列模式挖掘算法(SPAMC),本文设计出迭代MapReduce框架来高效生成候选模式,并在构建词法序列树时进行修剪。该框架不仅将树结构的子任务分给并行排列的独立映射机,而且能实现对支持计数的并行处理。选用32台虚拟机构建云环境,对多达1300万个交易序列进行了全面实验,实验结果表明SPAMC可大大缩短大数据的挖掘时间,达到极高的可扩展性,并提供云聚集的理想负载平衡。  相似文献   

4.
谢胡林 《科技通报》2019,35(8):172-176
在大数据背景下进行数据挖掘越来越受到重视,针对Apriori挖掘算法中存在消耗时间长,算法效率低的特点,采用添加数据库、改进频繁1-项集,改进频繁2-项集和引入动态存储空间等措施,提高Apriori算法的性能,仿真实验中,本文算法在时间消耗、CPU耗能和挖掘效果上都取得了良好的效果。  相似文献   

5.
针对K-means聚类算法中的k值确定给聚类算法效果带来不确定性的问题,本文通过引入多层变量加权概念,提高聚类效果的收敛性,引入改进的非加权组平均法和最大最小距离算法有效的解决k值确定问题,引入Max-Entropy算法解决分布簇内节点分布不均导致的计算问题。仿真实验中,将本文算法的改进的效果进行研究,并结合云计算环境下通过使用本文算法在挖掘的加速比,花费时间上都取得了比较好的效果。  相似文献   

6.
时间序列的相似性度量是时间序列数据挖掘研究中的一个重要问题,是进行序列查询、分类、预测的一项基础工作。寻求一种好的度量对提高挖掘任务的效率和准确性有着至关重要的意义。目前从事这方面的研究除了少许理论论述外,几乎都采用一种固定的方法,即提出具体要求并提供实验数据。然而,大多数实验方法不是使用范围有限就是侧重点不同。为了提供一个比较全面的实验验证,用1NN分类算法进行了大量的时间序列交叉验证实验,重新评估了其中的弹性度量,并使用不同应用领域的28个时间序列数据集进行比较,结果表明,该方法具有更高的准确性。  相似文献   

7.
本文主要研究了基于改进指数平滑算法的气温预测问题。首先引入时间序列模型概念,对常用气温预测模型进行简要分析,另外对一阶指数平滑算法进行相关推导,同时提出了自适应指数平滑算法;其次,结合广西容县近30年月均气温实测数据,分别建立BP神经网络预测模型、传统指数平滑算法预测模型以及改进后的基于自适应指数平滑算法的预测模型,对2016年气温数据进行预测并分析模型优势;最后,将改进模型用于预测2017年和2018年中未知月份的月平均气温值,并针对实验结果进行数据分析修正。通过对不同预测模型的比较和仿真实验,结果表明基于自适应指数平滑算法的气温预测模型预测精度较高,实用性强,具有一定的推广性。  相似文献   

8.
提出一种基于模式的兴趣挖掘算法,通过查询日志获取访问序列,使用本体中的概念描述用户兴趣,提出一种计算兴趣得分公式,并根据兴趣得分将用户兴趣序列划分为不同的兴趣模式。本文算法实验结果显示,算法能够有效地实现用户兴趣挖掘。  相似文献   

9.
个性化信息服务中用户偏好的动态挖掘   总被引:2,自引:0,他引:2  
基于个性化信息服务中用户偏好随时间变化的特性,采用聚类、关联规则等技术,对用户偏好进行动态挖掘.通过追踪用户需求序列,最终产生Top-N产品推荐,旨在提高推荐系统的推荐质量.然后选取协同过滤算法作对照,并采用MovieLens站点提供的测试数据集.通过对召回率和精度两项指标的分析,表明该动态挖掘算法具有较高的推荐准确度和全面性.  相似文献   

10.
如何能够更好的挖掘云计算下的数据信息一直以来都是研究的热点,首先分析了云计算下的SOA架构,其次在架构中采用了多核向量机的云计算数据挖掘技术,提出了基于SOCP的多核向量机挖掘思路,通过多校核对和模型推导证明了本文挖掘分类算法的可行性。实验采用了基于SOA架构的销售管理系统作为数据来源,通过实验说明本文算法能够有效的节省挖掘时间,提高挖掘效率。  相似文献   

11.
针对标准Apriori算法在旅游市场数据规则挖掘的应用中还存在运算时间长、规则挖掘效果不好等问题。本文提出了一种基于动态置信和事务数据库优化的数据挖掘模型,首先采用贝叶斯算法对数据项进行预估,得到动态的置信度,然后采用m-estimate加以优化,从而让该分类能够更为精确地做出其适当的分类,最后用矩阵的形式来代替事务数据库,并通过这一方法来提高算法的运行效率。另外针对这一模型进行了仿真实验,结果发现,本文设计的经过改进的Apriori算法在挖掘市场数据的时候具有更好的性能。  相似文献   

12.
本文以高校学生信息数据为研究对象,主要以贫困学生信息数据为应用点,采用数据挖掘技术挖掘学生信息中的有用知识。本文围绕挖掘贫困学生信息这个主题,运用Apriori关联规则算法对得到的综合数据信息进行挖掘,并对Apriori算法的应用进行了改进,得出了有利于学生管理部门支持决策的知识。  相似文献   

13.
杨韶华  赵敏 《科技通报》2014,(4):188-190
采集大型火电系统短路数据,并将其转换成为时间序列数据,然后将时间序列数据输入到最小二乘支持分类集中进行训练,训练过程中引入最小二乘支持向量机对布谷鸟算法进行优化,用改进的布谷鸟算法对火电系统的短路位置数据进行距离聚类,从而预测出火电系统的短路地点。仿真结果表明本文算法能更加准确的预测了大型火电系统短路位置的变化态势,提高了大型火电系统短路位置的预测精度。  相似文献   

14.
萤火虫算法是一种新的智能算法,被广泛的使用在优化问题的解决方面,针对算法存在收敛速度慢,求解精度低的缺点,提出了引入人工鱼群算法中的聚群行为和追尾行为改进算法,仿真实验采用3个经典测试函数来测试本文算法和萤火虫算法,实验结果说明了本文算法能够有效的提高性能。  相似文献   

15.
针对标准ID3算法在数据规则挖掘的应用中还存在运算时间长、规则挖掘效果不好等问题。本文提出了一种基于属性增益优化ID3算法的体育训练数据规则挖掘模型,首先利用凸函数的性质来改进信息量公式,通过对数据集中属性选择标准的改变从而降低决策树的计算成本,减少决策树的生成时间,之后计算取值较多且不重要的属性信息时,将经验知识度参数引入从而避免取值少的属性被抛弃。此后又进行了专门的仿真实验,实验结果表明,与传统的算法相比,本文设计的经过改进的ID3算法在建树时间和规则数目这两个方面都具有更好的性能。  相似文献   

16.
李慧玲 《科技通报》2015,(2):194-196
在对大型图像数据库的特征挖掘优化过程中,利用传统算法进行特征挖掘,假设图像数据库中的图像属性差异较大,将极大的降低挖掘精度,难以获取精确的挖掘结果。为了弥补上述弊端,提出了一种大型图像数据库特征挖掘优化方法。利用局部二维模式纹理分析方法,提取数据库图像中的纹理特征,同时融合渐变计算方法,根据数据库中图像纹理特征,完成图像数据库特征挖掘。实验结果表明,利用改进算法进行大型图像数据库的特征挖掘,能够提高挖掘速度与精确度,可以获取准确的挖掘结果,满足大型图像数据库运行过程中的实际需求。  相似文献   

17.
研究主要针对PageRank只考虑链接关系,而不考虑相关性的缺点进行了一些改进,把Web数据挖掘技术的内容挖掘应用到PageRank算法中,基于超链接文本和内容与主题的相关性,提出了PageRank算法的优化算法,并通过实验仿真,实验结果表明改进后的方法对提高更高相关性的网页的排名是有效的,符合人们的期望。  相似文献   

18.
关联规则是数据挖掘中一个重要的研究内容。典型的关联规则发现算法是由R.Agrawal等提出的Apriori算法。本文研究了数据挖掘技术中的关联规则算法。对经典的Apriori算法作了全面的分析,指出了挖掘中的关键步骤,提出算法的不足,并给出了算法可以改进的方向。  相似文献   

19.
如何降低能量消耗是无线传感网络中的重要研究方向,本文首先对节点中的簇首节点消耗问题进行研究,然后针对分簇算法进行了改进:在簇首节点中采用遗传算法选出最优的节点;在簇覆盖范围中采用能量作为判断依据;在簇与簇的通信中采用改进的Dijkstra算法进行优化。仿真实验表明,本文的算法与LEACH,DBCP算法相比有了明显的改进,节点的能量消耗更加合理,生命周期进一步加强。  相似文献   

20.
针对免疫克隆算法中存在的算法精度低,全局收敛速度快问题,本文提出了一种改进的免疫克隆算法,通过基本免疫算法中的疫苗策略和局部搜索中采用的高斯变异,使得算法的精度提高,降低了全局收敛速度,提高了局部最优解的范围,通过3个测试函数说明本文算法相比基本免疫克隆算法提高了算法的性能,提高了算法精度。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号