首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
针对Apriori算法的存在产生大量的候选频繁集合的缺点,本文提出了基于加权代价敏感的非频过滤矩阵Apriori算法,通过在FP-tree算法的基础上构造的决策树对应的数据进行代价敏感学习;设定不同的数据的权值,设定加权置信度;非频集过滤矩阵寻找频集,生成强关联规则;构成非频集过滤Apriori算法对应的初始矩阵;构建代价敏感的非频集过滤矩阵等措施提高了算法的挖掘效果。  相似文献   

2.
如何进行云计算下的数据挖掘一直以来都是研究的重点,本文针对传统挖掘算法K-meas的不足,提出基于数据采样和分布密度的改进方法来获取算法的中心点,在聚类中构造函数提高了聚类效果,并对云计算下的Map/Reduce模型进行了函数改进,仿真实验通过对不同的数据集进行实验,从聚类分析比较,系统运行时间,加速比等方面说明了本文的算法适合在云计算下的数据挖掘具有一定的优越性。  相似文献   

3.
针对K-means聚类算法中的k值确定给聚类算法效果带来不确定性的问题,本文通过引入多层变量加权概念,提高聚类效果的收敛性,引入改进的非加权组平均法和最大最小距离算法有效的解决k值确定问题,引入Max-Entropy算法解决分布簇内节点分布不均导致的计算问题。仿真实验中,将本文算法的改进的效果进行研究,并结合云计算环境下通过使用本文算法在挖掘的加速比,花费时间上都取得了比较好的效果。  相似文献   

4.
目前大多都是针对两种类型数据发现对照模式来获取相关信息,在多类数据中发现对照模式进行数据挖掘还具有很大的挑战性。现有的关联规则挖掘技术的瓶颈在于需要产生大量的规则,其中有很多都是冗余规则,而已存在的非冗余规则挖掘算法虽然去掉了冗余规则,但还是有很多规则对于特定的应用领域兴趣度太低或不感兴趣,因此给出了一种有效的多类医疗数据挖掘算法。该算法基于统计方法定义了诱因模式和安全模式,实现了在多类医疗数据中发现这两类模式,并在仿真实验中给出了仿真医疗数据清晰直观的因果关系图,而根据新算法产生的规则得出的分类器也验证了新算法的高效性和实用性,且新算法产生的规则提供了精确而且非常有用的信息,可被实际应用在医疗研究以及其它领域中。  相似文献   

5.
伴随着网络技术的持续发展,新时代的数据多数是非结构化类型的数据信息,其特征向量的维数较高,过多的维数会引发维度灾难,通过引入特征选择的模式对于冗余特征进行检测,数据信息的特征子集能够准确获得,实现降维目标.随后由聚类成员质量以及数据差异入手,总结出适于高维数据信息分层抽样的算法.结果表明,此算法具备良好的聚类优势.此研...  相似文献   

6.
在大型数据集进行数据挖掘时,现有算法仍需要和外存多次交换数据才能完成挖掘任务。针对此问题提出了一种新的自适应的混合压缩算法:AHC-DM算法。该算法主要通过在垂直事务标识向量的基础上进行比特位压缩来节省内存空间。其结果是当数据集事务差成脉冲型出现时,对数据集有较好的压缩比率;也同时能自动适应数据的稠密和稀疏。  相似文献   

7.
关联规则挖掘是数据挖掘领域中的一个非常重要的研究内容,其主要目标就是发现数据库中一组对象之间某种关联。频繁项集挖掘是关联规则挖掘的关键步骤,它在很大程度上决定了关联规则挖掘的效率。介绍了Apriori算法及其算法改进。该改进算法对剪枝步进行了优化,提高了连接效率,并且不断减小数据库的规模,去掉无效事务,减少了每次扫描数据库所花费的时间,提高了算法效率。经过试验论证,性能比原有算法提高,具有一定的实用性。  相似文献   

8.
在原有遗传算法的交叉,变异的基础上,将基本免疫算法与遗传算法相结合,通过"精英策略"和"改善变异因子"提高了算法的性能,并将改进后的算法运用到免疫算法中,提高了抗体的适应度和生成机制,其次引入支持向量机,将改进后的免疫算法寻求最优的支持向量机参数,提高了故障的识别率。仿真实验以无线传感器故障为例,在均绝对误差,均方误差和均方根误差等方面都优于基本免疫算法。  相似文献   

9.
决策树方法因其简单、直观、准确率高等特点在数据挖掘及数据分析中得到了广泛的应用。介绍了决策树中最基本的算法——ID3算法的一般知识后,根据实例深入分析了该算法的设计思想、程序实现及优缺点,并针对其缺点进行改进。  相似文献   

10.
数据挖掘算法中的关联规则算法对大量数据的项集分,可以发现它们之间存在的有意义的关联.本文将改进的Apriori算法应用于高校教务管理系统,对历届学生各门课程成绩进行了分析,探讨了高等学校课程间的相关性问题,得出了具有一定可信度和支持度的课程相关性规则,可为现行教学计划的优化和学生选课提供决策支持.  相似文献   

11.
宋庆元 《科技广场》2005,17(1):53-57
本文介绍了一种针对化学数据分析的挖掘系统原型实现和设计理论。阐述从化学数据分析的角度开发一个联机分析数据挖掘系统原型的理论过程,研究过程采用数据仓库提供的OLAP技术进行关联规则挖掘,提供了一种数据项的二进制编码技术,对于提高数据信息的处理能力和可靠性有一定意义。预期实现从各种文献资料或数据库自动抽取有关化学反应的信息,发现新的有用化学成分,完成合成设计和反应预测等功能,从而对数据挖掘的实现进行了有益的尝试。  相似文献   

12.
随着互联网的广泛应用与云计算技术得到飞速发展,如何从大数据中寻求数据规律,并以此做出科学的预测与决策,成为目前数据挖掘技术的主要研究方向之一。Apriori算法就是一种基于海量数据并挖掘关联规则频繁项集的典型算法,其在大数据挖掘分析中具有较大研究与应用价值。  相似文献   

13.
管涛  段莹 《科技风》2011,(19):249-250
实例教学法不同于案例教学法,具有实践性、应用性、结合理论背景、易于接受、针对国内学生特点等优点,可以有效提高教学效果,提高学生的分析能力,加强课堂学习的氛围。"数据仓库与数据挖掘"是高等教育阶段许多专业的一门重要的课程,涉及的知识面广,内容抽象。对学生来讲在内容理解上难度,容易失去兴趣。因此,如何将这些抽象的知识转化为易于接受的形式至关重要。文中给出了实例教学法,将教材中涉及到抽象原理、模型、数学符号通过一系列的实例以图形、表格和程序的形式展现给学生。进而,结合贝叶斯分类器的教学过程加以阐述。实践证明,这套方法既增强了学生的学习兴趣,提高了学生的综合分析能力,同时,调动了教师的积极性。  相似文献   

14.
叶萌 《黑龙江科技信息》2011,(30):40+39-40,39
关联规则是数据挖掘领域的一个重要分支,它反映了一个事物与其他事物之间互相依赖的关系。提出了一种简易而有效的频繁模式挖掘算法作为基础,利用频繁模式树对大型原始事务数据库进行压缩存储,并且给出了具体实现算法。与传统的算法比较,避免了反复进行候选集的生成与测试,大大提高了算法效率。  相似文献   

15.
决策树算法是数据挖掘中一个重要的内容,但是在实际应用过程中,现存的多种决策树算法也存在着很多不足之处。本文总结并分析了近年来数据挖掘技术在决策树算法方面的研究,探讨了进一步的研究发展方向。  相似文献   

16.
以笔者所任教的课程为例,提出了一种应用聚类分析方法来挖掘隐藏在学生成绩背后有价值信息的研究方案,得到了具有不同成绩特征的学生群体,得到的结论对教学有一定的指导作用。  相似文献   

17.
针对银行CRM中的海量客户历史数据问题,本文采用决策树算法和BP神经网络算法,选取部分客户业务数据分别进行分类预测实验,实验结果表明利用上述算法可以较好地解决银行中对客户分类预测的需求。  相似文献   

18.
决策树算法是数据挖掘领域的核心分类算法之一,ID3算法则是最为经典的决策树算法。本文以ID3数据挖掘算法在债务管理中的应用为例,验证了算法的性能。  相似文献   

19.
利用关联规则的Apriori数据挖掘算法及其改进算法,对电子商务中的数据进行分析挖掘。基于某电子商务网站实际数据的实验结果表明,该算法是有效的。  相似文献   

20.
将多参数随机干扰与Pailler同态加密进行结合,提出一种新的基于隐私保护的面向关联规则的水平分布式挖掘算法,提高了面向关联规则的分布式隐私保护的安全性能。算法中计算候选项集的局部支持度是通过多参数随机干扰求得的,一方面具有不同事物所有相的性质,另外一方面改善了挖掘的准确。通过使用同态加密技术获得的整体支持度,有效控制了计算与通信的成本。分析仿真实验结果可知本文提出的基于隐私保护的面向关联规则的水平分布式挖掘算法性能比单纯以加密为基础的PPDAR算法优良,当最大频繁项集的最大长度与频繁项集的最大长度两者存在一定差距时,本文提出的算法性能优于以加密为基础的EPPDAR算法。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号