首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 80 毫秒
1.
分类是数据挖掘中的重要技术之一,笔者分析、比较了当前具有代表性的关联分类算法,便于使用者根据需要选择合适的算法,也便于研究者对算法进行研究改进,提出性能更好的分类算法.  相似文献   

2.
数据挖掘中聚类方法比较研究   总被引:4,自引:0,他引:4  
聚类是数据挖掘领域中的一个重要研究课题。聚类在电子商务、图像处理、模式识别、本分类等领域有广泛的应用。本首先建立了数据挖掘中聚类方法的比较标准,然后从基于优化、关系、变换这样一个新的角度对聚类方法进行了分类和比较,最后对数据挖掘中常用聚类算法进行了分析,以便于人们更易于选择研究方向和选择适合于具体问题的聚类算法。  相似文献   

3.
数据挖掘是当今一个新的技术热点。本文从数据挖掘、数据挖掘环境、数据挖掘的基本过程展开研究,分析了数据挖掘的模式,详细阐述了分类、预测的区别与联系,展望了数据挖掘未来的研究方向。  相似文献   

4.
为提高CRM对市场活动和销售活动的分析能力,本文提出将数据挖掘技术应用于CRM系统中,重点讨论了数据分类方法从CRM数据库的大量信息中发现企业产品的销售规律和客户群特征,介绍了决策树分类算法,并给出具体的数据分类实例的实施过程。  相似文献   

5.
王预 《教育信息化》2004,(10):63-64
数据挖掘是当今一个新的技术热点。本文从数据挖掘、数据挖掘环境、数据挖掘的基本过程展开研究,分析了数据挖掘的模式.详细阐述了分类、预测的区别与联系,展望了数据挖掘未来的研究方向。  相似文献   

6.
分类在数据挖掘中是一项非常重要的任务,决策树方法是一种常用的分类算法,所建立的树形结构模型很直观,易于理解,特别适合处理各种分类问题。就决策树方法展开深入的研究,提出了“懒散的基于模型的分类”的思想。  相似文献   

7.
基于粗糙集理论的数据挖掘研究初探   总被引:2,自引:0,他引:2  
数据挖掘是应用一系列技术从大型数据库或数据仓库的数据中提取人们感兴趣的信息或知识,这些知识或信息是隐含的事先未知而潜在有用的,粗糙集理论是一种处理不确定和模糊问题的数学工具,它的一系列优点使其特别适合于数据挖掘研究.介绍了数据挖掘的概念、特点、任务、分类、要求及研究意义,分析了粗糙集理论的特点、所处理的问题、在数据挖掘中的简单应用,以及粗糙集在数据挖掘中的应用展望等。  相似文献   

8.
为了应对信息社会数据急剧增长,获得用户感兴趣或有益的数据,必须对数据进行处理,数据挖掘技术就是应这种需要而发展的.数据挖掘要取得有用数据,必须对数据进行种分类、聚类和关联三种不同的任务处理.对于文本信息的分类是数据挖掘的一个主要应用,而决策树算法利用自身优势和分类效率,在文本处理中有巨大的应用前景,尤其是J48算法应用与文本信息的分类有广泛的应用价值.  相似文献   

9.
介绍了数据挖掘技术和模型的概念,提出了基于决策树的数据挖掘分类模型构造方法,并结合银行业信贷业务特点,对数据挖掘在贷款分析中的应用进行探讨。  相似文献   

10.
为了应对信息社会数据急剧增长,获得用户感兴趣或有益的数据,必须对数据进行处理,数据挖掘技术就是应这种需要而发展的.数据挖掘要取得有用数据,必须对数据进行种分类、聚类和关联三种不同的任务处理.对于文本信息的分类是数据挖掘的一个主要应用,而决策树算法利用自身优势和分类效率,在文本处理中有巨大的应用前景,尤其是J48算法应用与文本信息的分类有广泛的应用价值.  相似文献   

11.
随着信息技术的发展,大量的数据不断被收集和存储,对数据的挖掘规模越来越大,传统的数据挖掘已经无法解决海量数据挖掘问题。网格技术的发展,使得广域分布的海量数据的挖掘问题得到解决。文章根据现实中海量数据挖掘的需求和网格的本质,把并行关联规则挖掘算法应用于网格数据挖掘中,并建立了一个并行数据挖掘模型,验证了并行数据挖掘系统在网格环境的可行性与合理性。  相似文献   

12.
13.
探讨数据挖掘在现今关联规则算法中的使用情况,提出目前研究关联规则的研究现状,针对现状,总结出一种新的研究分析关联方法,指出关联规则算法在今后的出路以及进一步的研究方向。利用分析文献查询和比较分析方法,阐述各种方法对典型关联的影响,其中作为一个为基点是以核心Apriori的算法。结论是Apriori算法仍然有一些不能消除的缺点,这有待进一步研究,同时指出今后的研究方向需要提高大量数据的运算效率,并且能够与OLAP相互结合生产结果的可视化。  相似文献   

14.
取样是一种通用有效的近似技术。在数据挖掘研究中,取样方法可显著减小所处理数据集的规模,使得众多数据挖掘算法得以应用到大规模数据集以及数据流数据上。文章在研究了统计学上随机均匀取样方法误差统计和衡量方法的基础上,着重探讨和研究了适用于数据挖掘领域的取样方法衡量标准以及影响取样方法选择的因素等问题,提出了能更好地评估取样质量,尤其是偏倚取样方法取样质量的"取样方法代表性"和"取样偏差"等概念并进行了量化,最后对数据挖掘取样方法的衡量标准和选用研究的后续工作与研究方向进行了阐述。  相似文献   

15.
Privacy is a critical requirement in distributed data mining. Cryptography-based secure multiparty computation is a main approach for privacy preserving. However, it shows poor performance in large scale distributed systems. Meanwhile, data perturbation techniques are comparatively efficient but are mainly used in centralized privacy-preserving data mining (PPDM). In this paper, we propose a light-weight anonymous data perturbation method for efficient privacy preserving in distributed data mining. We first define the privacy constraints for data perturbation based PPDM in a semi-honest distributed environment. Two protocols are proposed to address these constraints and protect data statistics and the randomization process against collusion attacks: the adaptive privacy-preserving summary protocol and the anonymous exchange protocol. Finally, a distributed data perturbation framework based on these protocols is proposed to realize distributed PPDM. Experiment results show that our approach achieves a high security level and is very efficient in a large scale distributed environment.  相似文献   

16.
数据挖掘技术在CRM中的应用是一个新兴的行业趋势。它吸引了从业者和学者的关注。本文研究了八十七篇发表在2000年至2006年之间的与数据挖掘技术在CRM中的应用有关的文章,目的是总结数据挖掘技术应用在CRM哪些领域和经常使用的技术。  相似文献   

17.
对基于关联规则的数据挖掘算法进行了研究,对经典的频繁项集计数算法进行了改进,提高了关联规则数据挖掘的效率。优化结果证明了关联规则算法在医学科研实验室数据挖掘中的重要作用。  相似文献   

18.
对证券市场过度反应现象的研究是行为金融学的一个重要研究方向。文章讨论了过度反应现象的数学描述,并建立了一种以研究过度反应现象的数据挖掘算法为目标的数学模型。用我国A股市场1994.1.3至2004、12.31年的全部个股数据进行实证分析的结论是:在我国股票市场,投资者的投资行为对好消息存在过度反应现象。  相似文献   

19.
结构化数据及非结构化数据的分类方法   总被引:2,自引:0,他引:2  
阐述了结构化数据和非结构化数据的基本概念以及分类过程;同时对目前应用于结构化数据和非结构化数据的主要的分类算法及其优缺点进行分析和比较.  相似文献   

20.
In this paper, a mathematical model consisting of forward and backward models is built on parallel genetic algorithms (PGAs) for fault diagnosis in a transmission power system. A new method to reduce the scale of fault sections is developed in the forward model and the message passing interface (MPI) approach is chosen to parallel the genetic algorithms by global single-population master-slave method (GPGAs). The proposed approach is applied to a sample system consisting of 28 sections, 84 protective relays and 40 circuit breakers. Simulation results show that the new model based on GPGAs can achieve very fast computation in online applications of large-scale power systems.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号