首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 0 毫秒
1.
分类算法是数据挖掘中的一种重要技术,决策树学习是其中常用的一种方法。结合实例阐述了决策树基本算法的形成过程,分析总结了决策树算法在实际中的应用及其存在的缺陷。  相似文献   

2.
决策树是数据挖掘分类问题算法中一种性能较好的算法,本文主要研究自决策树在数据挖掘中应用以来存在问题,主要是可扩展性问题.综述了国内外针对此问题所提出的解决方法,以及分析了改进算法的优缺点,以便有利于对决策树关键问题,即扩展性问题的研究.同时本论文中所研究的算法的思想也有助于数据挖掘中其它领域解决大数据集问题.  相似文献   

3.
分类在数据挖掘中是一项非常重要的任务,决策树方法是一种常用的分类算法,所建立的树形结构模型很直观,易于理解,特别适合处理各种分类问题。就决策树方法展开深入的研究,提出了“懒散的基于模型的分类”的思想。  相似文献   

4.
Web服务(Web Services)是计算机网络技术研究热点之一,主要用来研究应用程序在Internet上实现互操作,拓展应用程序的功能。近年来,电子商务迅速崛起,Web服务数量不断增加,很多Web服务提供的功能是相似的,用户难以找到最适合自身需求的Web服务。使用决策树ID3算法,分析影响Web服务功能的质量参数,将其作为属性特征,得到Web服务的分类,帮助用户更好地选择合适的Web服务。  相似文献   

5.
从一个新的思路对基于最小Gini指标的决策树分类算法进行了讨论。简单介绍了CART算法和Gini指标的定义,并且对SLIQ和SPRINT决策树分类技术进行深入的分析。同时对SLIQ算法的时间复杂性和这两种算法的内存管理和性能方面进行了比较和分析。  相似文献   

6.
从一个新的思路对基于最小Gini指标的决策树分类算法进行了讨论。简单介绍了CART算法和Gini指标的定义,并且对SLIQ和SPRINT决策树分类技术进行深入的分析。同时对SLIQ算法的时间复杂性和这两种算法的内存管理和性能方面进行了比较和分析。  相似文献   

7.
分类技术中的决策树算法分析   总被引:6,自引:0,他引:6  
介绍了解决分类问题的常用方法——决策树。并对决策树的原理及Quinlan的ID3、C4.5两种主要的决策树算法进行了分析。通过分析它们的基本原理以及主要特点,提出了对决策树算法改进的展望。  相似文献   

8.
本文分析了基于正区域的决策树生成算法的不足,针对这些不足,提出了基于正区域及其分类纯度的决策树算法。该方法计算简单,易于理解,并用实例说明了该方法的优越性。  相似文献   

9.
阐述数据挖掘的分类及目的,总结分类器的构造方法,讲述分类中决策树的构建和修剪.  相似文献   

10.
分类在数据挖掘中是一项非常重要的任务,决策树方法是一种常用的方法。本文重点介绍了决策树建立的基本原理,对算法所面临的问题进行了阐述,为数据分类研究者提供借鉴.  相似文献   

11.
为了改善传统ID3算法在分类属性选择上存在多值偏向性的不足,提出基于PCA的决策树优化算法。在普通基于PCA 的决策树改进算法中,存在数据经降维处理后代表性不强的问题,导致算法需经过多次数据运行后,准确率才能小幅提升。在ID3算法基础上,在分类前两次提取属性特征值,并计算了需要分类的数据量,也即对原始数据进行最重要的属性选择。在子树建立之后,再进行数据的降维合并选择。采用UCI数据库中的3个数据集对改进算法进行验证,结果表明改进算法的平均准确率达到94.6%,相比传统ID3算法与普通PCA决策树优化算法分别提升了1.6%和0.6%。因此,基于PCA的决策树算法能在一定程度上提升结果准确率,具备一定的应用价值。  相似文献   

12.
文本分类在自然语言分类中起着重要作用,将决策树ID3算法应用与文本分类,对数字图书馆的部分文本信息分类,提出一个基于ID3决策树的文本分类算法,取得了良好的实验结果。  相似文献   

13.
为了实现对用户评论的商业研究价值提取,解决互联网产品后续优化和增进服务问题,提出一种融合朴素贝叶斯与决策树的改进算法,处理文本中的噪声,避免零概率和属性值缺失的问题,从而提高分类准确率.该算法首先对用户评论数据作预处理,然后运用概率优化后的朴素贝叶斯处理空缺属性值,最后用决策树从积极和消极角度将数据进行分类.对微信公众...  相似文献   

14.
该文提出一种基于决策树的分类挖掘技术,在论述分类挖掘的基础上分析决策树分类挖掘系统的建立思想、步骤及算法,并把该系统应用到优化学生资源管理的实验中,实验结果证明了该方法的可行性。  相似文献   

15.
基于决策树的高职学生网络学习分类模型构建   总被引:1,自引:0,他引:1  
高职学生个性化学习行为是目前高等教育比较重要的研究方向。通过采集高职学生在网络学习过程中的心理、行为、方法和效果的数据,经过筛选、量化、分类和评价,最终根据影响学习效果的学习者内在因素和个性特征对学习者进行分类,通过基于决策树学习分类模型的建立,对学习者未来的学习进行形成性评估。  相似文献   

16.
分层教学是在充分考虑学生具体情况的前提下,将水平相近的学生分为一组,实现针对性的个性化教学,数据挖掘技术中的决策树归纳分类所需的训练数据少,便于理解和解释,可视性强,分类规则形成简便,可以科学准确将学生进行分层。通过详细讨论决策树归纳分类的过程和决策树的构建,选取部分学生样本进行决策树的生成及分类规则的提取,为数据挖掘分类技术在分层教学中的应用提供了思路和途径。  相似文献   

17.
对海量数据的处理能力是数据挖掘最关注的问题。决策树作为一种分类器,是数据挖掘中用到的一种基本方法之一。基于C4.5的决策树改进算法,是在一些典型的决策树分类算法的基础上提出的,基本思想是在建树过程中,用属性依赖度替代信息增益率来确定划分条件属性的顺序。该算法借鉴MedGen算法的阈值设定方法,在简化决策树剪枝和优化过程的同时,可优化C4.5算法中使用信息熵率的时间复杂度,避免了使用信息熵带来的不当划分。简述了该改进算法的执行过程,证明了算法的正确性。  相似文献   

18.
本文研究的内容是通过改变适应度的选取方式,通过累计各个接节点的适应度,利用加权计算求取适应度,在结合SVM决策树组成CFGA-SVM,通过这种算法计算出来的结果相比较GA-SVM取得了很大的进步,并且这种方法适应的样本量度更大,在发展遗传计算求解的过程中,未来还会具有很好的发展.  相似文献   

19.
TM遥感影像能获取丰富的地面信息,适合于大面积的宏观监测,文章利用分层分类的方法提取南京江宁区土地利用信息,获得了土地利用变化图,并对土地利用分类方法中的决策树分类和监督分类方法中的最大似然法在实践中的应用和精度比较进行了探讨,最后结合GIS空间分析方法对分类的结果图进行比较分析,并分析其变化的原因.  相似文献   

20.
决策树算法在客户分类中的应用   总被引:1,自引:0,他引:1  
介绍了数据挖掘的概念及决策树的ID3算法,利用该算法对租赁公司的客户进行分类,给出了分类步骤发现了申请或不申请租赁的客户类型特征,从而为公司租赁业务制定最佳指导策略。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号