首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 81 毫秒
1.
应用粗糙集理论,提出了一种新的多变量决策树构造算法.该算法以核相对于决策类的泛化来划分样本集,如果所划分子集的样本存在不一致决策类并且未用于划分的属性为空时,试探着分别把该子集和一致性子集合并,计算各合并子集的条件类对决策类的确定性程度,选择确定性程度大的作为同一子集,并用一致性子集的类标号进行标示.和苗夺谦提出的多变量决策树算法比较,本算法充分考虑了训练集中的噪声数据,允许在构造决策树的过程中划入正域的实例类别存在一定的不一致性,可简化生成的决策树,提高决策树的泛化能力.  相似文献   

2.
将数据挖掘中的决策树与粗糙集理论进行了有机结合,提出了一种基于粗糙集技术的决策树构造算法.该算法通过将计算属性相对于划分的重要度作为选择扩展属性根结点的标准,递归地生成决策树,可以克服ID3算法偏向于选择取值较多的属性的不足.  相似文献   

3.
属性约简是粗糙集理论的一个基本内容,是决策系统规则提取的一个有效手段,同时也是数据挖掘的一个重要方法。本文简要地介绍以国内为主的关于属性约简算法研究的若干进展情况,内容涉及属性约简的主要类型,核与属性约简算法以及最小属性约简的计算,并粗略地讨论今后发展的方向。  相似文献   

4.
属性约简是粗糙集研究的重要内容之一,首先利用反例指出蔡莉等人提出的基于依赖度的决策表约简算法的错误,然后给出一种新的基于属性依赖的约简算法。通过一个信息系统实例,证明该算法的可行性和有效性。  相似文献   

5.
为了提高C4.5决策树算法的有效性,提出一种改进的C4.5决策树算法。结合粗糙集理论的属性约简算法和Fayyad边界点判定定理,对C4.5算法进行了改进,利用UCI数据集进行了实验。结果表明,改进的C4.5算法不仅提高了准确率,而且缩小了决策树规模,减少了分类时间。  相似文献   

6.
作者基于模糊粗糙集理论,利用模糊等价关系、模糊上下近似,去除模糊信息系统的冗余属性,找出模糊信息系统的约简,然后利用模糊ID3算法,生成模糊决策树,产生一组模糊规则,实验结果证明了这种方法的有效性.  相似文献   

7.
对海量数据的处理能力是数据挖掘最关注的问题。决策树作为一种分类器,是数据挖掘中用到的一种基本方法之一。基于C4.5的决策树改进算法,是在一些典型的决策树分类算法的基础上提出的,基本思想是在建树过程中,用属性依赖度替代信息增益率来确定划分条件属性的顺序。该算法借鉴MedGen算法的阈值设定方法,在简化决策树剪枝和优化过程的同时,可优化C4.5算法中使用信息熵率的时间复杂度,避免了使用信息熵带来的不当划分。简述了该改进算法的执行过程,证明了算法的正确性。  相似文献   

8.
决策树算法是数据挖掘领域的一个研究热点,通常用来形成分类器和预测模型,在实际中应用广泛。介绍了决策树技术及其发展过程,重点阐述了几种典型的决策树算法,分析了它们的优缺点,并对几种算法作了比较,最后探讨了决策树算法今后的发展方向。  相似文献   

9.
决策树是数据挖掘中的一种重要分类方法.在此以粗糙集理论中的正域为启发式函数,设计了一种新的、有效的决策树构造方法.该算法具有较大的灵活性.能从测试属性空间逐次删除已使用过的属性.避免对这些属性进行重复测试,减少测试空间,降低了树的复杂性,从而提高了分类效率.最后,实例验证了算法的可行性与有效性.  相似文献   

10.
本文分析了基于正区域的决策树生成算法的不足,针对这些不足,提出了基于正区域及其分类纯度的决策树算法。该方法计算简单,易于理解,并用实例说明了该方法的优越性。  相似文献   

11.
12.
13.
分类在数据挖掘中是一项非常重要的任务,决策树方法是一种常用的方法。本文重点介绍了决策树建立的基本原理,对算法所面临的问题进行了阐述,为数据分类研究者提供借鉴.  相似文献   

14.
决策树是典型的归纳学习和数据挖掘方法,通过对数据库中获取的数据项属性值进行划分归类,最终形成类似于流程图的树型结构形式。ID3算法是决策树中的核心算法,针对ID3算法倾向于取值较多的属性的缺点,通过引入泰勒公式与麦克劳林公式,对传统算法进行降维,减小算法的计算复杂度,提高算法运行效率,使决策树的生成时间缩短,算法的效率得到了较大的提高。  相似文献   

15.
ID3算法是示例学习中建立决策树的一种重要的方法.介绍了ID3决策树算法的基本思想,讨论了 ID3决策树算法中的难点和不足,结合实例给出了利用信息增益度法来改进ID3算法的详细过程.  相似文献   

16.
基于ID3算法的决策树研究与应用   总被引:1,自引:0,他引:1  
在ID3算法的基础上,提出了一个在决策树各级节点上,以信息增益作为节点属性选择的标准,对每个非叶节点进行了测试类聚,并将例子集分成不同子集,实现了决策树创建和相应规则的生成新算法.实验结果表明该实现方法是正确和高效的.  相似文献   

17.
针对互联网络流量产生规模不断扩大,产生环境多变,网络监管难度增加的问题,以及随着计算机网络技术的快速发展,各种各样的互联网应用不断出现,且表现出的内容不断丰富化、协议不断复杂化等情况,采用分类的方式对应用较为普遍的各种网络协议识别算法进行解析,分析各种算法存在相关缺陷和优点,从而提高网络协议识别算法的实效性和准确性。  相似文献   

18.
文章提出了一种基于近似分类质量的决策表属性约简算法,该原算法以空集作为初始属性约简,逐步增加使近似分类质量增加最大的属性,直至约简的近似分类质量等于所有条件属性的近似分类质量为止.文章同时分析了该算法的时间复杂度.并通过实例验证了该算法的有效性和合理性.  相似文献   

19.
决策树分类算法是数据挖掘中一个重要的内容,而ID3算法又是决策树分类算法中的一种重要方法且被广泛应用。然而在实际应用过程中,现存的决策树算法也存在着很多不足之处,如计算效率低下、多值偏向等。为了解决这些问题,提出了一种基于ID3算法的加权简化信息熵算法,它提高了决策树的构建速度,减少了算法的计算运行时间,同时也克服了ID3算法往往偏向于选择取值较多的属性作为测试属性的缺陷。并且随着数据规模的增大,决策树的分类性能表现得越好。  相似文献   

20.
简要分析了C5.0决策树原理,并将它应用于税务稽查中,通过C5.0决策树模型,对80个商业企业的财务报表和纳税申报袁的分析,再与二分类Logistic回归法进行比较,结论表明该模型方法能够辅助稽查选案,提高稽查选案工作的效率和效果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号