首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 98 毫秒
1.
决策树是数据挖掘中重要的分类算法,通常用来形成分类器.ID3算法是决策树中的核心算法.针对ID3算法倾向于取值较多的属性的缺点,引进属性重要度对ID3算法予以改进,并通过实验对改进前后的算法进行了比较.实验表明,改进后的算法是有效的。  相似文献   

2.
为了提高C4.5决策树算法的有效性,提出一种改进的C4.5决策树算法。结合粗糙集理论的属性约简算法和Fayyad边界点判定定理,对C4.5算法进行了改进,利用UCI数据集进行了实验。结果表明,改进的C4.5算法不仅提高了准确率,而且缩小了决策树规模,减少了分类时间。  相似文献   

3.
顾及粗糙集理论的CART改进算法及其应用   总被引:1,自引:0,他引:1  
CART算法是数据挖掘技术中的一种常用的方法,对CART技术产生、基本思路及主要挖掘步骤及其优缺点等进行了概略介绍,利用粗糙集理论求取属性重要度并对CART算法作了改进.最后给出了改进算法在教学中的应用实例.  相似文献   

4.
给出了属性重要度新定义,提出了一种新的基于粗集理论的属性权重的计算方法,并通过实例进行了验证。结果表明,这种权重计算方法更符合实际,可以解决原有粗糙集计算方法存在的问题。  相似文献   

5.
决策树是一种重要的分类方法.本文分析了单变量决策树和多变量决策树的不足,提出一种基于核属性的决策树构造算法,该算法根据核属性存在的不同情况,选择结点的分裂属性.所创建的决策树规模适中,导出的规则简洁、支持度高.实验结果分析表明,该方法是有效的。  相似文献   

6.
阐述了粗糙集和信息熵的概念,在此基础上给出了基于信息熵的属性重要性度量公式,并证明了属性集中绝对必要元素与属性重要度之间的关系.最后,通过实例分析表明该公式的有效性.  相似文献   

7.
属性约简是粗糙集研究的重要内容之一,首先利用反例指出蔡莉等人提出的基于依赖度的决策表约简算法的错误,然后给出一种新的基于属性依赖的约简算法。通过一个信息系统实例,证明该算法的可行性和有效性。  相似文献   

8.
基于粗糙集属性重要度的TOPSIS方法   总被引:1,自引:0,他引:1  
本文结合粗糙集中的属性重要度,给出了基于粗糙集属性重要度的TOPSIS方法,说明决策者可以根据论域上不同的属性而得到的知识对备选方案进行排序,从而作出最后的决策.  相似文献   

9.
为改进属性重要度概念,给出了一种基于粗糙集理论的单属性重要度和组合属性重要度结合的确定属性重要度的方法。通过实例考证表明,改进的粗糙集重要度计算方法具有普适性,解决了在文献[3]中提出而没有解决的问题。  相似文献   

10.
本文分析了基于正区域的决策树生成算法的不足,针对这些不足,提出了基于正区域及其分类纯度的决策树算法。该方法计算简单,易于理解,并用实例说明了该方法的优越性。  相似文献   

11.
粗糙集属性约简就是在保持信息系统的分类和决策能力不变的条件下,删除不相关或不重要的属性,使原有系统得到简化。利用一种基于粗糙集的属性约简算法,通过计算属性在可分辨矩阵中出现的频率来定义属性的重要性,可使约简结果保持近似精度。实验表明该算法可以简化评教指标体系,降低信息系统所需存储空间。  相似文献   

12.
13.
提出了基于遗传算法的知识相对约简算法,它以条件属性在差别矩阵中出现的频率为启发信息,以决策表的属性核来初始化传统遗传算法的种群,加强了遗传算法的搜索、缩短了计算时间;提出了修正校验算法,提高决策表属性约简的正确性.通过实例分析,证明是求解知识约简的有效方法.  相似文献   

14.
基于粗糙集的属性约简算法   总被引:1,自引:0,他引:1  
属性约简是粗糙集理论研究的关键问题之一,现已证明寻找一个决策表的最优约简是N P-hard问题。本文首先介绍可辨识矩阵属性约简的基本算法并对求核算法进行了改进。在此基础上给出决策表中属性重要性的两种度量,并以此为启发式信息,提出了一种属性约简的启发式算法。最后,实验结果表明,该算法在大多数情况下能有效地获得决策表的最优约简。  相似文献   

15.
《宜宾学院学报》2019,(12):29-38
粗糙集属性约简算法是数据预处理的有效方法,但无法处理某些结构复杂的数据.为了进一步拓宽粗糙集的应用范围,通过扩展粗糙集模型或改进属性约简算法以提高粗糙集的数据处理能力.对模糊粗糙集、覆盖粗糙集、邻域粗糙集、决策粗糙集、变精度粗糙集等几类拓展粗糙集模型的一些经典属性约简算法和最新提出的算法进行梳理和归纳后发现,现存的算法在运行效率和空间复杂度等方面限制了拓展粗糙集模型的使用范围.当前研究中拓展粗糙集模型在约简理论完善、大数据处理、特殊数据处理等三个方面的问题依然存在,因此未来应重点结合Pawlak粗糙集属性约简算法的思想、智能算法以及其他一些理论方法来研究拓展粗糙集模型属性约简理论.  相似文献   

16.
冗余是信息系统和网络的一个重要研究课题。文章通过一个实例,介绍了运用Rough集方法来约简信息系统中的属性冗余过程。  相似文献   

17.
Rough集理论在数据约简中的应用   总被引:2,自引:0,他引:2  
Rough集是由Z.Pawlak于1982年提出的,它是一种新的处理模糊和不确定知识的数学工具.它能有效地分析不确定,不精确,不一致等各种不完备信息.其优点是无需任何关于数据的初始的或附加的信息,如统计学中的概率分布.而随着数据库系统中所包含的信息量地扩大,人们越来越认识到信息系统中数据急度膨胀的危害性,因此人们对数据进行约简的要求也越来越强烈.本文主要介绍Rough集的基本理论在数据约简中的应用.  相似文献   

18.
首先,在集值信息系统上定义了一种新的扩充粗糙集模型,给出了在此模型下协调集值决策信息系统的属性约简与判定准则,并通过具体事例说明了求协调集值决策信息系统约简的方法;其次,定义了不协调集值决策信息系统的分配协调集,给出了一种利用广义协调相似空间处理不协调集值信息系统的方法;最后讨论了相似水平的大小对集值决策信息系统属性约简的影响.  相似文献   

19.
介绍了粗糙集的布尔矩阵表示及其重要性,重点研究了基于条件区分能力的属性约简及其改进算法,构造了基于核与条件区分能力,加权条件区分能力的两种属性约简算法,提高了数据挖掘速度.通过实例证明了该算法的有效性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号