共查询到20条相似文献,搜索用时 0 毫秒
1.
针对现有决策树中ID3算法倾向于取值较多的属性的缺点,提出一种利用优化法的思想来改进信患增益的算法。用ID3算法及改进后的算法建立金融企业决策树分类模型,利用某银行提供的客户信息和银行业务信息等数据,通过客户存款情况,探讨对金融客户进行分类,研究忠实客户的特征。实验中两个方案的比较表明,利用优化法算法来选择决策树分支取值,不但可以加快决策树的生长,而且最重要的是可以得到结构好的决策树,便于从中挖掘好的规则信息。特别是在使用决策树算法来挖掘的数据越多,算法的效率和性能就越好,算法的优越性就越明显。 相似文献
2.
决策树通过对获取的样本数据属性使用信息论知识原理进行解析和归纳,最终形成类似于流程图的树型结构形式。ID3算法是典型采用贪心算法的归纳学习算法,其使用递归方式采用贪心算法来生成决策树。与其他分类技术算法比较,ID3算法有着自己的优势,但在实际应用中,采用决策树ID3算法进行分类时,需要先对数据进行一些处理或改进。 相似文献
3.
4.
介绍了数据挖掘的相关概念,数据挖掘中决策树ID3算法的相关概念以及信息增益和信息熵概念。通过实例介绍了ID3算法的主要内容,指出了ID3算法的不足及改进之处。针对该实例提出ID3算法的一种改进算法——MIND算法,并通过MIND算法重新计算实例内容。最后通过实例分析将改进算法与ID3算法进行对比,证明了改进算法的有效性。 相似文献
5.
6.
7.
8.
决策树是数据挖掘中重要的分类算法,通常用来形成分类器.ID3算法是决策树中的核心算法.针对ID3算法倾向于取值较多的属性的缺点,引进属性重要度对ID3算法予以改进,并通过实验对改进前后的算法进行了比较.实验表明,改进后的算法是有效的。 相似文献
9.
一种改进的ID3算法 总被引:2,自引:0,他引:2
ID3算法是决策树学习的核心算法。本文论述ID3算法的基本思想和实现方法,针对原有算法的不足之处,提出了一种基于属性优先权的新算法,并通过实验证明改进后的算法具有更高的决策效率。 相似文献
10.
决策树ID3算法在学生成绩中的应用 总被引:2,自引:0,他引:2
姜红艳 《鞍山师范学院学报》2008,10(4)
介绍了数据挖掘中决策树的分类方法和概念,以及著名的ID3算法,同时也介绍了ID3算法在学生成绩中的应用. 相似文献
11.
ID3算法是示例学习中建立决策树的一种重要的方法.介绍了ID3决策树算法的基本思想,讨论了 ID3决策树算法中的难点和不足,结合实例给出了利用信息增益度法来改进ID3算法的详细过程. 相似文献
12.
文本分类在自然语言分类中起着重要作用,将决策树ID3算法应用与文本分类,对数字图书馆的部分文本信息分类,提出一个基于ID3决策树的文本分类算法,取得了良好的实验结果。 相似文献
13.
对ID3算法的基本理论和原理进行详细阐述,并利用Weka成功地实现了ID3一级决策树算法。其实现过程和结果对于在不同领域ID3算法的建立及实现具有重要参考意义和依据。 相似文献
14.
15.
叶福兰 《廊坊师范学院学报(自然科学版)》2011,11(3)
主要研究决策树ID3算法及其改进算法,阐述ID3算法的基本思想及存在的不足,并根据ID3算法中信息增益计算原理的特点,利用凸函数的性质简化信息增益的计算,提高ID3算法中信息增益的计算效率. 相似文献
16.
研究一个属性的某几个属性值并的权熵之和与该属性单个属性值的权熵之和的关系,从理论上证明一个属性的某几个属性值并的权熵之和不小于该属性单个属性值的权熵之和.为ID3算法的合理性提供理论基础.实验结果证明结论正确. 相似文献
17.
高校教师教育技术培训存在培训形式单一、内容安排不够合理、评价体系不够健全等问题。针对参训教师在知识层次、学科背景、思想意识等方面存在的差异,应坚持"先分类后培训"的思想,以学校教师历年参训情况构造ID3决策树,利用分类技术从中挖掘出一些潜在的、隐藏的知识,为将来参训教师的分类、培训的具体实施做好充分的准备工作。实验表明,该方法具有一定的可行性。 相似文献
18.
《赣南师范学院学报》2021,(6):68-73
决策树算法是数据挖掘中的一种经典算法,常用的决策树算法有ID3算法、C4.5算法等.分析了ID3算法在应用中的优缺点,并对其进行了简单改进,即将复杂的计算公式转化为只含有加、减、乘、除的简单式子.在此基础上将其应用于大学公共体育教学质量评价中,找出了影响教师评价结果的重要因素,为科学评价教学提供了思路. 相似文献
19.
ID3算法是决策树算法中最经典的一个算法。本文根据高校管理信息化的特殊性将模糊集理论知识与ID3算法相结合,应用到高校管理中,提高了ID3决策树分类的正确性,与ID3原算法相比,易于理解,决策树的构造更加准确和快速。 相似文献
20.
为了改善传统ID3算法在分类属性选择上存在多值偏向性的不足,提出基于PCA的决策树优化算法。在普通基于PCA 的决策树改进算法中,存在数据经降维处理后代表性不强的问题,导致算法需经过多次数据运行后,准确率才能小幅提升。在ID3算法基础上,在分类前两次提取属性特征值,并计算了需要分类的数据量,也即对原始数据进行最重要的属性选择。在子树建立之后,再进行数据的降维合并选择。采用UCI数据库中的3个数据集对改进算法进行验证,结果表明改进算法的平均准确率达到94.6%,相比传统ID3算法与普通PCA决策树优化算法分别提升了1.6%和0.6%。因此,基于PCA的决策树算法能在一定程度上提升结果准确率,具备一定的应用价值。 相似文献