共查询到20条相似文献,搜索用时 0 毫秒
1.
文本分类在自然语言分类中起着重要作用,将决策树ID3算法应用与文本分类,对数字图书馆的部分文本信息分类,提出一个基于ID3决策树的文本分类算法,取得了良好的实验结果。 相似文献
2.
3.
对ID3算法的基本理论和原理进行详细阐述,并利用Weka成功地实现了ID3一级决策树算法。其实现过程和结果对于在不同领域ID3算法的建立及实现具有重要参考意义和依据。 相似文献
4.
介绍了数据挖掘的相关概念,数据挖掘中决策树ID3算法的相关概念以及信息增益和信息熵概念。通过实例介绍了ID3算法的主要内容,指出了ID3算法的不足及改进之处。针对该实例提出ID3算法的一种改进算法——MIND算法,并通过MIND算法重新计算实例内容。最后通过实例分析将改进算法与ID3算法进行对比,证明了改进算法的有效性。 相似文献
5.
6.
7.
决策树通过对获取的样本数据属性使用信息论知识原理进行解析和归纳,最终形成类似于流程图的树型结构形式。ID3算法是典型采用贪心算法的归纳学习算法,其使用递归方式采用贪心算法来生成决策树。与其他分类技术算法比较,ID3算法有着自己的优势,但在实际应用中,采用决策树ID3算法进行分类时,需要先对数据进行一些处理或改进。 相似文献
8.
针对现有决策树中ID3算法倾向于取值较多的属性的缺点,提出一种利用优化法的思想来改进信患增益的算法。用ID3算法及改进后的算法建立金融企业决策树分类模型,利用某银行提供的客户信息和银行业务信息等数据,通过客户存款情况,探讨对金融客户进行分类,研究忠实客户的特征。实验中两个方案的比较表明,利用优化法算法来选择决策树分支取值,不但可以加快决策树的生长,而且最重要的是可以得到结构好的决策树,便于从中挖掘好的规则信息。特别是在使用决策树算法来挖掘的数据越多,算法的效率和性能就越好,算法的优越性就越明显。 相似文献
9.
决策树是数据挖掘中重要的分类算法,通常用来形成分类器.ID3算法是决策树中的核心算法.针对ID3算法倾向于取值较多的属性的缺点,引进属性重要度对ID3算法予以改进,并通过实验对改进前后的算法进行了比较.实验表明,改进后的算法是有效的。 相似文献
10.
陈伟 《淮南师范学院学报》2010,12(3):33-35
ID3算法是决策树归纳分类算法的一种。通过对ID3算法的计算复杂度分析,提出了利用统计理论知识和条件概率的思想来改进算法,并运用改进算法构造决策树。 相似文献
11.
决策树ID3算法在学生成绩中的应用 总被引:2,自引:0,他引:2
姜红艳 《鞍山师范学院学报》2008,10(4)
介绍了数据挖掘中决策树的分类方法和概念,以及著名的ID3算法,同时也介绍了ID3算法在学生成绩中的应用. 相似文献
12.
一种改进的ID3算法 总被引:2,自引:0,他引:2
ID3算法是决策树学习的核心算法。本文论述ID3算法的基本思想和实现方法,针对原有算法的不足之处,提出了一种基于属性优先权的新算法,并通过实验证明改进后的算法具有更高的决策效率。 相似文献
13.
14.
向文燕 《柳州职业技术学院学报》2011,11(2):31-34
影响中学生英语成绩的因素很多,本文运用数据挖掘技术中的ID3算法,对中学生的英语成绩进行分析。结果表明,ID3算法能够较好的对数据进行分类,所生成的分类规则有助于今后中学英语教学工作的开展。 相似文献
15.
决策树是数据挖掘中简单常用的分类算法,它是一种以实例为基础的归纳学习算法,来发现数据模式和规则[1,2]。根据ID3算法,对股指期货自然人投资者数据样本进行分析,获得不同属性上的信息增益,最后生成决策树,可将此树转换成一个if-then规则的集合,并找到数据建模的规律和模式,提取有价值的信息,为证券公司扩展业务,增加客户,规避风险做出科学的决策支持。 相似文献
16.
随着"以客户为中心"商业模式的出现,客户成为企业最重要的资源.本文基于ID3算法对客户进行了细分,依据客户的购买量、购买频率、购买价格三个指标划分出了不同价值的客户类别,并通过算例分析了ID3数据挖掘技术在CRM领域中的应用问题. 相似文献
17.
叶福兰 《廊坊师范学院学报(自然科学版)》2011,11(3)
主要研究决策树ID3算法及其改进算法,阐述ID3算法的基本思想及存在的不足,并根据ID3算法中信息增益计算原理的特点,利用凸函数的性质简化信息增益的计算,提高ID3算法中信息增益的计算效率. 相似文献
18.
《赣南师范学院学报》2021,(6):68-73
决策树算法是数据挖掘中的一种经典算法,常用的决策树算法有ID3算法、C4.5算法等.分析了ID3算法在应用中的优缺点,并对其进行了简单改进,即将复杂的计算公式转化为只含有加、减、乘、除的简单式子.在此基础上将其应用于大学公共体育教学质量评价中,找出了影响教师评价结果的重要因素,为科学评价教学提供了思路. 相似文献
19.
分类技术中的决策树算法分析 总被引:6,自引:0,他引:6
秦文 《深圳信息职业技术学院学报》2004,2(1):54-58
介绍了解决分类问题的常用方法——决策树。并对决策树的原理及Quinlan的ID3、C4.5两种主要的决策树算法进行了分析。通过分析它们的基本原理以及主要特点,提出了对决策树算法改进的展望。 相似文献
20.
研究一个属性的某几个属性值并的权熵之和与该属性单个属性值的权熵之和的关系,从理论上证明一个属性的某几个属性值并的权熵之和不小于该属性单个属性值的权熵之和.为ID3算法的合理性提供理论基础.实验结果证明结论正确. 相似文献