首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 968 毫秒
1.
ID3决策树算法是数据挖掘中最常用的一种方法,但其存在多值偏向性等问题,文中根据相似性原理,引进属性趋近度概念,以描述属性和决策分类属性的分类样本数的趋近程度确定测试属性,构建决策树,并对ID3算法和改进算法T_ID3算法的多值偏向性问题和测试预测率进行了理论和实验的验证。  相似文献   

2.
石东贤 《科技风》2012,(2):277-278
旅游景点信用评估是一种典型的分类问题,本文概述了粗糙集和决策树的理论,基于这两种理论,提出了一个基于数据挖掘粗糙集理论与决策树分类技术相结合的信用评估方法来建立旅行景点的信用评估模型,利用粗糙集的知识约简的概念,对样本数据进行预处理,去除冗余属性对分类模型的影响,然后用决策树方法建立分类模型。最后通过Pawlak重要度的属性约简算法和ID3决策树算法实现了该模型。  相似文献   

3.
针对标准ID3算法在数据规则挖掘的应用中还存在运算时间长、规则挖掘效果不好等问题。本文提出了一种基于属性增益优化ID3算法的体育训练数据规则挖掘模型,首先利用凸函数的性质来改进信息量公式,通过对数据集中属性选择标准的改变从而降低决策树的计算成本,减少决策树的生成时间,之后计算取值较多且不重要的属性信息时,将经验知识度参数引入从而避免取值少的属性被抛弃。此后又进行了专门的仿真实验,实验结果表明,与传统的算法相比,本文设计的经过改进的ID3算法在建树时间和规则数目这两个方面都具有更好的性能。  相似文献   

4.
决策树分类方法在数据挖掘和机器学习中占据很重要的位置,为了应对数据量不断增长的情况,传统的决策树分类算法需要通过模糊计算来解决多模态多维度的数据处理,对经典的ID3算法进行了介绍并给出了其模糊化处理的办法。  相似文献   

5.
ID3算法是决策树分类算法中一种重要方法而被广泛应用,但它存在一些缺点,如生成的树过于繁茂,分枝蕴含的信息量过小等。为了解决这些问题,本文提出了一种改进ID3算法,引入用户兴趣度,并通过试验对改进前后的算法进行了比较。  相似文献   

6.
决策树算法是数据挖掘领域的核心分类算法之一,ID3算法则是最为经典的决策树算法。本文以ID3数据挖掘算法在债务管理中的应用为例,验证了算法的性能。  相似文献   

7.
李宏林 《情报探索》2011,(11):28-30
应用数据挖掘决策树方法的ID3算法分析高校学生学习成绩,可以形成相应科目的判定规则,进而挖掘科目间的关联性,并比较其重要程度.将成绩离散化是应用ID3算法的前提,选用合适的分类点(如取科目平均值及各科总平均值作为分类点)构建离散区间可以构造出判定效果较好的决策树.  相似文献   

8.
决策树分类算法研究综述   总被引:4,自引:0,他引:4  
本文基于决策树分类算法的研究现状,重点介绍了一些极具代表性的算法,包括ID3、C4.5等,对各种决策树分类算法的基本思想进行阐述,分析比较各种典型算法的优点和不足,并对决策树分类算法所面临的问题进行了简要的阐述,为数据分类研究者提供借鉴。  相似文献   

9.
讨论了基于互信息的决策树分类算法——ID3算法。  相似文献   

10.
决策树算法是数据挖掘技术中常用的方法,在分类和预测方面有着广泛的应用。本文简要地介绍了决策树ID3算法的基本思想,通过数据实例说明了构造决策树的实现过程,实现了对学生成绩的预测。  相似文献   

11.
介绍了数据挖掘与决策树算法的一些基本概念,然后对最经典也得到最广泛应用的ID3算法及其改进算法作了详细介绍,在最后给出了该算法的一些数据结构和实现代码。  相似文献   

12.
贝叶斯网络是人工智能领域研究不确定知识的重要工具,联合树算法是一种应用广泛的贝叶斯网络推理算法。从基于消息传递的图模型、消息传递方案、计算效率、存储效率四个方面对联合树的三种算法进行比较。并对Hugin算法进行改进,通过具体贝叶斯网络的验证,改进算法能显著提高计算效率。  相似文献   

13.
ID3算法计算速度较快、容易实现并且适用于处理规模较大的学习问题,但其较倾向于选择取值较多的类别,从而导致丢失全局最优解。提出一种改进的ID3算法,并将其应用于管道腐蚀检测系统中,研究结果表明,改进后的算法具有较高的可信度。  相似文献   

14.
对空间数据挖掘聚类技术及其在公共设施选址方面的传统应用方法进行了综述,分析了传统应用方法中有待解决的关键问题,对空间距离代价的表示问题和传统方法的算法时间复杂度进行了初步探讨,运用模拟退火算法和图论对传统方法进行了改进,实现了算法时间复杂度的降低和聚类结果的优化。  相似文献   

15.
Because of the big volume of marketing data, a human analyst would be unable to uncover any useful information for marketing that could aid in the process of making decision. Smart Data Mining (SDM), which is considered an important field from Artificial Intelligence (AI) is completely assisting in the performance business management analytics and marketing information. In this study, most reliable six algorithms in SDM are applied; Naïve Bayes (NB), Logistic Regression (LR), Random Forest (RF), Support Vector Machine (SVM), ID3, and C4.5 on actual data of marketing for bank that taken from Cloud Internet of Thing (CIoT). The objectives of this study are to build an efficient framework to increase campaign of marketing for banks by identifying main characteristics that affect a success and to test the performance of CIoT and SDM algorithms. This study is expected to enhance the scientific contributions to investigating the marketing information capacities by integrating SDM with CIoT. The performances of SDM algorithms are calculated by eight measures; accuracy, balance accuracy, precision, mean absolute error, root mean absolute error, recall, F1- Score and running time. The experimental findings show that the proposed framework is successful, with higher accuracies and good performance. Results revealed that customer service & marketing tactics are essential for a Company’ success & survival. Also, the C4.5 has accomplished better achievement than the SVM, RF, LR, NB, & ID3. At the end, CIoT Platform was evaluated by response time, request rate & processing of bank data.  相似文献   

16.
随着信息技术的不断发展,应用商业智能技术进行数据挖掘与分析对商家来说也越来越重要,分类回归树和神经网络算法是数据挖掘的经典算法,其广泛运用在数据分析、预测和评估等方面。文章分别运用分类回归树和神经网络算法对零售商品采取促销方案后收入变化的数据进行分析,并建立相应的模型对促销方案效果进行预测。  相似文献   

17.
严海芳 《科技通报》2012,28(7):20-22
利用MCEM加速算法,在定数截尾场合下给出了对数正态分布的参数估计,并通过数据模拟进一步验证了MCEM加速算法在参数估计中比EM算法更有效,收敛速度更快。  相似文献   

18.
1 Introduction  AgraphGisanorderedpairofdisjointsets(V,E)suchthatEisasubsetofthesetofunorderedpairsofV,wherethesetsVandEarefinite.ThesetViscalledthesetofverticesandEiscalledthesetofedges.TheyareusuallydenotedbyV(G)andE(G),respectively.Anedge{x,y}issa…  相似文献   

19.
Apriori算法是关联规则挖掘中的经典算法。通过对Apriori算法的基本思想和性能的研究分析,提出了一种基于垂直事务列表的树形结构的挖掘算法,减少了候选频繁项集的数量,提高了挖掘算法的效率。实验结果表明新算法具有良好的性能。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号