首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
赵凯 《科技通报》2012,28(6):85-86
电子邮件是人们交流的主要方式之一,但垃圾邮件的泛滥给使用者带来了很大的困扰。鉴于传统过滤技术的缺点,本文采用性能更优的Fuzzy-ID3方法对邮件进行分析,通过提取邮件的特征信息、数据预处理等步骤,得到一棵修剪后的模糊决策树,并转换为的邮件分类规则,使用这些规则可以提高邮件分类的准确性及效率。  相似文献   

2.
基于决策树和MODIS数据的土地利用分类   总被引:10,自引:0,他引:10  
土地利用类型的识别是土地利用/土地覆盖研究中的重点内容,如何准确、快速的获得大尺度范围的土地覆盖信息进行土地变化的动态实时监测一直是关注的重点。本文针对MODIS数据多光谱的特点,以山东省为例,选取8月份8-day的一期MODIS09Q1、MODIS09A1产品及全年16-day的MODIS13Q1NDVI时间序列产品,通过分析各种土地利用类型的光谱间关系,同时选择NDVI、EVI、NDWI、NDMI、NDSI等分类指数,并构造新的波段B2/B1、B7/B6(B1、B2、B6、B7分别代表1波段、2波段、6波段、7波段),利用决策树分类法,进行土地利用分类试验。结果表明,仅利用MODIS数据自身信息对宏观的土地利用分类就可以达到较高的精度,分布范围完整的土地利用类型如耕地、城市居民点精度较高,零星分布的土地利用类型如农村居民点、草地分类精度较低。决策树分类法充分发挥了MODIS数据的多光谱特点,总体精度达到71.4%,kappa系数为0.68。相对于最大似然法,总体精度提高近10个百分点,对耕地及沼泽等类型的精度提高20%到25%。  相似文献   

3.
决策树分类方法在数据挖掘和机器学习中占据很重要的位置,为了应对数据量不断增长的情况,传统的决策树分类算法需要通过模糊计算来解决多模态多维度的数据处理,对经典的ID3算法进行了介绍并给出了其模糊化处理的办法。  相似文献   

4.
张燕  汪卫霞 《大众科技》2013,(12):128-131
近年来,数据挖掘在IT行业备受关注。数据挖掘技术解决了目前数据贫乏的问题,它通过分析,从大量的、杂乱无章的数据中提取出有价值的信息,这些信息可用于解决如医疗诊断、风险评估等决策问题。决策树方法是数据挖掘中的一个重要内容,文章通过决策树在药物选择中的应用来阐述决策树的构建过程。  相似文献   

5.
将多分类器融合技术用于CRM中的客户分类研究,以提高分类性能。以决策树作为基本分类器,引入最小二乘技术进行多分类器线性融合。实证结果显示,4种不同的融合方案的分类性能均胜过任一基本分类器,甚至优于基于遗传算法的神经网络融合分类结果,从而表明了该方法的可行性和有效性。  相似文献   

6.
决策树分类算法研究综述   总被引:4,自引:0,他引:4  
本文基于决策树分类算法的研究现状,重点介绍了一些极具代表性的算法,包括ID3、C4.5等,对各种决策树分类算法的基本思想进行阐述,分析比较各种典型算法的优点和不足,并对决策树分类算法所面临的问题进行了简要的阐述,为数据分类研究者提供借鉴。  相似文献   

7.
肖永良  肖如良 《科技广场》2007,(11):163-164
高校图书馆财政预算涉及到的因素很多,如何公平、有效的分配有限的资源十分重要。本文通过建立一个简单的模型,利用数据挖掘中的决策树技术对一个学校图书馆的财政预算进行了详细的分析。  相似文献   

8.
崔丽 《科技通报》2013,29(2):45-47
在医疗系统中,人们通常使用决策树对患者的发病类型以及概率进行有效地分类预测.随着信息技术的普及,医疗系统中产生了大量的历史医疗记录,处理和分析这些海量的医疗数据给医疗系统带来了极大地挑战.本文针对海量医疗数据问题,提出了分布式构建决策树算法.该算法分布式逐层构建决策树,可以高效地构建决策树,快速有效地完成医疗系统中的预测工作.该算法是基于现有流行的云计算平台,使用MapReduce分布式框架设计的分布式算法.实验结果表明,该算法具有很好的扩展性和高效性.  相似文献   

9.
首先分析设计了一套试卷分析系统,然后对决策树算法在成绩分析中的应用进行了介绍。  相似文献   

10.
从一个新的思路对基于最小Gini指标的决策树分类算法进行了讨论。简单介绍了CART算法和Gini指标的定义,并且对SLIQ和SPRINT决策树分类技术进行深入的分析。同时对SLIQ算法的时间复杂性和这两种算法的内存管理和性能方面进行了比较和分析。  相似文献   

11.
介绍了数据挖掘与决策树算法的一些基本概念,然后对最经典也得到最广泛应用的ID3算法及其改进算法作了详细介绍,在最后给出了该算法的一些数据结构和实现代码。  相似文献   

12.
基于决策树分类的云南省迪庆地区景观类型研究   总被引:3,自引:0,他引:3  
李亚飞  刘高焕  黄翀 《资源科学》2011,33(2):328-334
决策树分类是基于空间数据挖掘和知识发现的监督分类方法。本研究利用遥感TM数据和DEM数据,构建分类决策树,并通过ENVI软件实现决策树分类,得到迪庆地区的景观类型分布图。同时利用传统的监督分类的方法进行分类,得到该地区景观类型分布图。利用野外实地采样的数据对两种分类方法进行精度评价,结果表明,两种分类方法的总体分类精度分别为85.5%和67.4%,决策树分类方法的总体分类精度比传统监督分类提高了近20%。在此基础上,研究云南省迪庆地区的景观类型分布状况,可得到以下结论:迪庆地区的景观类型主要有河谷灌丛面积约占5.5%,针叶林面积约占36.16%,亚高山灌丛草甸面积约占3.4%,高山冰雪面积约占3.7%,裸地面积约占25.4%,水体面积约占4.4%。除裸地和水体外,其他景观基本都沿着山体按海拔高度和坡向分布,其中面积最大的为针叶林景观。这与该地区高山峡谷地貌吻合。  相似文献   

13.
宋向红  李爱增 《内江科技》2009,30(10):4-4,13
为了解决成人高校教学管理中的教师教学评价问题,本文利用决策树中的ID3算法对历史的教师考评数据进行了挖掘,得到教学效果与职称、学历、教龄等之间的密切关系。研究结果表明,职称为讲师、教龄较长者或者具有高级职称、高学历的教师教学质量较好。本研究可为成人高校的教师管理、聘用等提供决策依据。  相似文献   

14.
归纳学习训练样本能够产生决策规则或决策树,通过决策规则或决策树分类新数据的方法称为决策树。本文以大连市旅顺口区为研究区域,分析该区影像信息选取分类样本,选取合适的特征,统计分析样本的特征值,运用基于特征的决策树分类方法,设计决策树分类器,来解决该区域土地利用分类问题。  相似文献   

15.
决策树算法是数据挖掘系统中一个重要的分类算法,选择合理而有效的测试属性以及对决策树进行适当的修剪是决策树算法的关键内容之一。将决策树算法引入教务管理挖掘系统,并对决策树测试属性的选择算法以及预剪枝算法进行改进。以九江学院学生四级考试信息为例,结果表明改进的决策树算法对于数据挖掘更具可靠性和有效性。  相似文献   

16.
ID3算法是决策树分类算法中一种重要方法而被广泛应用,但它存在一些缺点,如生成的树过于繁茂,分枝蕴含的信息量过小等。为了解决这些问题,本文提出了一种改进ID3算法,引入用户兴趣度,并通过试验对改进前后的算法进行了比较。  相似文献   

17.
基于模式聚合和决策树的文本分类规则抽取   总被引:1,自引:0,他引:1  
王煜  王正欧 《情报科学》2006,24(1):96-99,123
本文首先提出一种改进的X^2统计量,以此衡量词条对文本分类的贡献。然后根据模式聚合理论,将对各文本类分类贡献比例相近似的词条聚合为一个特征,建立出文本集的特征向量空间模型。此方法有效地降低了文本特征向量空间的维数。最后使用决策树进行分类,从而既保证了分类精度又获得了决策树易于抽取可理解的分类规则的优势。  相似文献   

18.
高职院校在多年的管理以及教学工作中,相关数据库拥有相当多的学生数据,从中可以提取出高职院校所需要的一些数据,由此,决策树算法在高职院校中得到了广泛的运用。另外,学生的学习成绩可以在一定情况下体现学生的具体学习情况,还可以对教师的教学质量进行侧面的反映。通过对决策树算法的深入了解和探究,对其在学生学习成绩分析中的具体运用进行了探讨。  相似文献   

19.
专利引用对于专利质量评价具有重要作用.文章基于决策树方法对可能影响专利被引的12个影响因素与专利是否被引的潜在关系进行分析.研究发现,专利的最早优先权年是其中影响最为显著的因素,而后依次是权利要求数量、专利权人数量、是否转让、平均引用时滞、优先权国家,而其他6个指标的影响效果并不明显.  相似文献   

20.
决策树方法因其简单、直观、准确率高等特点在数据挖掘及数据分析中得到了广泛的应用。介绍了决策树中最基本的算法——ID3算法的一般知识后,根据实例深入分析了该算法的设计思想、程序实现及优缺点,并针对其缺点进行改进。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号