首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 0 毫秒
1.
为了更加精确的预测岩体质量等级,本文采用了决策树等数据挖掘理论知识,建立预测模型。选取了岩体声波纵波波速、透水系数、单轴抗压强度、体积节理数、节理面粗糙度系数、节理面风化变异系数为影响岩体质量等级的主要因素指标,经过数据归一化、离散化和属性约简后,得到更高层次的离散值。建立了基于决策树的岩体质量等级预测模型,并从详细精度和节点错误率对模型进行了检验,效果良好。实现了对岩体质量等级的预测,4组待测样本预测结果全部正确。该方法不仅为煤矿勘探工程提供了安全保障,还提供了一种新的思路,具有很高的可实用性。  相似文献   

2.
本文选取了2015年上映的200部国产电影作为实验数据,将电影票房作为因变量分为8个类别,从用户期待程度、影片自身影响程度、同期竞争力以及基本面四个方向选取一些变量,运用数据挖掘中的C5.0决策树算法构建出了一个票房预测模型。同时对选取的电影票房影响因子进行数据分析,得出不同影响因子对电影票房的预测重要程度,发现百度指数与电影票房之间有着很大的关联度。同时使用了多元Logistic回归分析、贝叶斯网络以及CHAID树方法进行实验,最终发现C5.0决策树效果最好。  相似文献   

3.
介绍了数据挖掘与决策树算法的一些基本概念,然后对最经典也得到最广泛应用的ID3算法及其改进算法作了详细介绍,在最后给出了该算法的一些数据结构和实现代码。  相似文献   

4.
5.
彭述刚  王巧  董少坤 《大众科技》2014,(4):46-48,51
以汶川县为研究对象,选取2009年landsat5TM影像为数据源,研究地质灾害及其背景地物在TM影像的光谱特征及其波段间的相互运算。研究发现,短波红外波段(TM5)和热红外波段(TM6)是提取地质灾害信息的关键波段,构建了决策树地质灾害提取模型(TM5-TM6)/(TM5+TM6),实现了对地质灾害信息提取,对结果进行了精度评价,kappa系数为0.92,生产者精度为93.2%、用户精度为97.3%,满足要求。解译结果中发现,地质灾害的分布与区内地质构造密切相关,随距断裂带距离的增加而减少、呈线性分布,且84.5%集中分布在距断裂带0~5km区域内,建议震区公路选址应尽量绕避该区域。  相似文献   

6.
7.
对我国198~2005年的农产品相关数据进行收集和分析,运用EViews软件进行计算,建立了农产品产量与相关投入的模型,并对模型进行了识别,最后对模型进行检验,验证其可行性.  相似文献   

8.
缝纫机作为老“三大件”产品之一,其传统市场正愈来愈面临着新产品的挑战,缝纫机的生产厂家也正在经受严峻的考验。一九八四年,湖北主要生产缝纫机的四家工厂,由于不适应竞争激烈的市场,已有两家企业先后倒闭,另外两家企业也处于半停产状态。去年全  相似文献   

9.
文章对竞争对手识别的本质进行了分析,认为竞争对手识别是一个动态分类过程,指出该过程有3个难点.现有的竞争对手识别方法存在3个缺陷,因而无法有效地支持竞争对手识别过程.认为数据挖掘决策树算法可以应用于竞争对手识别,并详细描述了应用的过程,包括以下4个步骤:竞争对手属性选择、竞争对手数据准备、竞争对手数据预处理和建立竞争对手识别决策树.  相似文献   

10.
决策树是一种有效的数据分类方法。粗糙集理论把知识和分类紧密联系起来,为处理不精确、不完全数据的分类问题提供了一种更符合人类认知的数学工具。提出了把后继节点的变精度加权平均粗糙度和值作为属性选择标准构造决策树的改进新算法。新算法用变精度代替近似精度,能有效地克服噪声数据在构造决策树过程中对刻画精度的影响,使生成的决策树复杂性降低,泛化能力更强。  相似文献   

11.
从一个新的思路对基于最小Gini指标的决策树分类算法进行了讨论。简单介绍了CART算法和Gini指标的定义,并且对SLIQ和SPRINT决策树分类技术进行深入的分析。同时对SLIQ算法的时间复杂性和这两种算法的内存管理和性能方面进行了比较和分析。  相似文献   

12.
国家将30万辆小轿车生产线定点于我省。勿庸置疑,它将对我省国民经济发展产生重大影响,本文以1987年湖北省国民经济投入产出表和国产轿车厂调查数据对其影响度进行数量预测,并将预测结果放置全省国民经济中进行综合平衡,提出轿车工业与湖北经济发展设想。 1增量与效益小轿车项目建成投产,将使我省经济获得大幅度增长。其增量是直接增长和间接增长之和。直接增长指30万辆轿车总装厂形成的增量。计算方法为:  相似文献   

13.
基于引文分析的情报学与相关学科的研究   总被引:1,自引:0,他引:1  
采用引文分析的理论与方法,对我国1998~2006年情报学期刊论文及其参考文献与引证文献进行统计分析,从情报学知识吸收(引文分析)、知识扩散(被引分析)、主题交叉(知识内化)的角度综合研究了情报学相关学科及其影响程度.  相似文献   

14.
科研管理评估的时效性以及科学性对于高校科研力量的发展至关重要,需要采取一定的实验方法提高其相关的有效指标,这样才能让评估变得更加顺利。在相关目标的要求基础上,提出决策树算法,它能够很耗地对评估对象进行属性的测试,并在此基础上进行属性值的评价。结合权重系数对信息进行计算,能够对最终的结果进行判断,看其是否具有一定的合理性。通过实验验证,结果表明:决策树算法能够运用于高校的科研管理之中,并且具有很高的信用度,算法难度适中,具有很好的使用价值。  相似文献   

15.
通过属性规约、数据清理和属性构造对外语培训学校的学生数据进行了预处理,利用信息增益方法对预处理后的属性构造了决策树,根据决策树得出了培训行业重点客户:拥有会员卡且外语水平在中级以下的校内人员;拥有企业会员卡且为社会人员中的女性学员;文化程度在高中及以下的人员。  相似文献   

16.
指代消解是自动文摘的重要技术,中文指代消解的重要手段是名词短语特征向量的确定和选取。将名词向量构建成决策树,训练得到中文指代消解测试结果。  相似文献   

17.
本文主要利用“决策树”理论对银行业洗钱和反洗钱中的行为主体:洗钱者、金融机构和反洗钱者的行为决策进行分析,在此基础上提出自己的一些看法。  相似文献   

18.
[研究目的]文章以专利文献数据为基础,构建一套科学的专利质量评价指标体系,为专利质量评价提供新的评价模型,解决专利质量分类预测问题,为我国创新主体提升专利质量提供决策参考。[研究方法]首先构建专利质量评价指标体系,然后建立基于Stacking思想的集成学习专利质量分类预测模型,该模型包含基分类器以及元分类器两层结构,最后对人脸识别产业的专利进行质量分类并与其他专利质量分类模型进行对比。[研究结论]本文构建的最优集成学习分类模型在测试集上的宏平均F1值达到了0.9942,整体上优于传统的机器学习模型。此外,研究结果表明,技术先进性、技术稳定性以及保护范围对专利质量影响较大,在高质量专利筛选过程中应加大对这3个指标的评价权重。  相似文献   

19.
通过技术预测的量化趋势演化模型,预测挥发性有机物(VOCs)的新技术和技术发展态势,从而为该领域提供技术路径方案。基于专业术语、高频词、词共现3个维度分析得到术语集,从新技术发现和领域技术发展态势两方面提出一种基于趋势演化分析的模型,模型包括领域技术主题筛选与处理、领域新技术主题清洗、领域技术主题时序演化趋势3个模块。通过实证验证趋势演化模型的可行性,预测挥发性有机物治理技术主题主要集中于挥发性有机物催化及催化剂应用研究领域、光催化研究领域、挥发性有机物治理设备及工艺研究领域、污染源控制研究领域和污染源检测/监测研究领域。  相似文献   

20.
基于决策树分类的云南省迪庆地区景观类型研究   总被引:3,自引:0,他引:3  
李亚飞  刘高焕  黄翀 《资源科学》2011,33(2):328-334
决策树分类是基于空间数据挖掘和知识发现的监督分类方法。本研究利用遥感TM数据和DEM数据,构建分类决策树,并通过ENVI软件实现决策树分类,得到迪庆地区的景观类型分布图。同时利用传统的监督分类的方法进行分类,得到该地区景观类型分布图。利用野外实地采样的数据对两种分类方法进行精度评价,结果表明,两种分类方法的总体分类精度分别为85.5%和67.4%,决策树分类方法的总体分类精度比传统监督分类提高了近20%。在此基础上,研究云南省迪庆地区的景观类型分布状况,可得到以下结论:迪庆地区的景观类型主要有河谷灌丛面积约占5.5%,针叶林面积约占36.16%,亚高山灌丛草甸面积约占3.4%,高山冰雪面积约占3.7%,裸地面积约占25.4%,水体面积约占4.4%。除裸地和水体外,其他景观基本都沿着山体按海拔高度和坡向分布,其中面积最大的为针叶林景观。这与该地区高山峡谷地貌吻合。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号