首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
数据类间分布不均衡是不平衡数据集分类效果不好的主要原因,为了克服类间分布的不均衡,本文提出了一种基于邻近样本类别判断的不平衡数据分类算法。首先,对待判定样本,计算它的k个最邻近样本,然后将待判定样本的类别指派到它的k个最邻近中的多数类。由于本文所提出的不平衡数据分类算法在类别决策时,只考虑少量的邻近样本的类别,而不是考虑所有的训练样本,因此可以较好地克服类间不平衡对少数类分类结果的影响。在客户流失数据集上的仿真实验充分证明了本文算法能较好地处理不平衡数据分类问题。  相似文献   

2.
传统特征选择算法没有考虑特征之间的关联性,并且基于类别平衡假设,在不平衡问题上偏向多数类而忽略少数类。针对以上不足,本文综合考虑特征相关性与不平衡性,提出一种基于类区分度的高维不平衡特征选择算法CDHI,该算法通过k-means进行特征聚类,并计算簇中每个特征的类区分度,利用类区分度对聚类簇中特征进行重要性排序,然后选择各簇中类区分度较高的特征组成特征子集,达到去除高维特征冗余与处理不平衡数据的双重目的。实验结果表明,与传统特征选择方法相比,CDHI算法有效降低了特征空间的维度,提高了少数类的识别率。  相似文献   

3.
非平衡数据分类问题是近些年机器学习和数据挖掘领域的一个研究热点。对于非平衡数据分类问题,标准的分类学习算法不能获得良好的性能,因为它们往往只关注多数类而忽略少数类。从分类学习的3个不同层面对非平衡数据分类算法进行了综述,并指出了该领域未来可能的研究方向。  相似文献   

4.
吕琨璐 《金秋科苑》2013,(4):121-121
目前,由于我国大部分的低压配电系统都是采用的三相四线制的接线方式,这样会造成单相负载不均衡问题的出现,从而导致变压器处在三相不平衡的状态下。本文从变压器、电动机、发电机以及输电线路几个方面详细说明三相不平衡的危害,并根据三相不平衡问题从管理和技术方面给出一些解决的方法。  相似文献   

5.
针对传统文本分类方法的性能,尤其是其中少数类的分类性能会随着文本不平衡程度的加重而迅速恶化的现象,提出了一种基于同义词扩展的不平衡文本分类改进方法。该方法通过建立同义词词典、确定扩展规则和调整“特征保持因子冶等几个步骤,实现了少数类中的特征项的丰富和补偿,同时对扩展带来的原文档特征变化予以了补偿。实验结果表明,该方法可以从很大程度上改善少数类的分类性能,并且随着少数类中文本数量的减少,性能的提升会越发显著。与此同时,分类器的总体分类性能也得到了一定程度的提升。  相似文献   

6.
张冰川 《科技广场》2007,(3):248-249
本文提出了平衡二叉排序树的平衡调整简单算法,本算法具有容易理解、形式规范的特点,无论用于教学还是解决实际问题,都有较大的实用价值。  相似文献   

7.
本文提出了一种基于训练集划分的随机森林算法。该算法首先将多数类划分为多个不相交子集。然后将每个子集与少数类合并,进行决策树的训练。最后根据平均加权策略构建随机森林,并获取最终的分类规则。本文所提方法避免了原始样本信息的损失,而且保持了子分类器的样本平衡。在人工生成数据集上的仿真实验表明本文方法非常有效。  相似文献   

8.
本文主要介绍了不平衡数据分类的方法,包括数据层面的方法和算法改进方面的方法;传统的分类方法的评价指标,对于不平衡数据集是不适用的,故本文最后又对不平衡数据集分类的评价指标作了简要的探讨。  相似文献   

9.
随机森林是一种优秀的分类算法,然而随机森林算法不能有效的判断冗余属性,因此影响了在含有冗余属性的数据集上的分类效果。针对这一问题,本文提出了一种基于局部线性嵌入的随机森林算法。该算法利用局部线性嵌入算法对冗余属性数据集进行降维,然后利用随机森林算法进行分类学习。在UCI标准数据集上的仿真实验说明,本文算法是一种优秀的含冗余属性数据集分类算法。  相似文献   

10.
通过分析和计算实例,论述变压器不平衡运行所造成的种种危害,提出变压器在运行过程中应及时调整负荷,尽量做到三相平衡,以达到节约能源和安全运行的目的。  相似文献   

11.
本文以详实的资料说明内蒙古自治区经济发展的不平衡现状,并试图从自然资源、工业基础、生态建设、招商引资、人才储备、基础设施的差异中寻找问题的根源,解释不平衡发展的深层次问题,针对性提出了富有建设性意见和建议,为决策层提供了具有现实意义的参考资料。  相似文献   

12.
随机森林算法在数据挖掘领域中得到了广泛的应用,该算法通过构建多个不同的决策树可以获得更高的分类结果。但是,随着数据规模的增大,人们开始接触到各大规模的数据以及更高维度的数据属性。传统的随机森林构建算法不能有效、快速地处理海量高维数据,严重影响了数据的分类效率,从而影响预测效率。本文针对高维、海量数据下随机森林构建算法,改进并提高了该算法的效率,提出了基于云计算平台的随机森林构建算法。该算法可以快速的完成数据分类预测,并通过实验结果进一步展示了该算法的效率以及可扩展性。  相似文献   

13.
常翠萍 《科技风》2011,(10):273
随着全球经济一体化的不断深入,高速发展的社会经济为我国的施工企业带来严峻的挑战,面对全球经济发展的蓬勃态势,为了在激烈的市场竞争中获取利润,投标工作者们在工程投标中经常会使用到不平衡报价法,以期获得工程收益的最大值,本文尝试从高速公路机电工程不平衡报价的产生原因以及注意问题等方面入手进行简要论述。  相似文献   

14.
随着汽车行驶速度的不断提高,车轮不平衡越来越严重的影响着汽车行驶的平顺性、安全性和乘坐舒适性。如果车轮不平衡,在高速旋转时,会引起车轮的上下挑动和摆动,使车辆难于控制,同时还加剧轮胎和有关机件的非正常磨损和冲击。因此,车轮平衡度检测已成为汽车检测的重要项目之一。  相似文献   

15.
目前世界乒乓球运动的发展不平衡的状态是一个倍受人们关注的话题。从世界乒乓球的三大赛事金牌状况的统计,金牌主要集中在欧亚区域,中国乒乓球在世界上的整体水平基本毫无对手,但从体育自身的发展规看来,却是让人甚为担忧的事情。引发了人们对于当前世界乒乓球运动发展不平衡的思考。  相似文献   

16.
程豪 《今日科苑》2023,(2):35-45
随着全球化日趋深化,世界各国均面临着经济高质量发展、高水平科技产出以及人才大规模流动等方面的更多挑战。本文从经济高质量发展、科技产出和人才流动三个维度,构建了用于高质量发展评估的指标体系。针对指标体系中存在的不同因子包含的指标数量不平衡、不同因子的指标体系级数不统一的问题,建立测算方法,对高质量发展指数得分和经济高质量发展、人才流动、科技产出三个分项指数得分进行估计,以分析世界各国在这些维度上的表现。研究表明:在经济高质量发展的背景下,人才流动最为关键,而科技产出对于高质量发展评估的效应显著。总指数的排名处于第一梯队的国家全部属于发达国家。综上所述,本文提出的测算方法用于高质量发展的评估工作,以期为相关单位及其科研人员提供测算方法和思路。  相似文献   

17.
本文指出了由于制度化的缺乏,制度化过程的差异性,制度化的惰性因素而造成地区发展的不平衡,并认为要使协调地区发展沿着制度所预计的轨道进行,就应该使制度化的积极功能得到最充分的发挥,同时克服和避免其负功能。  相似文献   

18.
随着时代的不断发展,人们对供电的要求也越来越高,用电量也越来越大.近年来,不断有城市出现在用电高峰期断电的情况,这对供电企业提出很大的挑战.而衡量一个供电企业的重要经济技术指标的,就是线损率,这也是一个供电企业综合管理水平的重要标志.线损率是指在供电过程中,配电网中供电线路损坏的程度.通常情况下,配电网的线损占电网总线损的40%以上,当配网出现三相不平衡时占得比例将会大大增加,而线损率也会提升,对供电企业而言,极为不利.所以,研究降低配电网线损率的措施和方法就显得尤为重要且时间紧迫,通过分析三相不平衡线路的线损,直接推导出了线损增加率与相不平衡度的关系公式.这个关系公式可以直接用于配电网三相负荷不对称的线损计算中,并大大简化了分析计算工作中,为后续的计算工作做好了铺垫与准备.  相似文献   

19.
对于非直线型杆塔(如耐张杆塔、转角杆塔等),当邻挡断线时,杆塔所受的不平衡张力,就是另一侧导线在事故前的正常张力值,因为这些杆塔一般都是刚性的,导线的悬挂点可认为是不偏移的。因此本文主要研究直线杆塔的断线张力计算。  相似文献   

20.
丁伟  鲍建成 《科技通报》2012,28(6):101-102,105
针对传统的无线传感器网络数据传递过程中,会出现多个数据选择同一最短路径,导致数据出现竞争,造成路径阻塞,降低无线传感器网络数据传递速度的问题,提出了基于改进蚁群算法的无线传感器网络路径优化处理方法。方法是将需要传递的数据按最短路径传输,假设传输路径堵塞,则将堵塞信息发送到初始位置,后续需要传递的数据可以选取其它的次合理路径,从而避免了传统方式的缺陷。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号