首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 0 毫秒
1.
粗糙集理论能够有效地处理不完整、不确定和不精确的数据信息。文章在邻域粗糙集的基础上,引入了下边界作为属性冗余性的判断条件。在全部特征的前提下删除某一特征后,根据样本集合的正域变化情况来确定被删除特征的重要性,从而确定特征是否为冗余特征。文中所使用的数据集合来源于UC I数据集。通过实验可以看出:这种方法可以从大量的特征中有效地选择出重要特征。  相似文献   

2.
探讨了邻域粗糙集在生态安全分类预测中的应用。使用邻域粗糙集方法对各项生态安全指标进行评估和约简。根据特征对正域影响程度来选择重要特征,设计约简算法,处理数值型的特征数据,选出最重要的生态安全指标,去除冗余的生态安全指标而保证不影响生态安全的判断结果。实验分析结果表明:使用该方法能够有效地去除冗余指标,降低生态安全评价的复杂性。提高生态安全评价的效率。  相似文献   

3.
为了提高电子地图道路交叉点的识别和定位精度,提出了一种基于邻域特征的电子地图道路交叉点自动提取方法。首先,采用面向对象分类提取电子地图道路信息,并通过形态学算法连接和细化道路信息形成道路网;然后,采用道路交叉点八邻域前景点特征识别道路网的初始交叉点;最后,利用最小二乘法拟合道路直线来纠正初始交叉点的位置偏移,获得定位准确的道路交叉点。实验结果表明,所提方法具有较高的识别率和定位精度,能够有效地提取电子地图道路交叉点。  相似文献   

4.
《宜宾学院学报》2019,(12):29-38
粗糙集属性约简算法是数据预处理的有效方法,但无法处理某些结构复杂的数据.为了进一步拓宽粗糙集的应用范围,通过扩展粗糙集模型或改进属性约简算法以提高粗糙集的数据处理能力.对模糊粗糙集、覆盖粗糙集、邻域粗糙集、决策粗糙集、变精度粗糙集等几类拓展粗糙集模型的一些经典属性约简算法和最新提出的算法进行梳理和归纳后发现,现存的算法在运行效率和空间复杂度等方面限制了拓展粗糙集模型的使用范围.当前研究中拓展粗糙集模型在约简理论完善、大数据处理、特殊数据处理等三个方面的问题依然存在,因此未来应重点结合Pawlak粗糙集属性约简算法的思想、智能算法以及其他一些理论方法来研究拓展粗糙集模型属性约简理论.  相似文献   

5.
特征选择及规则提取是数据挖掘过程中的重要环节.Rough集理论提供了一种新的属性约简即特征选择及规则提取工具,但目前Rough集理论研究主要针对单个决策表(或信息系统),分布式环境下的粗糙集理论研究还不多见.文章提出一种垂直分布环境下的特征选择及规则提取算法,算法分析结果表明,该种算法是有效可行的.  相似文献   

6.
图像特征选择是基于内容的图像检索的关键技术之一,ReliefF算法是常用的图像特征选择算法。针对ReliefF特征选择算法的不足,利用信息论中的散度对其进行改进,在相同的时间复杂度下,使得结果的有效性得到一定的改善。提出两步法的特征选择框架,并且实现去除冗余特征的算法,在保证结果有效性的前提下大大降低了时间复杂度。  相似文献   

7.
介绍了两个目标类的决策信息系统中各目标类的Bayes粗糙集模型,并将这一模型推广到具有多目标类的情形.最后讨论了该模型的相关性质,计算实例表明该模型是有效的.  相似文献   

8.
分析莆田地区非小细胞肺癌(NSCLC)患者表皮生长因子受体(EGFR)基因突变的情况。收集138例莆田地区非小细胞肺癌组织,采用EliVisionTM plus免疫组织化学染色检测癌组织中EGFR基因外显子18、19、20及2l的突变,同时分析其突变与临床特征的关系。结果:138例NSCLC中共检出52例EGFR基因突变,EGFR突变阳性率为37.7%;外显子19和21突变占总突变的92.3%;腺癌突变发生率占突变总数的73.1%;女性EGFR基因突变率(55.0%)显著高于男性(30.6%)(P<0.05)。结果表明:莆田地区NSCLC患者EGFR基因突变以外显子19和21突变为主,女性患者和腺癌患者是选用EGFR酪氨酸激酶抑制剂的优势人群。  相似文献   

9.
本文介绍了一种基于粗糙集理论的优化车牌字符识别的方法。粗糙集理论是一种继神经元网络和模糊数学之后的新的处理含糊和不确定性知识的数学工具;粗糙集方法是一种具有发展潜力的智能信息处理方法。本文主要思想就是在汉字的网格特征提取过程中保持分类能力不变的前提下,通过知识约简提出了一种车牌字符网格特征选择的改进算法;它不仅找出了对识别最有效的网格特征集,而且可以大大降低图像特征空间的维数,减少工作量和无用特征干涉,从而提高了分类识别率。  相似文献   

10.
一般关系下的概率粗糙集模型   总被引:2,自引:0,他引:2  
针对经典的概率粗糙集模型的不足,通过引入一般关系下的后继邻域算子,得到了一般关系下的概率粗糙集模型,并讨论了所给模型的一些性质和在广义近似空间中集合的近似精度及属性约简。  相似文献   

11.
用粗糙集中组合属性重要度确定单属性重要度的理论,给出了供应链最佳合作伙伴选择的新方法,改进了文献[1]的粗糙集评价方法,新方法计算的指标权重结果避免了文献[1]中计算的指标权重为0的情况出现,同时新算法计算的各指标重要度之和比原算法各指标重要度之和大,计算精度更高,评价结果更符合实际。  相似文献   

12.
《滁州学院学报》2016,(5):61-64
为了提高特征选择对分类结果的准确率,本文提出了一种基于禁忌搜索算法的特征选择方法。该方法利用禁忌搜索算法获得包含特征权值和特征选择向量的相对最优解,然后用得到的最优解向量对测试样本做出预测。实验结果表明,与现有的特征选择方法相比,该方法的分类准确率有了进一步的提高,并且缩短了特征选择的时间。  相似文献   

13.
在模式识别中,特征选择是其中非常重要的步骤,特征集的选择直接影响分类器的精度.该文提出了一种基于遗传算法的特征权重确定方法,首先使用传统遗传算法进行特征的初步选择,得到一个粗选的特征集;然后使用实数编码的遗传算法在第一步的基础上进一步精选特征,并确定每个入选特征的权重.通过实验和一些传统特征选择方法进行对比,结果显示,该文提出的算法取得了较好的效果.  相似文献   

14.
在模式分类领域,分类器特征输入的选择对分类效果是至关重要的.我们提出了一种新的基于相对熵的特征选择AdaBoost方法.在该算法中,引入相对熵度量两类间的距离.在每一轮中,选择最优特征作为二维分量分类器的输入.随着权值的改变,在每一轮中特征的选择也不同.最后,由一组弱分类器结合而成的强分类器.实验表明,与遍历搜索的AdaBoost算法相比,该算法的检测正确率提高了5%,而时间缩短了20%以上.  相似文献   

15.
根据短信文本长度有限的特点,分别从句法、句式、语义等不同角度选取特征属性,然后设定属性权重,最后用平衡权重与大量实验总结得出的阈值相比较,实现短信文本分类。此方法计算量小,提高了分类速度和准确率,同时为实现用户过滤的个I}生化要求提供了方便的途径。  相似文献   

16.
粗糙集理论中提出的不确定性测量方法只依赖于一个论域的划分和基数,独立于粗糙集上下近似,而粗糙集理论的基本思想是通过上、下近似来描述不完整或不精确的概念。本文基于粗糙集近似提出了一种新的信息熵函数,并对其单调性问题加以研究。  相似文献   

17.
文章给出了一种基于概率覆盖的上、下近似的定义,并且研究了它的性质、数字特征、拓扑特征等,为研究覆盖粗糙集提供了新的模型.  相似文献   

18.
特征选择在模式识别技术中起着非常重要的作用,已有多种特征选择的方法,但用信息论的方法进行特征选择还是一个新的课题,MIFS算法和MIFS-U算法都是近似算法,随着输入特征的增加,特征选择性能逐渐下降.本文通过研究这两种算法,提出一种改进方法,在运算量几乎不增加的情况下,提高这两种算法的特征选择性能。  相似文献   

19.
文章从数据挖掘和粗糙集的基本概念出发,研究粗糙集理论在数据挖掘中的典型运用,为大型数据挖掘提供了一种新的方法。基于粗糙集的数据挖掘,首先通过粗糙集理论对数据进行预处理,然后对属性约简,最后进行决策规则提取,寻找最优解。  相似文献   

20.
通过具体问题,阐明了经典粗糙集模型分类质量、相对正域、决策类下近似具有非单调递减特征,变精度粗糙集模型在约简过程中分类质量和相对正域会出现跳跃现象,约简过程具有不稳定性.需要针对3者分别建立模型,使属性约简变得多样化.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号