首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
INTRODUCTION Feature subset selection (FSS) is a data miningfundamental problem to select out relevant featuresand cast away irrelevant and redundant featuresfrom an original feature set (Liu and Motoda, 1998).If a feature subset satisfies the FSS measure and hasthe minimal size, it is regarded as the optimal fea-ture subset. Complete search strategy is the way toobtain an optimal feature subset. Branch and Bound(Narendra and Fukunaga, 1977), Focus (Almuallimand Dietterich, 199…  相似文献   

2.
Feature selection ks a process where a miniraal feature subset ks selected from an original feature set according to a certain measure. In this paper, feature relevancy ks defined by an inconsistency rate. A bidirectional automated branch and bound algorithm is presented. It is a new complete search algorithm for feature selection, which performs feature deletion and feature addition in parallel.Its bound ks determined by inconsistency rate of the original feature set, hence termed as ‘automated‘. Experimental study shows that it ks fit for feature selection.  相似文献   

3.
为了使聚类可以在低维数据空间中进行,提出了一种新的聚类特征选择方法.该方法分3个步骤,每个步骤都在一个wrapper框架中执行.首先,将所有原始特征都按照重要性进行排序,引入一个特征重要性评价函数E(f);然后,顺序地选择特征组成重要特征子集;最后,去除重要特征子集中可能存在的冗余特征.由于是顺序选择特征而不是在巨大的特征子集空间中进行搜索,因此算法效率很高.实验结果表明该方法可以找出有助于聚类的重要特征子集,并且可以去掉那些不利于聚类的特征.  相似文献   

4.
关键帧提取技术是基于内容检索和视频分析的基础。关键帧的使用减少了视频索引的数据量,同时也为视频摘要和检索提供了一个组织框架。首先介绍了目前关键帧提取技术,然后提出了一种基于互信息量的关键帧提取方法,该算法以帧间互信息量来衡量两帧图像内容的相似性,可以对具体镜头按其特点自动提取出一个或多个关键帧。实验结果表明这种方法可以较好地概括视频内容。  相似文献   

5.
特征选择在模式识别技术中起着非常重要的作用,已有多种特征选择的方法,但用信息论的方法进行特征选择还是一个新的课题,MIFS算法和MIFS-U算法都是近似算法,随着输入特征的增加,特征选择性能逐渐下降.本文通过研究这两种算法,提出一种改进方法,在运算量几乎不增加的情况下,提高这两种算法的特征选择性能。  相似文献   

6.
图像特征选择是基于内容的图像检索的关键技术之一,ReliefF算法是常用的图像特征选择算法。针对ReliefF特征选择算法的不足,利用信息论中的散度对其进行改进,在相同的时间复杂度下,使得结果的有效性得到一定的改善。提出两步法的特征选择框架,并且实现去除冗余特征的算法,在保证结果有效性的前提下大大降低了时间复杂度。  相似文献   

7.
Medical image registration is the process of finding ageometric transformation between two image-based coordi-nate systems that have the same patient-based coordinates ,i .e .the same anatomic locations .The registered multi-mo-dality images lead to impro…  相似文献   

8.
心音是心脏及心血管系统机械运动状况的反映,其中包含着心脏各个部分本身及相互之间作用的生理和病理信息。随着数字信号处理技术的迅速发展,使心脏疾病的诊断实现自动化成为可能,而采用最大熵法对心音进行时频分析,可以对非平稳信号给出一个充分的时频分析结果。  相似文献   

9.
Co-training is a semi-supervised learning method, which employs two complementary learners to label the unlabeled data for each other and to predict the test sample together. Previous studies show that redundant information can help improve the ratio of prediction accuracy between semi-supervised learning methods and supervised learning methods. However, redundant information often practically hurts the performance of learning machines. This paper investigates what redundant features have effect on the semi-supervised learning methods, e.g. co-training, and how to remove the redundant features as well as the irrelevant features. Here, FESCOT (feature selection for co-training) is proposed to improve the generalization performance of co-training with feature selection. Experimental results on artificial and real world data sets show that FESCOT helps to remove irrelevant and redundant features that hurt the performance of the co-training method.  相似文献   

10.
针对图像检索中单一特征检索的不足,提出一种结合分块颜色特征和形状特征的图像检索方法,用空间局部信息增强全局颜色特征,采用分块颜色直方图提取图像的颜色特征,利用Hu不变矩提取图像的形状特征,以分块颜色和形状作为综合特征,采用相应的相似性度量方法进行图像匹配.实验结果证明了该方法的可行性,适用于基于区域或对象的图像检索.  相似文献   

11.
Quite often in data reduction, it is more meaningful and economical to select a subset of variables instead of reducing the dimensionality of the variable space with principal components analysis. The authors present a neglected method for variable selection called the BI-method (R. P. Bhargava &; T. Ishizuka, 1981). It is a direct, simple method that uses the same criterion—trace information—used in ordinary regression analysis. The authors begin by discussing the nature and properties of the BI-method and then show how it is different from other existing variable selection methods. Because the BI-method originally was applied to small datasets that had little or no relevance to psychology or education, the authors apply it to large datasets with relevance to the psychological and educational literature. Of particular interest was the application of the BI-method to select a subset of items from a large item pool. Two practical psychometric examples with 49 and 108 items, respectively, showed that item subsets selected with the BI-method reflected the underlying structure of the whole item pool and that the scales based on those item subsets showed good reliability and predictive validity. The appropriateness of this item selection method within the context of the domain-sampling model is discussed.  相似文献   

12.
本文以近年来我国高等学校跨校选课的开展情况作为实践支撑,借助国内实践中的有关高校跨校选课的案例研究,根据研究分析结果,正确定位,找出国内高校跨校选课实施过程中存在的突出问题。通过深入分析这些高校跨校选课的问题,针对高等教育资源特点,以具有地理位置集中、学校层次相当、学科专业优势突出且互补的两所高校为研究对象,结合陕西省高等教育实际情况,提出优质特色资源校际共享及学分互认运行机制研究与实践,为高校间优质特色教育资源校际共享及学分互认提供参考建议。  相似文献   

13.
文本分类问题中,卡方特征选择是一种效果较好的特征选择方法。计算单词的卡方值时,先计算单词针对每个类别的卡方值,再通过类别概率将卡方值调和平均,作为单词相对于整个训练集合的卡方值,这种全局方法忽视了单词和类别间的相关性。针对这一问题,提出基于类别的卡方特征选择方法。基于类别的方法针对每个类别遴选特征词,特征词数量根据事先设定的阈值、类别的文档数和整个训练集合文档数计算得到,不同类别的特征空间可能包含相同的特征词。采用KNN分类方法,将基于类别的方法与全局方法进行比较,实验结果表明,基于类别的方法能够提高分类器的总体性能。  相似文献   

14.
指出最优特征子集选择问题(OFSS)是个NP-Hard问题,寻找一个近似算法具有现实意义。遗传算法提供了一种求解复杂系统优化问题的通用框架。使用基于小生境技术的遗传算法求解OFSS问题,以获得较好收敛性、稳定性和较快的速度。  相似文献   

15.
基于互信息的图像检索方法是根据图像的可视性及相似性测度对图像进行检索的方法.首先利用互信息生成一种在统计上有代表性的视觉模式,使用这种模式的分布作为图像内容的描述符;接着利用该内容的描述,设计其互信息的计算方法以衡量图像的相似性.实验结果表明,在图像检索中,相对于其他如KL散度和也规范等方法,互信息是一种更为有效的衡量相似性的方法.  相似文献   

16.
为解决单一特征选择方法的局限性问题,提出 Lasso-RF(LRF)混合特征选择方法,并应用于在线短租房源价格问题研究。基于 Airbnb 房源数据,实验首先通过 Lasso 回归进行特征选择,处理特征之间的多重共线性|然后采用随机森林算法精选剩余特征,最终得到 35 个重要特征,并带入 4 个预测模型中进行比较。结果表明,特征之间的多重共线性会影响随机森林算法对特征重要度的度量|LRF-RF 预测模型与 RF-RF 预测模型相比,评价指标 R2 和 MSE 分别提高了 0.005、0.006,同时运行时间缩短 0.267 秒,表明 LRF 混合特征选择方法优于单一的 RF 特征选择方法。  相似文献   

17.
分级教学是体现"因材施教、提高教学效果"原则的一项重要教学改革措施。本文从"语言输入假说"理论出发,分析日语公共课实行分级教学的必要性,分别从学生、教师的角度阐释了日语公共课分级教学的优越性,并详细论述了尊重学生意愿、师生双向互选、制定分级教学目标、采取科学教学方法等具体的实施方案,提出在实施过程中应注意教材选取、学生评价、教师考核等方面的问题和相应的解决对策。  相似文献   

18.
利用粗集原理完善评估指标体系的方法   总被引:2,自引:0,他引:2  
研究在建立评估指标体系的过程中,利用粗集理论检验和挑选重要指标集的方法;该方法利用熵函数和MDL原理设计出评价指标集与最后评分间因果关系的度量函数,通过分析指标子集与最后评分结果之间的关系,挑选出最有效的指标子集作为最终的评估依据。利用该方法,可以去除指标系统中的无关指标,在不降低评估精度的前提下,简化了指标体系。  相似文献   

19.
为克服基于单一特征进行医学图像检索存在的局限性,文章提出了一种新的基于投影和纹理信息融合的检索算法,分析医学图像的特点,引入颜色投影并选择综合性能较高的特征进行融合,调整各特征的权重,最后运用加权欧氏距离进行相似性度量.实验结果表明,该算法检索速度快,具有较高的查准率.  相似文献   

20.
在分析现有文本水印方法的基础上,提出一种新方案.该方案中文档看成是句子的集合.利用密钥K1,K2和特征函数返回值选择特征词汇子集和可变序的句子子集合,改变该子集合中的句子顺序来嵌入水印信息.为提高方案对水印攻击的抵御性,在多个句子中嵌入相同的水印信息.阐述了该方案的模型和句子变序算法,通过对主要句子层次上的攻击方法的分析,给出了本方案的优势.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号