首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 125 毫秒
1.
特征选择及规则提取是数据挖掘过程中的重要环节.Rough集理论提供了一种新的属性约简即特征选择及规则提取工具,但目前Rough集理论研究主要针对单个决策表(或信息系统),分布式环境下的粗糙集理论研究还不多见.文章提出一种垂直分布环境下的特征选择及规则提取算法,算法分析结果表明,该种算法是有效可行的.  相似文献   

2.
关联规则是数据挖掘的重要内容之一.Apriori算法是关联规则挖掘的经典算法,本文对Apriori算法和改进后的FP-Growth算法进行了深入的研究,并以实际的案例进行了算法解析,通过对两种算法的比较与分析,选择FP-Growth算法应用到毕业生信息管理系统中,从大量的毕业生信息出发,找出就业信息与教育信息之间的关系,从而为决策者提供指导或数据支持,指导目前的专业建设、课程改革,促进学校的教学改革,提高人才培养质量.  相似文献   

3.
张磊 《教育技术导刊》2015,14(11):36-39
为提高特征选择算法的分类精度,使特征子集尽快达到全局最优,提出了一种基于教与学优化算法的特征选择方法。该方法首先将最大相关最小冗余的过滤式特征选择算法融入其中,然后利用教与学优化算法对特征子集进行迭代寻优,构造一个混合式特征选择框架。经UCI数据集试验,证明了该算法的收敛速度与分类精度均优于其它算法。  相似文献   

4.
研究了目前常用的网关选择算法Jelger算法,并对Jelger算法提出改进,通过仿真进行比较,结果显示改进的算法在性能上有显著提高。  相似文献   

5.
特征选择在模式识别技术中起着非常重要的作用,已有多种特征选择的方法,但用信息论的方法进行特征选择还是一个新的课题,MIFS算法和MIFS-U算法都是近似算法,随着输入特征的增加,特征选择性能逐渐下降.本文通过研究这两种算法,提出一种改进方法,在运算量几乎不增加的情况下,提高这两种算法的特征选择性能。  相似文献   

6.
特征选取的好坏在文本聚类算法中起着举足轻重的作用,为了在文本预处理阶段更好地获得文本特征,这篇论文从文本语义关系的角度入手,研究了文本语义关系的数学表达方式,研究设计了更好的特征选择的算法,以此提高文本聚类的质量.  相似文献   

7.
特征选择在机器学习中运用广泛,Boruta算法是一种常见的特征选择方法,算法思想简单、易于操作,但样本复杂度较高。针对该问题提出改进Boruta算法,在原算法阴影特征样本建造中只对部分样本打乱重排序,降低了阴影特征样本的复杂度。实验结果表明,改进的Boruta算法在混合比例约为0.4~0.6时相比原算法,提取出的特征拟合模型预测性能略有提高。使用平均减少不纯度(mean decrease impurity)和随机Lasso这两种传统方法选择同样数量的特征建立模型进行预测,发现改进的Boruta算法预测性能比上述两种方法更优,改进的Boruta算法在降低样本复杂度的同时提高了预测性能。  相似文献   

8.
针对目前国内外学者对微博情感只作二分类研究,仅仅从正面和负面研究微博情感不足的问题,选取NLPCC2013-2014年多情感的微博数据集,重点研究常用的3种机器学习算法、3种特征选择以及特征权重方法对中文微博情感多分类的影响。实验表明:不管选择哪种特征权重,使用SVM的微博文本分类准确率都最高,KNN的准确率最低;不同特征权重下,信息增益作为特征选择的方法时,3个算法各自准确率都是最高的;当信息增益为特征选择,TF-IDF为特征权重时,支持向量机的文本分类准确率最高。由于微博简短、口语化,词袋模型忽视了词与词间的联系,导致微博情感分类准确率不高。  相似文献   

9.
为解决单一特征选择方法的局限性问题,提出 Lasso-RF(LRF)混合特征选择方法,并应用于在线短租房源价格问题研究。基于 Airbnb 房源数据,实验首先通过 Lasso 回归进行特征选择,处理特征之间的多重共线性|然后采用随机森林算法精选剩余特征,最终得到 35 个重要特征,并带入 4 个预测模型中进行比较。结果表明,特征之间的多重共线性会影响随机森林算法对特征重要度的度量|LRF-RF 预测模型与 RF-RF 预测模型相比,评价指标 R2 和 MSE 分别提高了 0.005、0.006,同时运行时间缩短 0.267 秒,表明 LRF 混合特征选择方法优于单一的 RF 特征选择方法。  相似文献   

10.
支持向量机(SVM)在处理大样本特征维数较多的数据集时,算法消耗时间长而且容易陷入局部最优解,选择不合适的SVM算法参数会影响SVM模型分类性能。为了提高SVM性能,提出了基于粒子群算法(PSO)和遗传算法(GA)相结合的SVM特征选择与参数同步优化算法PGS。在UCI标准数据集上的实验表明,PGS算法能有效地找出合适的特征子集及SVM算法参数,提高收敛速度并能在较小的特征子集获得较高的分类准确率。  相似文献   

11.
Feature selection ks a process where a miniraal feature subset ks selected from an original feature set according to a certain measure. In this paper, feature relevancy ks defined by an inconsistency rate. A bidirectional automated branch and bound algorithm is presented. It is a new complete search algorithm for feature selection, which performs feature deletion and feature addition in parallel.Its bound ks determined by inconsistency rate of the original feature set, hence termed as ‘automated‘. Experimental study shows that it ks fit for feature selection.  相似文献   

12.
特征理论和原形理论是解释词的含义以及获得的两种主要理论。特征理论是20世纪70年代出现的一种理论,国外有关个体言语获得的大量研究都是在三理论框架下进行的。后来一些研究对特征理论提出了质疑,从而推动了语义获得研究。这些质疑也使特征理论的一些基本观点陷入困境。原形理论主要是针对那些与特征理论不相符合的实际事实而提出来的。为此有必要分别从实验事实与理论逻辑两个方面剖析特征理论的困境,以期为这一领域的研究提供一些启示。  相似文献   

13.
介绍了用神经网络修正传感器静态误差的原理和方法,构造了基于有监督特征映射(SLFM)网络的误差修正模型,探讨了实现该模型时网络的拓扑结构、学习和预测机制、以及参数选择,提供了其对CYJ-101型传感器进行预测修正的实验,实验结果良好。  相似文献   

14.
特征选择是避免维度诅咒的一种数据预处理技术。在多变量时间序列预测中,为了同时找到与问题相关性最大的变量及其对应时延,提出一种基于多注意力的有监督特征选择方法。该方法利用带有注意力模块和学习模块的深度学习模型,将原始二维时间序列数据正交分割成两组一维数据,分别输入两个不同维度的注意力生成模块,得到特征维度和时间维度的注意权重。两个维度的注意力权值点积叠加作为全局注意力得分进行特征选择,作用于原始数据后输入随学习模块训练不断更新至收敛。实验结果表明,所提出的方法在特征数小于10时可达到全量数据训练效果,与现有几种基线方法相比实现了最佳准确率。  相似文献   

15.
吴琳 《海外英语》2012,(6):111-113
The primary concern of this paper is to address the issue of discrepancies between teachers intuitively defined stronger and weaker student argumentative writings.There exists a problem in Chinese university EFL writing classrooms that the teachers’remarks on student compositions are often found to be rather vague or even unhelpful.Remarks such as Needs further amendment and You wrote just like the way you speak cannot supply students with explicit reasons of what is really needed for their writing improvement.Affirming the dialectal view on text-context relationship held by Systemic Functional Grammar(SFG),the theoretical propositions of Rich Feature Analysis(Barton,2004) are contended to a sound solution to the problem proposed by this paper.To demonstrate its feasibility,the paper followed the gist of Rich Feature Analysis to analyze a corpus of four argumentative writings on same topics.The paper consolidates "the spoken-written continuum"(Barton,2004,p.64),and concludes stronger argumentative writings should own at least one of the following properties: product-like,condensed,recursive,coherent,distanced,and open to scrutiny.The absence of lexical density and nominalization constitutes the main reason for writing deficiencies by tertiary students.The implications for learning the register of schooling are discussed.  相似文献   

16.
普通话水平测试(PSC)“说话”项“语音面貌”归档的正确与否,直接影响到应试人的普通话等级。测试实践证明要准确地对“语音面貌”进行归档,就必须采取定量与定性相结合的评分办法。先对应试人的“语音失误”进行分类记录,然后根据其成系统的“语音错误”和“语音缺陷”的种类,判定“方音成分”的轻重程度。这样就可以根据对量的分析,作出定性的,也比较合乎实际的判断,使“语音面貌”的归档具有科学性。  相似文献   

17.
毕节方言特色地名词具有词源多样性特色、风俗语义特色,既有方言研究的意义,也有文化研究的价值,对打造毕节旅游特色,形成特色旅游,具有不可替代的作用。毕节生态人文旅游的发展战略,需要高于旅游业的视野。毕节方言地名特色词反映独特的自然地理风貌和历史人文内容,是特色旅游的有机组成部分。  相似文献   

18.
《飞屋环游记》是皮克斯动画工作室制作的首部3D电影,曾获得2010年奥斯卡最佳动画长片奖。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号