首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
针对传统KNN算法计算量大、识别率低的问题,提出一种加权K最近邻法(KNN)结合随机森林(RF)的表情识别方法。首先通过监督下降方法(SDM)提取人脸特征点,然后计算样本间的平均距离,并借此划分测试样本,结合加权KNN与随机森林的特点,对不同样本采用不同的分类器,最后采用JAFFE表情数据库进行实验。结果表明,改进后的方法不仅识别率更高,而且简化了计算复杂度。  相似文献   

2.
文字和符号的识别是当今人工智能与模式识别的一个重要研究方向。当前的识别技术主要问题之一是识别的速度不够高。本文采用雷达信号处理中的Krylov子空间方法FDR来识别文字和符号。该方法无需生成协方差矩阵的估计,也无需对样本协方差矩阵求逆,在保证识别正确率不变的情况下使算法的识别速度得到加快。本文用实测数据验证了该方法性能的有效性。  相似文献   

3.
基于决策树的学习算法   总被引:9,自引:0,他引:9  
介绍了两种主要的决策树学习算法———ID3和CN4.5。他们是Quinlan在Hunt的概念学习系统CLS(ConceptLearningSystem)上发展起来的一种自顶向下的学习算法。通过分析它们的基本原理(ID3及CN4.5)以及主要特点,提出了这两种算法的缺陷以及改进的方法。同时介绍了利用遗传算法来构造决策树的基本方法以及它的优缺点  相似文献   

4.
5.
为了改善传统ID3算法在分类属性选择上存在多值偏向性的不足,提出基于PCA的决策树优化算法。在普通基于PCA 的决策树改进算法中,存在数据经降维处理后代表性不强的问题,导致算法需经过多次数据运行后,准确率才能小幅提升。在ID3算法基础上,在分类前两次提取属性特征值,并计算了需要分类的数据量,也即对原始数据进行最重要的属性选择。在子树建立之后,再进行数据的降维合并选择。采用UCI数据库中的3个数据集对改进算法进行验证,结果表明改进算法的平均准确率达到94.6%,相比传统ID3算法与普通PCA决策树优化算法分别提升了1.6%和0.6%。因此,基于PCA的决策树算法能在一定程度上提升结果准确率,具备一定的应用价值。  相似文献   

6.
银行卡在给银行创造了高额利润的同时,也带来了很大的信用风险.对于银行来说,严格把控信用申请者,对其进行有效的信用评分和预测十分关键.采用数据挖掘技术中的决策树算法能有效屏蔽银行信用评估中的主观因素,通过海量数据预处理、决策树生成等步骤,最后通过相关算法实现能客观地形成预测值,从而准确地进行信用评分.  相似文献   

7.
分类算法是数据挖掘中的一种重要技术,决策树学习是其中常用的一种方法。结合实例阐述了决策树基本算法的形成过程,分析总结了决策树算法在实际中的应用及其存在的缺陷。  相似文献   

8.
在社交网络中进行意见领袖的识别对信息传播分析、舆情监测、网络营销等有着重要意义。目前,很多挖掘意见领袖的研究仅基于简单的粉丝关注或转发方式,而忽视了用户关系中的权重因素,不符合信息传播的实际情况。因此,提出加权网络下基于微博转发关系的FW-Rank(Forwarding Weight Rank)算法。该算法使用新浪微博数据进行实验,相比于通过简单关注关系形成社交网络的方式,FW-Rank算法的最终结果更加合理准确。  相似文献   

9.
《宜宾学院学报》2017,(12):61-65
提出一种基于KNN算法进行主题分类的方法,研究了主题网络爬虫的系统结构和所涉及的关键技术,包括URL管理器、页面下载器、页面解析器、主题识别模块以及内容存储模块,重点介绍了基于KNN的分类器的主题相关度算法.使用IKAnalyzer实现网页内容的中文分词,通过TF-IDF算法实现网页内容的特征提取,并利用KNN分类器计算网页的主题相关度.  相似文献   

10.
提出了一种基于多属性分类的KNN改进算法,可有效提高传统的欧几里德KNN算法和基于信息熵的KNN改进算法的分类准确度。首先,按照单个属性不同属性值的个数占整个属性包含样本的比例进行属性的分类,分为基于信息熵的KNN算法处理的离散属性和基于传统欧几里德KNN相似度处理的连续属性两类,然后分别对不同属性进行区别处理;其次,将两类不同处理后得到的结果按比例求和作为样本之间的距离;最后,选取与待测样本的距离最小的k个样本判断测试样本的决策属性类别。  相似文献   

11.
介绍了数据挖掘技术的概况,对数据挖掘中的核心算法—决策树算法的原理进行了研究,特别说明了决策树属性的选择,给出了一个实例。  相似文献   

12.
分类技术中的决策树算法分析   总被引:6,自引:0,他引:6  
介绍了解决分类问题的常用方法——决策树。并对决策树的原理及Quinlan的ID3、C4.5两种主要的决策树算法进行了分析。通过分析它们的基本原理以及主要特点,提出了对决策树算法改进的展望。  相似文献   

13.
应用数据挖掘中的K-means算法对学生成绩数据表进行分类,得到成绩的定性评价,并对分类后的结果使用ID3算法建立决策树分析,得到影响成绩的关键因素是上课出勤次数,其他各种因素对成绩的影响相对较小。通过数据挖掘可将藏匿于海量数据中的有用信息挖掘出来,将其应用于成绩影响因素分析,能够促进学校教学工作的进一步提升。  相似文献   

14.
对基于中文的Web文本分类技术进行了研究,介绍了web文本分类的基本过程和Web文本预处理及文本特征选取的方法,重点介绍了一种常用的基于内容的分类算法KNN。最后通过实验测试了使用KNN算法的中文Web文本分类技术的效果。  相似文献   

15.
针对高校教学评价系统中评教数据信息量大且复杂的问题,提出用决策树方法中的C4.5算法进行数据挖掘.构建教学评价系统。该系统利用决策树挖掘算法挖掘影响教学质量的关键因素,从而提取有用信息,更好地为管理者的决策分析提供科学依据。  相似文献   

16.
决策树是典型的归纳学习和数据挖掘方法,通过对数据库中获取的数据项属性值进行划分归类,最终形成类似于流程图的树型结构形式。ID3算法是决策树中的核心算法,针对ID3算法倾向于取值较多的属性的缺点,通过引入泰勒公式与麦克劳林公式,对传统算法进行降维,减小算法的计算复杂度,提高算法运行效率,使决策树的生成时间缩短,算法的效率得到了较大的提高。  相似文献   

17.
对海量数据的处理能力是数据挖掘最关注的问题。决策树作为一种分类器,是数据挖掘中用到的一种基本方法之一。基于C4.5的决策树改进算法,是在一些典型的决策树分类算法的基础上提出的,基本思想是在建树过程中,用属性依赖度替代信息增益率来确定划分条件属性的顺序。该算法借鉴MedGen算法的阈值设定方法,在简化决策树剪枝和优化过程的同时,可优化C4.5算法中使用信息熵率的时间复杂度,避免了使用信息熵带来的不当划分。简述了该改进算法的执行过程,证明了算法的正确性。  相似文献   

18.
阐述数据挖掘的分类及目的,总结分类器的构造方法,讲述分类中决策树的构建和修剪.  相似文献   

19.
决策树是一种重要的分类方法.本文分析了单变量决策树和多变量决策树的不足,提出一种基于核属性的决策树构造算法,该算法根据核属性存在的不同情况,选择结点的分裂属性.所创建的决策树规模适中,导出的规则简洁、支持度高.实验结果分析表明,该方法是有效的。  相似文献   

20.
随着信息技术的快速发展,mCSCL已成为教育技术学领域新的研究热点,学习伙伴选择合理与否将直接影响着协作学习效率.文章利用mCSCL环境下协作分组伙伴模型,提出了基于KNN的mCSCL学习伙伴分组理论,通过计算学习者之间的相似度和类别权重,提供一张可视化的学习伙伴关系图,导学者遵循组间同质和组内异质分组原则,为学习者动态推荐最佳学习伙伴;并设计了以小学一年级加减运算为内容的mCSCL活动,开展分组满意度访谈和小组学习效率实证研究.实验结果表明,相对于随机分组方式,基于KNN算法的mCSCL学习伙伴分组方式更适合移动学习活动开展,学习效率更高.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号