首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 125 毫秒
1.
《宜宾学院学报》2017,(12):61-65
提出一种基于KNN算法进行主题分类的方法,研究了主题网络爬虫的系统结构和所涉及的关键技术,包括URL管理器、页面下载器、页面解析器、主题识别模块以及内容存储模块,重点介绍了基于KNN的分类器的主题相关度算法.使用IKAnalyzer实现网页内容的中文分词,通过TF-IDF算法实现网页内容的特征提取,并利用KNN分类器计算网页的主题相关度.  相似文献   

2.
针对垃圾邮件大量存在的问题,提出基于MapReduce并行SVM的垃圾邮件分类算法,用支持向量机作为分类器,基于MapReduce将各子分类器进行合并,并通过重训练得到模型,利用该模型对测试集进行分类,得到结果。为解决算法精度损失、准确率低等问题,引入KNN,在原算法基础上进行循环迭代。  相似文献   

3.
针对传统KNN算法计算量大、识别率低的问题,提出一种加权K最近邻法(KNN)结合随机森林(RF)的表情识别方法。首先通过监督下降方法(SDM)提取人脸特征点,然后计算样本间的平均距离,并借此划分测试样本,结合加权KNN与随机森林的特点,对不同样本采用不同的分类器,最后采用JAFFE表情数据库进行实验。结果表明,改进后的方法不仅识别率更高,而且简化了计算复杂度。  相似文献   

4.
中文专利文献自动分类   总被引:1,自引:0,他引:1  
采用KNN算法实现了一种中文专利文献自动分类系统。针对专利文献数据规模过大,分类效率低下的问题,采用修剪样本技术删除冗余样本,提高了分类器的效率。为解决修剪样本导致干扰文献积累对KNN分类性能下降的影响,系统使用信息增益对专利文献进行特征词选择,削弱了干扰文献对KNN分类的作用。实验证明,采用修剪样本技术和基于信息增益的特征词选择能有效缩小训练集规模,提高KNN分类准确率。  相似文献   

5.
针对背包、外套等干扰因素致使步态识别率降低的问题,提出一种分割加权的步态识别方法。首先通过帧差法与阈值分割相结合的方法得到动态信息更加丰富的帧差阈值能量图(FTDEI),将该能量图分割为3部分,并对每部分添加相应权重,然后利用Gabor小波对分割加权后的FTDEI进行不同角度的特征提取,得到加权的滤波特征(SWA-Gabor),最后通过KNN分类器对SWA-Gabor特征进行分类和识别。基于分割加权的步态识别方法能够很好地避免背包等干扰因素的影响。为了验证该算法的识别效果,在中国科学院自动化研究所CASIA B步态数据库上进行实验,结果表明,在携带背包和外套的情况下,该算法的识别率较其它算法提高了约5%,取得了很好的识别效果。  相似文献   

6.
文本自动分类技术是自然语言处理的一个重要的应用领域,是替代传统的繁杂人工分类方法的有效手段和必然趋势.本文简要介绍了文本分类的特征提取算法,并通过实验比较了各种提取算法在KNN中的性能.实验表明IG、MI、CE、χ2、WE五种特征提取方法在KNN分类器中性能接近,互信息(MI)特征提取方法随着特征数的提高分类性能提高地较快,当特征数目较小的时候分类性能极差.  相似文献   

7.
KNN算法是文本分类技术中比较常用的算法。但是,当训练集容量较大时,KNN算法分类的效率大大降低。在对中文短信文本的分类时,结合中文短信文本的特点,给出了先由LAS算法进行降维,然后利用KNN算法进行分类的算法。实验结果表明,该算法提高了中文短信文本的分类质量和分类速度。  相似文献   

8.
针对Android平台下恶意软件侵扰问题,提出一种基于权限—敏感API特征的加权朴素贝叶斯分类算法的检测方案。首先对Android应用程序中的配置文件进行解析,然后利用Apktool工具对APK文件进行反编译,提取出权限—敏感API特征集,并通过信息增益算法和卡方检验算法过滤冗余数据,最后利用加权朴素贝叶斯分类算法的恶意软件检测模型进行分类判断。实验结果证明,该系统能有效提高分类器的效率和恶意软件的检测率。  相似文献   

9.
为解决不同光照条件下皮肤难以检测的问题,提出一种基于代价敏感性CS-AdaBoost算法的皮肤分类器。通过对皮肤像素提取6个基于亮度值的像素特征,并循环选取特征,使用基于CS-AdaBoost算法程序训练最佳弱分类器,通过对所有最佳弱分类器的加权线性组合得到最终的皮肤分类器。由于在算法程序中引入了代价因子θ,使分类结果偏向总错分代价较小,即提高了皮肤样本的分类正确率。使用SDD皮肤数据库评估该皮肤分类器性能,结果表明,该皮肤分类器分类正确率达到了85%,比传统皮肤分类方法提高了5%。  相似文献   

10.
机载LIDA点云数据中的回光强度信息可对地物进行精细分类。KNN算法和BP神经网络算法是目前比较热门的分类算法,在数据分类方面应用广泛,对这两种算法进行了分类比较研究。将回光强度信息作为训练样本,利用两种不同的方法进行分类。实验结果表明,BP神经网络在地物的精细分类以及边界线提取方面要优于KNN算法。  相似文献   

11.
应用K-最邻近方法数据挖掘技术,研究数据挖掘技术在就业预测中的应用。同时,针对传统的K-最邻近方法的几个不足之处提出了相应的改进办法,主要包括特征属性的加权处理及K值选择问题的解决。最后,通过实验结果对传统的KNN算法与改进的KNN算法进行比较,以验证改进的KNN算法的有效性。  相似文献   

12.
提出了一种基于多属性分类的KNN改进算法,可有效提高传统的欧几里德KNN算法和基于信息熵的KNN改进算法的分类准确度。首先,按照单个属性不同属性值的个数占整个属性包含样本的比例进行属性的分类,分为基于信息熵的KNN算法处理的离散属性和基于传统欧几里德KNN相似度处理的连续属性两类,然后分别对不同属性进行区别处理;其次,将两类不同处理后得到的结果按比例求和作为样本之间的距离;最后,选取与待测样本的距离最小的k个样本判断测试样本的决策属性类别。  相似文献   

13.
曾果 《铜仁学院学报》2008,10(5):118-119
本文通过时K近邻算法进行研究,在其基础上提出了一种基于K近邻的邮件过滤模型.该模型通过利用已知垃圾邮件的分类结果,应用K近邻方法对未知邮件样本进行精确匹配,以排除合法邮件的误判结果,同时,结合用户对所接收邮件的处理,将系统不能正确划分的新垃圾邮件加入训练数据中,以提高类似于该邮件的后续垃圾邮件的处理效率。  相似文献   

14.
A motion information analysis system based on the acceleration data is proposed in this paper,consisting of filtering,feature extraction and classification.The Kalman filter is adopted to eliminate the noise.With the time-domain and frequency-domain analysis,acceleration features like the amplitude,the period and the acceleration region values are obtained.Furthermore,the accuracy of the motion classification is improved by using the k-nearest neighbor (KNN) algorithm.  相似文献   

15.
针对传统信用评价方法分类精度较低、数据集属性变量间存在相关性等问题,提出基于主成分分析的稀疏贝叶斯学习(PCA-SBL)算法。首先对数据集特征变量进行主成分分析,使降维后的变量无相关性|其次,对主成分分析后的数据进行稀疏贝叶斯分类|最后将 PCA-SBL 分类方法分类精度与传统分类方法精度进行比较。分析发现,在 German Credit Data 和 Australian Credit Data 上,与传统 KNN、朴素贝叶斯、SVM、随机森林、决策树相比,改进的 SBL 算法分类精度平均提高了 5.26%、4.65%、2.11%、2.125%、4.66%,与稀疏贝叶斯学习算法(SBL)相比,平均提高 0.965%,从而证明 PCA-SBL 算法具有更高的分类效果。  相似文献   

16.
提出了一种基于小波变换和离散余弦变换(Discrete Cosine Transform DCT)的人脸识别方法,它通过对经过小波变换的人脸图像的低频图像进行DCT变换,从而获得原始图像的频谱图像,然后利用最近邻法进行分类,在ORL人脸数据库上的实验表明这样的方法能够获得比传统主成分分析(Principal Components Analysis PCA)更好的识别性.  相似文献   

17.
为了能对金线莲品系进行方便准确地识别,提出基于PCA ̄KNN 的金线莲叶片识别方法。通过图像预处理,获得特征较为明显的叶片区域,再提取纹理和颜色特征,进行特征融合,然后采用PCA降低特征维度,提高识别精度,最后通过训练KNN 分类器完成分类。以3 个品系的金线莲为例进行鉴别试验,结果表明,提出的识别方法与其它方法相比,正确识别率更高,达到98.4%,能准确识别不同种类的金线莲。  相似文献   

18.
传统图像特征提取具有较高维度缺陷,造成算法分类效率低、复杂度高、分类速度慢、计算开销大等问题.为此提出AAM算法,定位关键点提取人脸表情几何特征.将朴素贝叶斯分类器结合特征属性重要度调节高斯核函数,使用K近邻算法实现分类决策,提出一种WNBC-KNN分类方法,从降低数据维度和分类算法两方面优化人脸表情分类.在CK+数据...  相似文献   

19.
随着信息技术的快速发展,mCSCL已成为教育技术学领域新的研究热点,学习伙伴选择合理与否将直接影响着协作学习效率.文章利用mCSCL环境下协作分组伙伴模型,提出了基于KNN的mCSCL学习伙伴分组理论,通过计算学习者之间的相似度和类别权重,提供一张可视化的学习伙伴关系图,导学者遵循组间同质和组内异质分组原则,为学习者动态推荐最佳学习伙伴;并设计了以小学一年级加减运算为内容的mCSCL活动,开展分组满意度访谈和小组学习效率实证研究.实验结果表明,相对于随机分组方式,基于KNN算法的mCSCL学习伙伴分组方式更适合移动学习活动开展,学习效率更高.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号