首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 140 毫秒
1.
为了提高KNN检索策略的检索效率和检索结果的质量,提出一种改进的KNN检索策略。在引入图书馆领域本体和概念语义相似度度量技术的前提下,利用句法结构筛选不合理的案例以降低计算规模,从而提高案例的检索质量和效率,利用改进的微粒群算法优化概念语义相似度度量技术中的组合参数以提高KNN检索的结果质量。实验数据采用福州晓锋科技信息咨询有限公司提供的图书馆参考咨询测试数据。实验结果表明,相比于传统KNN和基于传统PSO的改进KNN方案有效地提高了案例匹配结果的查全率和查准率。  相似文献   

2.
提出了一种基于多属性分类的KNN改进算法,可有效提高传统的欧几里德KNN算法和基于信息熵的KNN改进算法的分类准确度。首先,按照单个属性不同属性值的个数占整个属性包含样本的比例进行属性的分类,分为基于信息熵的KNN算法处理的离散属性和基于传统欧几里德KNN相似度处理的连续属性两类,然后分别对不同属性进行区别处理;其次,将两类不同处理后得到的结果按比例求和作为样本之间的距离;最后,选取与待测样本的距离最小的k个样本判断测试样本的决策属性类别。  相似文献   

3.
针对传统KNN(k-NearestNeighbor)算法表示变量相关性不够精确的问题,提出了改进算法,即用灰色关联度去替代算法中的传统距离公式,得到近邻数值,然后将KNN算法思想与DBSCAN算法思想进行结合,排除异常值(噪声点的干扰)。多次实验结果显示,改进算法的均方误差和均方根误差值比传统方法小,证实了该改进算法的有效性。  相似文献   

4.
文本自动分类技术是自然语言处理的一个重要的应用领域,是替代传统的繁杂人工分类方法的有效手段和必然趋势.本文简要介绍了文本分类的特征提取算法,并通过实验比较了各种提取算法在KNN中的性能.实验表明IG、MI、CE、χ2、WE五种特征提取方法在KNN分类器中性能接近,互信息(MI)特征提取方法随着特征数的提高分类性能提高地较快,当特征数目较小的时候分类性能极差.  相似文献   

5.
民航信息系统日志包含大量信息,但由于日志数据非结构化,不易被读取且数据量巨大,难以通过人工分析得出有价值信息。Hadoop分布式计算技术恰好可以很好地解决这个问题。设计了基于Hadoop的民航日志分析系统,系统结合数据挖掘领域经典的KNN分类算法,对算法进行了并行化改进,给出算法在Hadoop平台的MapReduce编程模型上的执行流程。对系统进行单机和集群测试,集群系统在处理较大规模数据时更高效。实验结果证明,系统具有较高的执行效率和可扩展性,对民航日志分析具有较高的实用价值。  相似文献   

6.
KNN算法是文本分类技术中比较常用的算法。但是,当训练集容量较大时,KNN算法分类的效率大大降低。在对中文短信文本的分类时,结合中文短信文本的特点,给出了先由LAS算法进行降维,然后利用KNN算法进行分类的算法。实验结果表明,该算法提高了中文短信文本的分类质量和分类速度。  相似文献   

7.
将前期工作进行了改进并将训练集各簇中语义相似度大的文档进行合并,减少了训练集容量,实验表明该算法大大提高了KNN算法的效率。  相似文献   

8.
机载LIDA点云数据中的回光强度信息可对地物进行精细分类。KNN算法和BP神经网络算法是目前比较热门的分类算法,在数据分类方面应用广泛,对这两种算法进行了分类比较研究。将回光强度信息作为训练样本,利用两种不同的方法进行分类。实验结果表明,BP神经网络在地物的精细分类以及边界线提取方面要优于KNN算法。  相似文献   

9.
针对特定领域的智能答疑系统中问句分类,利用加权LSA计算问句之间的语义相似度和KNN算法构造分类器进行问句分类,并对KNN分类算法及改进的KNN分类算法进行实验比较。结果表明加权的KNN分类器分类效果最好,达到了90.8%的精确率。  相似文献   

10.
在介绍SVM和KNN分类算法的基础上,提出了一种新的、较简单的,但更为合理的基于表模型的文档表示方法,阐述了一种基于表模型的分类算法——TableKNN算法。通过实验比较TableKNN算法与传统KNN算法应用于文本分类的效果,证实了TableKNN算法在处理文本分类问题上的优越性。  相似文献   

11.
A motion information analysis system based on the acceleration data is proposed in this paper,consisting of filtering,feature extraction and classification.The Kalman filter is adopted to eliminate the noise.With the time-domain and frequency-domain analysis,acceleration features like the amplitude,the period and the acceleration region values are obtained.Furthermore,the accuracy of the motion classification is improved by using the k-nearest neighbor (KNN) algorithm.  相似文献   

12.
针对教学网页这一特定领域,提出一个基于K近邻算法的教学网页自动分类模型。该模型采用向量空间模型对教学网页的特征进行量化,并采用基于K近邻的分类方法对新的网页进行自动归类。最后通过实验数据说明该算法在教学网页的分类中是有效。  相似文献   

13.
为了对现有小型汽车号牌识别系统进行优化,改善车牌字符识别系统性能,借助 OpenCV 图像处理开源库,在车牌图像预处理阶段采用均值滤波方法提高图像质量,采用 Sobel 边缘检测算子对图像边缘进行提取,利用交替的膨胀、腐蚀操作结合车牌长宽比实现车牌轮廓定位,并根据列像素值对车牌字符进行切割,最后采用改进的 K 近邻算法对分割后的单个车牌字符进行识别。实验结果表明,基于改进 K 近邻算法的车牌识别系统处理时间为 2.08s,识别正确率达 91.3%。与传统的 K 近邻算法相比有着更高的识别率,与神经网络法相比,有着更快的识别速度。  相似文献   

14.
1 Introduction The 5-hydroxytryptamine type 3 (5-HT3) receptorantagonists[1-2]are currently used in the treatment ofchemotherapy and radiotherapy induced emesis . Thecompounds are based onthe parent structure showninFig.1 ,the aromatic systems include mono- and bicy-clic rings ,with or without heteroatoms ,and with vari-ous substitution patterns .This range of structural vari-ation makes it difficult to treat the analysis of thesecompounds .Fig .1 Parent structure of 5-HT3antagonists With t…  相似文献   

15.
In this work, support vector classification (SVC) algorithm was used to build structure-activity relationship (SAR) model of the 5-hydroxytryptamine type 3 (5-HT3 ) receptor antagonists with 26 compounds. In a benchmark test, SVC was compared with several techniques of machine learning currently used in the field. The prediction performance of the model was discussed on the basis of the leave-one-out cross-validation. The results show that the accuracy of prediction of SVC model was higher than those of back propagation artificial neural network (BP ANN), K-nearest neighbor (KNN) and Fisher methods.  相似文献   

16.
曾果 《铜仁学院学报》2008,10(5):118-119
本文通过时K近邻算法进行研究,在其基础上提出了一种基于K近邻的邮件过滤模型.该模型通过利用已知垃圾邮件的分类结果,应用K近邻方法对未知邮件样本进行精确匹配,以排除合法邮件的误判结果,同时,结合用户对所接收邮件的处理,将系统不能正确划分的新垃圾邮件加入训练数据中,以提高类似于该邮件的后续垃圾邮件的处理效率。  相似文献   

17.
基于集团法和自组织神经网络的容差电路故障诊断   总被引:1,自引:0,他引:1  
提出了一种基于集团法和自组织神经网络的容差电路故障诊断方法。按照给定的撕裂原则将大规模电子电路撕裂成子电路后,运用集团法诊断出含有故障的子电路,并将它们的测量数据输入到自组织神经网络,神经网络的输出就是故障元件。文章详述了故障诊断的原理和步骤,并引实例结果论证其诊断方法。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号