首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 218 毫秒
1.
两阶段方法能够高效地对稀有类进行分类,第一阶段(P阶段)训练P规则预测目标类的存在性.这些P规则覆盖绝大多数的正例(目标类例子),在该阶段中尽量覆盖那些属于目标类的正例.第二阶段(N阶段)学习N规则预测目标类的不存在性,其所基于的数据集为所有P规则所覆盖的正例和反例(非目标类例子)集.N规则的目标是尽量去除由P规则所引入的反例,并尽可能地保留正例,在该阶段中尽量获得高精度.在测试阶段对所得到P规则和N规则根据一定的分值机制赋值,并根据这些规则的分值来分类.  相似文献   

2.
提出了一种分类规则的蚁群挖掘算法.算法首先对所有的连续属性值离散化,得到相应的离散属性,然后让各只蚂蚁按照某种策略选择相关属性,对所选属性再选择理想的属性值,循环地构造单个规则,接着更新训练集,最终形成各类规则集.最后用新规则约简算法进行约简操作.对两个公用数据的实验及其与Ant-Miner和C4.5的对比表明,算法能够发现更好的分类规则.实验同时表明该算法是有效的.  相似文献   

3.
分类问题的覆盖算法为处理海量数据提供了一个十分有效的方法,已被广泛应用于文本分类问题中.主要通过覆盖算法、核覆盖算法和基于概率的覆盖算法等三种不同方法进行训练和学习,并根据给出的实验结果进行比较研究.实验结果表明了经优化后的概率模型在文本分类中提高了识别率和精确度.  相似文献   

4.
中文文本分类是对中文按类别来进行分类。基于交叉覆盖算法的文本分类运用交叉覆盖算法作为分类器,能够实现对中文文本的分类。通过它和SVM(Support Vector Machine)分类器的对比实验,说明了交叉覆盖算法,相比于SVM分类器对中文文本分类效果更好。  相似文献   

5.
基于数据挖掘的医学图像分类方法研究是多媒体数据挖掘的一个重要组成部分。在分析和总结了现有各种特征提取方法的基础上,提出了基于核密度估计聚类和关联规则的医学图像分类算法和关联规则的医学图像分类器框架。该算法先用核密度估计的聚类算法实现医学图像的聚类,在聚类的结果上提取局部特征,在局部特征上用关联规则实现医学图像的分类。实验结果表明可以较好的提高医学图像分类的准确率。  相似文献   

6.
传统的文本分类算法存在:忽视训练集的相对固定特征与新文献主题不断交化之间的矛盾,类间没有层次关系从而导致分类不太准确、效率低等问题,对此设计并实现了一种增量式的半监督文本分类算法-IC-Rocchio算法,实验结果表明,该算法能有效地改进这两方面的问题.  相似文献   

7.
基于模糊分类规则树的文本分类   总被引:2,自引:0,他引:2  
针对传统的基于关联规则的文本分类方法在分类文本时需要遍历分类器中的所有规则,分类效率非常低的问题,提出一种基于模糊分类规则树(FCR-tree)的文本分类方法.分类器中的规则以树的形式存储,由于树型结构避免了重复结点的存储,节省了存储空间.模糊分类关联规则与一般分类规则相比,不仅包含了词条信息,还包含了词条出现频度对应的模糊集,所以FCR-tree的构建过程及树的结构不同于一般规则树CR-tree.为降低构建及遍历FCR-tree的难度,采用了构造多棵k-FCR-tree的方法.在搜索规则树时,如果结点中的词条没在待分类文本中出现,则不需要再搜索该结点引导的子树,大大减少了需要匹配的规则的数量.实验表明该方法是可行的,与遍历分类器的分类方法相比,分类效率有了明显提高.  相似文献   

8.
为解决传统人工图像处理方法在农村公路路面病害检测中存在的效率低、结果不客观、大量数据无法及时处理等问题,考虑农村公路路段分布特征,集成ResNet50路面分类和改进的YOLOv5裂缝检测算法,提出了一种农村水泥路面裂缝智能检测方法.利用不同训练策略、不同网络深度进行对比,构建了基于ResNet50的路面高效分类模型,实现农村公路水泥和沥青路面的自动判别.创建了包含18 028张农村公路水泥路面裂缝图片的检测数据集,开展单阶段和两阶段目标检测算法对比试验研究,获得兼顾检测精度和效率的优选检测算法.在优选算法中融入自适应空间特征融合策略和优化回归损失函数,有效解决了图像中多尺度裂缝漏检问题,并进一步提高了整体检测精度.应用所提集成方法对农村公路水泥路面进行现场实测,结果表明路面类型分类准确率为98.4%,裂缝检测准确率为93.0%,表明所提方法能够准确高效地运用于农村公路水泥路面裂缝检测.  相似文献   

9.
为减少不均衡数据对支持向量机分类性能的影响,提出一种基于二次支持向量机的欠取样分类算法,该算法依据样本的分类超平面贡献大小对多数类样本进行欠取样.并对少数类样本进行过取样,重构训练数据集。该算法能够删除样本中的噪声数据。用控制参数控制删除样本的规模,实验表明,该算法能够提高支持向量机在不均衡数据集下的分类性能。  相似文献   

10.
基于迁移学习的遥感影像树种类型分类   总被引:1,自引:0,他引:1  
提出了基于迁移学习思想的卷积神经网络遥感影像树种类型分类算法。采用ImageNet上训练的Inception-v3模型对树种影像特征进行提取,使用AID标准数据集和自行采集的东北林业大学实验林场数据集训练一个新的全连接层和Softmax层,更改输出层的节点数量;引入Dropout函数改善过拟合现象;通过反向传播优化模型。实验结果显示,模型在两种数据集上总体分类精度分别达到了98. 8%和97. 2%,Kappa系数分别为0. 987和0. 984,表明实验算法不仅降低了卷积神经网络的参数数量,还提高了目标分类识别的准确性。与传统方法相比,实验算法无需进行复杂的预处理技术即可实现树种的自动特征提取,同时解决了只有依赖大规模样本才可达到较高分类精度问题,在树种类型分类上具有很高的应用价值。  相似文献   

11.
农业短文本中包含词数较少,导致语义获取不充分和分类效果下降。利用 Attention 机制加强关键词在分类时的权重,并结合 BiLSTM 设计 LSTM-Attention 模型。对 30 000 份原始数据经过中文分词、句法分析、文本向量化后,将 LSTM-Attention 模型训练成一个 LSTM-Attention 分类器,解决分类器对待分类文本数据敏感的问题。利用 30 000 份标准数据和加 30%干扰信息的复杂数据测试分类器分类效果,结果表明,LSTM-Attention 模型分类正确率达 98.59%,比传统 LSTM 模型高 3.72%,比 BiLSTM 模型高 1.61%,说明使用 BiLSTM 结 合 Attention 机制能够有效提升农业短文本分类效果。利用不同测试数据对 LSTM-Attention 分类器测试发现,LSTM-Attention 分类器具有良好收敛性,其分类效果不依赖于分类数据特征,分类效果稳定性佳。  相似文献   

12.
The classification of thematic mapper imagery in areas with strong topographic variations has proven problematic in the past using a single classifier, due to the changing sun illumination geometry. This often results in the phenomena of identical object with dissimilar spectrum and different objects with similar spectrum. In this paper, an integrated classification method that combines a decision tree with slope data, tasseled cap transformation indices and maximum likelihood classifier is introduced, to find an optimal classification method for thematic mapper imagery of plain and highland terrains. A Landsat 7 ETM+ image acquired over Hangzhou Bay, in eastern China was used to test the method. The results indicate that the performance of the integrated classifier is acceptably good in comparison with that of the existing most widely used maximum likelihood classifier. The integrated classifier depends on hypsography (variation in topography) and the characteristics of ground truth objects (plant and soil). It can greatly reduce the influence of the homogeneous spectrum caused by topographic variation. This integrated classifier might potentially be one of the most accurate classifiers and valuable tool for land cover and land use mapping of plain and highland terrains.  相似文献   

13.
INTRODUCTION Support Vector Machine (SVM) is a relativelynew soft computing method based on statisticallearning theory presented by Vapnik (1995). In SVM,original input space is mapped into a high dimen-sional dot product space called feature space in whichthe optimal hyperplane is determined to maximize thegeneralization ability of the classifier. The optimalhyperplane is found by exploiting a branch ofmathematics, called optimization theory, and re-specting the insights provided by …  相似文献   

14.
对线性回归分类算法进行了改进。考虑了线性回归分类算法中没有考虑的类间信息,通过选择类模式的投影方向判别不同类的模式,不同类的模式互相远离,相同类的模式尽可能靠近来估计投影矩阵;再利用投影矩阵将训练图像及测试图像投影到各类的特征子空间;最后,计算出测试图像与训练图像间的距离,利用K-近邻分类器完成人脸的识别。在FERET人脸数据库上进行实验验证。实验结果表明,相比其他回归分类算法,本算法取得了更好的识别效果。  相似文献   

15.
科技文献的分类是科技文献数据库的重要组成部分,设计好的科技文献分类器是建立科技文献数字图书馆的重要任务之一.传统的文献分类法几乎都是基于文本的,这样会使一部分处于类边缘的文献不能准确地分类,事实上科技文献是一种半结构化的文献,它们包含的很多结构信息可以用到文献的分类中.本文利用科技文献的邻居文献所属的类这一信息结合科技文献的文本提出了一种协调的科技文献分类方法,并取得了较好的结果.  相似文献   

16.
传统的支持向量机分类算法在优化过程中对所有支持向量都进行优化,增加了计算量,降低了训练效率.针对上述缺点,在分析样本模糊隶属关系的基础上,采用改进的K近邻算法为已知样本分配隶属度,根据训练样本的隶属关系,剔除非支持向量,减少训练样本,并将其用于中文网页的分类中,得到了较好的分类效果.仿真实验结果表明,改进后的方法不仅相对简单,而且在保证分类器性能的情况下,能有效地减少支持向量机的训练样本数,从而提高支持向量机的训练和测试速度.  相似文献   

17.
INTRODUCTION The popularity of digital images is rapidly in- creasing due to improving digital imaging technolo- gies, and convenient availability facilitated by the Internet. Organizing these images into categories and providing effective indexing is imperative for real- time browsing and retrieval. Typically, existing im- age classification work such as that of Vailaya et al.(2001) follows the paradigm of content-based im- age retrieval (CBIR) technologies, i.e., representing images u…  相似文献   

18.
为了提升不平衡数据中少数类的分类精度,利用SMOTE采样方法对数据集进行平衡化预处理;为了减轻样本重新合成过程中产生的类重叠和噪声对分类精度的影响,选择模糊粗糙最近邻算法(FRNN)作为分类器。在14个不平衡数据集上进行的仿真实验表明,该方法具有较好的分类表现,F值和G值最高分别可达0.965、0.932,是一种适用于不平衡率偏高数据集的分类方法。  相似文献   

19.
最临近支持向量机Proximal SVM(PSVM)是一种有效的、简单的和快速的近似支持向量机方法,识别效果和标准支持向量机相当,相比之下有较少处理时间.虽然有此优点,它的有效性仅仅是针对维数不高、大样本的数据集,而对于上千维甚至上万维的、小样本的人脸数据库情况没有人给出实验结果.文章把PSVM稍做改变,对四个公开的人脸库进行分类.同时采用几种典型的泛化线性鉴别分析(GLDA)方法,对人脸图像预处理.从识别率和所用的处理时间两方面以及用最近邻及最近特征线分类器进行对比,得出具有较好识别效果和处理时间的方法.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号