首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 20 毫秒
1.
小区间内分类数学模型是否具有模糊收敛性是处理数学问题分类的关键。对该类数学问题进行建模,验证了小区间内数学分类问题具有可行性和模糊收敛性。通过一种相位重组近邻点收敛的小区间分类算法,分析小区间特征数据点之紧邻点的收敛价值权重,过滤少数局部最佳特征数据的干扰,促进小区间分类数据近邻点的收敛性,提高数据分类收敛速度,采用马维尔条件对小区间数据分类解集进行约束,确保小区间分类模型的不动点存在且收敛,根据马维尔不动点定理得到,不动点产生的上下边界的解集中存在极限点,采用马维尔条件对小区间内分类数学模型的模糊收敛性进行验证。仿真实验对三类实际采集数据集进行模型验证,结果说明模型具有模糊收敛性。  相似文献   

2.
针对当前大数据环境下朴素贝叶斯文本分类算法在处理文本分类时存在的数据稀疏、分类不准及效率低的问题,本文提出了一种基于MapReduce的Dirichlet朴素贝叶斯文本分类算法。算法首先根据体征词语义因素以及类内分布情况对权重进行加权调整,以此对的计算公式进行修正;引入了统计语言建模技术中的Dirichlet数据平滑方法来降低数据稀疏对分类性能的影响,并在Hadoop云计算平台采用MapReduce编程模型实现本文算法的并行化。通过测试实验对比分析可知,本文算法显著提高了传统朴素贝叶斯文本分类算法的准确率、召回率,并具有优良的可扩展性和大数据处理能力。  相似文献   

3.
高欢  那日萨  杨凡 《情报科学》2019,37(11):48-52
【目的/意义】准确挖掘消费者在线评论情感倾向,对于改善商家服务具有重要意义,而情感倾向预测的准 确性仍需提高。【方法/过程】文中设计基于集成学习的在线评论情感分类算法,即以N-gram算法分析在线评论词 语特征,结合情感词典构造文本特征,利用逻辑回归、Light GBM等机器学习方法为基础的集成学习进行训练,实现 在线评论情感分类。【结果/结论】实现了评论的情感倾向预测,在电脑评论数据集,较之于经典的SVM算法和无监 督类算法,该模型的分类衡量指标F1值分别提高了10%到30%不等。同时,在酒店、图书等不同领域的数据集上显 示,该方法的分类准确性仍具有上述效果,证明了该方法具有领域移植性。  相似文献   

4.
马建华 《科技通报》2012,28(6):67-68
主要研究了图像压缩精确度问题。针对传统的图像压缩算法精度低问题,本文提出了利用小波变换后的不同的小波系数的相关性,构造图像的特征的跨频带矢量,并对其进行分类,最后通过实验验证分析算法的有效性和具有一定的实际应用价值。  相似文献   

5.
"新浪爱问"和"百度知道"这类问答服务系统的主要任务之一是对问题进行分类,以便于组织用户产生的问题数据,并进行进一步的分析处理。问答服务系统的实际应用需求对问题分类算法在分类效果、计算复杂度以及对噪声数据敏感度等方面提出了较高的要求。基于信息检索思想,本文提出一种基于类文档排名的分类算法,并从语言模型的角度对该算法进行分析和改进。通过在一个大尺度的问题数据集合进行的一系列实验,表明本文提出的算法在问题分类任务中可以取得优于传统算法的分类效果;同时,该算法计算量较小,适用于处理大规模数据,可以很好的满足问答服务系统中对于问题分类算法的要求。  相似文献   

6.
桂思思  徐健 《情报科学》2021,39(11):90-95
【 目的/意义】针对查询意图歧义性自动识别,探讨特征有效性及采用不同分类算法识别三类查询意图歧义 性的分类准确率,以期对后续研究提供借鉴与指导。【方法/过程】首先提出了一个面向查询意图歧义性的查询表达 式分类体系;随后,构建了查询表达式特征及相关文档特征共六类;最后,分别采用决策树算法、神经网络算法及k 最邻近算法,探讨采用不同特征组合的有效性及不同分类算法的分类准确率。【结果/结论】①分类准确率较基准实 验提升比例为49.5%;②使用查询表达式特征分类优于使用相关文档特征;③决策树的分类准确率略高于其他两类 分类算法。【创新/局限】构建了一个面向查询意图歧义性的查询分类体系;完成了面向三类查询意图歧义性的分类 任务;然限于数据集获取途径,仅对200数据验证。  相似文献   

7.
黄小龙 《科技通报》2012,28(2):49-51
针对传统网络入侵算法在WLAN中的异常检测效率低,提出了一种SVM算法的WLAN入侵检测方法,首先对网络入侵的数据计算信息增益,从原始数据中选取对分类结果影响较大的特征属性,对SVM参数进行优化,最后采用优化的SVM算法对无线网络数据进行检测,得出网络入侵结果.实验结果表明,提出的算法检测正确率高、漏报率与误报率低,具有很好的应用前景.  相似文献   

8.
根据软件工程的基本原理在Ubuntu操作系统环境下使用Eclipse开发工具,设计并实现了基于Hadoop系统架构的NaiveBayes算法文本分类系统。系统将大量中文文本数据集存储在分布式文件系统HDFS上,通过MapReduce并行计算模型和Ansj中文分词库对中文数据集进行分词,采用TF-IDF算法进行文本特征抽取,最后基于Spark并行计算框架和NaiveBayes算法对特征数据集进行模型训练,得到文本分类模型,将文本分类服务集成到Web页面。系统基本实现了文本的正确分类。  相似文献   

9.
提出一种基于共轭梯度对数分解的大数据分类数学仿真模型。构建基于K-means算法的数据分类目标数据生成模型,采用共轭梯度对数分解方法对大数据集进行规范化处理,构建数据融合适应度矩阵,基于Lagrange定理,全局搜索性寻找聚类中心的最佳值求得聚类目标函数,确定边界隶属度特征的一个初始值,实现对大数据分类模型优化设计。仿真实验表明,采用该分类模型,数据分类寻优性能较好,各类数据的特征分类准确,收敛性较高。  相似文献   

10.
王浩君  周斌  潘玉良 《科技通报》2020,36(3):43-48,58
海上舰船目标分类检测技术可广泛用于海事监管、船只救援、打击非法犯罪等活动,具有重要应用价值。本文选取高分辨率光学遥感影像进行数据筛选及预处理,建立了含有2. 4万艘不同类型舰船的分类检测数据集。依据中华人民共和国海事局《船舶登记工作规程》中的舰船分类规则,结合遥感影像实际情况,建立了基于遥感影像的海上舰船分类体系。通过搭建深度学习训练平台,使用YOLOv3神经网络算法对舰船进行分类检测。在测试集上对训练完成的模型进行验证,舰船分类检测结果的召回率达到91%以上,准确率达到95%以上。在GPU加速的情况下,可达30 fps以上的检测速率,使得该模型在具备鲁棒性和准确性的同时也具备实时分类检测的能力。  相似文献   

11.
余敦一 《科技通报》2014,(4):191-193
提出一种基于改进TFIDF算法的海量文本分类识别方法,将特征之间的信息熵与特征内信息熵作为文本分类识别的加权因子,采用神经网络的非线性映射能力实现权值计算和TFIDF算法的模糊化,从而解决文本分类不准确和海量文本的分类问题。采用5个类别文档,每个类别5个文档,3个特征项来进行实际试验验证,结果表明,改进的TFIDF算法能够更好的实现文本识别分类,具有更小的方差特性,对随机文本分布具有更强的鲁棒性,收敛速度更快,具有很好的应用价值。  相似文献   

12.
针对高分遥感影像场景分类准确率低的问题,提出了一种改进的卷积神经网络模型AResNet。该模型将注意力机制引入到预置残差网络中,使用卷积注意力模块分别从通道和空间两个维度学习特征信息,增强了特征的可判别性,实现对遥感影像场景的有效分类。在此基础上,采用ImagNet预训练参数,在训练过程中,采用Adam算法不断优化参数。实验结果表明,在NWPU-RESISC45数据集上,AResNet模型分类准确率提升到了94.3%,验证了模型的有效性。  相似文献   

13.
赛斌  宋兵  谭索怡  欧朝敏  周涛  张伟  吕欣 《预测》2022,(4):24-31
使用传染病传播动力学模型预测重大新发突发传染病时,极易发生因早期统计数据与实际不符以及对传播特征的认识不足等原因而造成参数估计偏差,导致预测、分析结果不准确。本文结合新冠疫情肺炎传播特征改进SEIR模型,提出了考虑无症状感染者、自愈人群以及无效接触人群的多阶段SEIRr模型,并使用批量梯度下降算法进行参数学习,针对不同场景下的多个国家与地区的传播过程进行预测。实验结果表明,SEIRr模型拟合用数据更少,对数据质量要求更低,预测效果更好;而基于有限早期数据的多阶段模型能有效刻画新发突发传染病防控和治疗手段不断优化的过程,具有较好的拟合预测效果和通用性。  相似文献   

14.
【目的/意义】数据分类是数据挖掘研究的重要内容之一。数据分类时,由于单一分类算法分类性能的差异 性,使其不能很好地解决大部分的分类问题,探讨一种基于多类型分类器装袋技术的数据分类方法具有重要理论 意义和应用价值。【方法/过程】基于分类性能评价的准确率,使用五种不同类型的分类算法作为分类器,随机抽取 训练集后分别训练得到若干个弱分类器,然后采用自动优化加权方式,组合构建一个强的分类器。通过实验对五 种分类算法和装袋算法的分类准确率均值和标准差分别进行对比,得出各分类算法在四种数据集上分类性能的优 劣和稳定性。【结果/结论】在四个UCI数据集上的实验结果表明,与五种不同类型的分类算法相比,装袋算法不仅 在大部分数据集上都表现出很好的稳定性,而且具有更好的泛化能力。  相似文献   

15.
研究针对海量数据流的分类方法,构建分类结果评判数学模型,保证分类系统的稳定性。与静态数据相比,数据流具有动态变化性、传输高速性、高维有序性以及规模宏大性,且存在概念漂移的现象,采用传统的分类方法进行数据流分类,很难处理其中大量的不确定性信息,分类的准确率较低、耗费时间长,无法达到理想的分类效果。为此,提出基于改进决策树算法的海量数据流分类方法。针对原始数据中的冗余进行预处理,去除冗余,提高分类效率,采用改进决策树算法,建立海量数据流决策树分类模型,并依据模糊粗糙集理论构建评判数学模型,对分类结果进行评价。实验结果表明,采用改进的分类方法进行海量数据流分类,能够有效的提高分类系统的稳定性与运行效率,保证分类结果的准确性,能够满足实际的应用需求。  相似文献   

16.
针对桥梁健康监测获取海量数据却无法实时精确地监测评估桥梁结构状态的困难性,本立足数据挖掘算法理论,在Hadoop平台下运用KNN文本分类算法对桥梁结构缩尺模型加速度数据进行分类分析,采用分布式文件系统HDFS对监测数据进行存储和访问,应用Map/Reduce并行计算框架对桥梁各环境参数进行计算,并据此判断监测点属于何种工况,实现了桥梁监测海量数据的存储、访问、分类以及桥梁结构健康状况的判别,通过实验室缩尺模型工程实例验证了理论的有效性。实验结果表明,与传统的串行分类算法相比,基于Hadoop平台的并行分类算法具有较好的扩展性,并取得了基于大数据理论的桥梁监测技术研究的革新。  相似文献   

17.
[目的/意义]提出融合母评论文本信息的评论短文本情感分类模型以提高互联网环境下短文本评论情感分析效果,适应舆情工作中的实际应用需求。[方法/过程]以短视频平台舆情事件的评论数据为实验对象,利用GRU提取母评论文本特征和直接提取评论区特征,分别将这些特征与CNN提取原评论文本特征并行融合进行情感分类。[结果/结论]相较于传统深度学习方法,引入的母评论文本特征使两个数据集的情感分类效果都获得了一定提升,F1值等均分别提升了2%和1%,说明本文提出的特征引入方案能够提升评论短文本的分类效果,为舆情工作中的情感监测实际应用提供了思路,验证了舆情相关理论研究对实际技术应用有借鉴和指导意义。  相似文献   

18.
提出基于半监督混合模型的海量入侵数据检测方法。利用蚁群算法进行入侵数据的特征选择,在结合半监督的混合模型分类方法进行入侵数据的分类,利用混合模型对数据样本空间的聚类分布进行描述,利用数据函数将聚类的信息与分类算法相结合,进行数据分类时对没有标示的数据样本进行考虑,对入侵数据进行检测。克服传统方法存在的弊端,提高了分类器的泛化能力,保证数据分类的效果,提高了入侵数据检测的准确性,完成对大数据环境下网络主动入侵海量数据检测的研究。实验的结果表明,利用本文方法能有效地提高入侵数据检测的准确性。  相似文献   

19.
肖弋 《科技通报》2019,35(5):127-131
大数据时代数据安全性检查至关重要,提出一种新的特征变换算法检测异常数据用以保证数据安全。数据是否异常可以归类为二分类问题,逻辑回归算法作为常用分类算法具有很强的抗噪能力,采用卷积神经网络预产生高阶特征,高阶特征通过提取卷积神经网络各网络层神经元输出获得,高阶特征用以提升逻辑回归算法的表达能力。试验结果表明,逻辑回归算法在高阶特征上能够获得较高的分类准确率。  相似文献   

20.
针对标准分水岭算法在数字抠像图像分割的应用中还存在抠像效果不好、分割边缘不匹配等问题。本文设计了一种以自适应特征加权分水岭算法为基础的数字抠像图像分割模型,最初的时候先以梯度级特征为依据进行从低到高的浸没,并对积水盆地标记进行优化,然后为了改善浸没过程产生的过分割现象,根据像素点特征,在每层浸没完毕再浸没下一层,最后在数字抠图分割中应用改进后的自适应特征。结果表明,本文提出的基于自适应特征加权分水岭算法的数字抠像图像分割模型具有更好的效果,且分割边缘匹配性高。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号