共查询到20条相似文献,搜索用时 15 毫秒
1.
<正>深度学习的发展依赖于数据,尤其需要大量有标注的样本以支撑模型的训练。在很多领域,标注样本是高成本的,但与此同时存在大量而廉价的无标注数据。半监督学习能有效利用无标注数据以提升分类器的性能,符合应用场景的诉求。SGAN模型在GAN上进行拓展,使其能以端到端的模式完成半监督任务。但是该模型没有充分利用无标签和生成样本。因此本文提出一种新的方法 PSGAN,引入伪标签损 相似文献
2.
3.
针对钢板表面缺陷图像分类传统深度学习算法中需要大量标签数据的问题,提出一种基于主动学习的高效分类方法。该方法包含一个轻量级的卷积神经网络和一个基于不确定性的主动学习样本筛选策略。神经网络采用简化的convolutional base进行特征提取,然后用全局池化层替换掉传统密集连接分类器中的隐藏层来减轻过拟合。为了更好的衡量模型对未标签图像样本所属类别的不确定性,首先将未标签图像样本传入到用标签图像样本训练好的模型,得到模型对每一个未标签样本关于标签的概率分布(probability distribution over classes, PDC),然后用此模型对标签样本进行预测并得到模型对每个标签的平均PDC。将两类分布的KL-divergence值作为不确定性指标来筛选未标签图像进行人工标注。根据在NEU-CLS开源缺陷数据集上的对比实验,该方法可以通过44%的标签数据实现97%的准确率,极大降低标注成本。 相似文献
4.
遥感图像监督分类需要充足精确的标注数据训练分类器,然而数据标注需要人工参与,很多任务难以及时获得符合要求的监督信息,不利于影像分类。半监督学习是一种利用少量标注数据和大量未标注数据共同训练分类器的机器学习方法,能从机理上减少人工参与,提高效率。本文引入一种半监督方法——平方损失互信息归一化模型(squared-loss mutual information regularization,SMIR)实现遥感图像分类。实验结果表明,在小样本监督信息的条件下,SMIR能够利用标注数据与未标注数据,直接构建多类分类器,其影像分类结果优于经典的支持向量机(support vector machine,SVM)方法。 相似文献
5.
数字图像压缩技术对于数字图像信息在网络上实现快速传输和实时处理具有重要的意义。现从几个方面介绍了数字图像压缩中的小波变换及其应用。 相似文献
6.
【目的/意义】通过社交媒体用户分享的图像、博文及用户标签进行数据挖掘,来判断和预测用户的真实兴
趣,从而更好地为用户做个性化推荐和精准化服务。【方法/过程】在获取微博用户分享的图像、博文及用户标签的
基础上,通过使用机器学习的方法利用图像、博文及用户标签数据来表达用户兴趣特征,基于三类特征使用SVM训
练得到分类器进行用户兴趣类别预测,主要比较单模数据和多模数据的分类指标,探讨多模数据在有监督学习下
的发多分类问题。【结果/结论】实验结果表明,利用图像、博文和用户标签合成的多模数据对用户兴趣进行分类识
别,F值达到77%,比最好的单模数据提升10%。实验结论证实,多模(图像、博文和标签)数据与单模数据相比,提升
了分类效果,同时为多模数据应用研究提供了一定的理论和技术基础。 相似文献
7.
在信息社会中,数字化逐渐成为教学资源的主要形式。教学资源种类繁多,获取方法不胜枚举,学习者要学会根据实际需要和实际条件选择和应用最恰当的方式,不仅要能获取已有的教学资源,还要能进行简单的资源开发,同时要对获取或开发的资源进行有效地管理和最优化地利用。在数字化教学资源的日益丰富,一方面为教学提供了更有力的支持,另一方面也对教师进行教育技术的学习和应用提出了更高的要求。了解教学资源的种类和特性,掌握教学资源的获取和应用方法,是教师的重要基本功之一。为了促进学生正确健康地使用学习资源,营造良好的学习环境,更好地丰富教学资源和学习资源,就对教学资源的获取和利用上做了进一步的研究。 相似文献
8.
9.
10.
11.
进入Web2.0时代,大众分类成为其中一种主要的信息组织方式之一,而大众分类则是通过标签系统实现对网络信息资源的分类,因此标签在大众分类中占据重要地位。以豆瓣网中的"豆瓣电影"为例,分析标签检索存在的局限,并提出对应的优化方法和措施。 相似文献
12.
由于能够捕捉语言的内在规律,词向量在自然语言处理任务中得到广泛应用,通过跨语言词汇对齐能够将词向量的应用推广到跨语言情境中。文章在词汇深度表示学习的基础上通过改进生成对抗网络结构,提出一种新的词汇对齐模型(Word Alignment Model,WAM)。为验证模型的有效性,在三组跨语言语料数据集上进行对比实验。与最好的无监督方法相比,WAM模型在P@1上提升0.25%,在P@10上提升0.46%。实验结果表明,通过改进生成对抗网络,能够以无监督的方式更好地实现词汇的跨语言对齐。研究结果对完成领域知识的跨语言迁移,解决跨语言情感分析、信息检索和问答系统等跨语言信息处理任务有重要意义。 相似文献
13.
14.
许多现实应用中,由于数据流的特性,使人们难以获得全部数据的类标签。为了解决类标签不完整数据流的分类问题,本文首先分析了有标签数据集对基于聚类假设半监督分类算法分类误差的影响;然后,利用分类误差影响分析以及数据流的特点,提出一种基于聚类假设半监督数据流集成分类器算法(semi-supervised data stream ensemble classifiers under the cluster assumption,SSDSEC),并针对个体分类器的权值设定进行了探讨;最后,利用仿真实验验证本文算法的有效性。 相似文献
15.
决策支持系统是跨学科的综合体系,涉及机器学习理论。支持向量机是近几年发展起来的学习方法,它是利用最优分类面(线)将两类样本在特征空间或输入空间中无错误地分开,而且要使两类的分类空隙最大。然而当两类中的样本数量差剐悬殊时,支持向量机的分类能力会下降。为了解决此问题,本文提出了一种改选的支持向量机算法,在所开发的医学决策支持系统上的应用表明,此方法在解决两类样本数量十分不均衡问题时有着很强的分类能力,不失为一种有效的决策分析工具。 相似文献
16.
[目的/意义]针对专业领域研究人员难以从大量无监督文本数据中快速获取领域关键知识,以精准把握专业研究方向和内容。[方法/过程]文章提出一种基于迁移学习领域自适应的文本关键词提取模型。首先通过采集中国知网中特定领域的文章和关键词,将其作为目标域数据,将待提取关键词的无监督文本作为源域数据,通过最小化二者间的共享相似特征和关键词分类交叉熵,实现关键词提取方法的跨领域迁移,完成对无监督领域文本的关键词提取任务。[结果/结论]对1313篇“人工智能风险”主题的文章进行领域关键词提取,实验表明该领域关键词提取模型相比于BiLSTM-CRF、TF-IDF模型提取效果提升显著,在领域关键知识提取场景中有较强应用价值。 相似文献
17.
思政课程在国民教育中发挥着重要作用,而随着互联网应用在人们生活中应用得更加普及,在高校思政教育中实施线上+线下混合式教学模式,可以丰富学生学习方式,使其能够通过多种渠道获取更加优质的思政教学资源。《新媒体技术与应用》一书由惠世军、吴航行编著,人民邮电出版社出版。作者依据目前新媒体技术的实际应用,结合案例演示、基本原理等帮助师生由浅入深地理解新媒体应用的具体功能,同时逐步让学生从简单到深刻,学习新媒体技能的具体应用,让学生伴得到创新能力的全面发展。 相似文献
18.
由于受到大气,随机噪音,摄像机的像素等多方面的影响,获取的数字图像很模糊,为了获得更为清晰的图像,需要对图像进行重建。本文利用Lucy-Richardson算法,基于Matlab平台的仿真分析,讨论了Lucy-Richardson算法的优缺点及实际应用的可行性。 相似文献
19.
在对烟叶品质进行图像处理过程中,借助MATLAB图像处理工具箱和神经网络技术,对各种类型的烟叶的数字图像进行计算机视觉分析,包括边缘检测、轮廓提取、用图像工具箱抽取烟叶数字图像特征,将待测烟叶样本与标准烟叶样本进行自适应学习训练,最后达到自动识别待测烟叶样本的品质的智能评定,由此推进烟叶生产过程的技术创新。 相似文献