首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
针对面部表情识别算法存在模型结构复杂、训练参数过多等问题,在对卷积神经网络各层分析的基础上,将迁移学习算法融入到面部表情识别模型中,从而对面部表情进行识别和分类.该文提出的算法首先通过数据增强的方法扩充面部表情图片的数量,然后将VGG16模型在ImageNet图像数据集上训练得到的权重参数,通过参数微调的方法,传递到面部表情识别模型中.最后采用全局平均池化层代替传统的全连接层,对表情图片通道信息进行求和运算实现降维,减少模型的网络参数.实验结果表明:提出的模型在KDEF数据集中取得了优异的识别效果,平均测试准确率达到96.23%.  相似文献   

2.
随着科技的迅速发展,人机交互越来越受到人们的重视,语音情感识别更是学术界研究的热点。将BP神经网络算法用于语音情感识别研究,并在汉语情感数据集上进行了相关实验,识别的准确率达到了91.5%,相较于SVM算法分类精度提高了5%。  相似文献   

3.
为了有效识别自发、非典型及未分割语音的情感以建立更自然的人机交互界面,提出了一种新的结合情感数据场和蚁群策略的语音情感识别算法.用情感数据场中势函数建立基于块的声学特征向量之间的内在联系.为识别自发语音情感,用人工蚁群模拟基于块的声学特征向量,然后用典型的蚁群策略研究每个人工蚂蚁在情感数据场的运动轨迹,并把该蚂蚁的运动轨迹作为对应的声学特征向量的情感标签.利用2012年连续音视频情感挑战赛中的语音数据对所提算法进行测试.实验结果表明:该算法较已有算法能更好地对基于块的语音情感进行识别.  相似文献   

4.
语音情感识别本质上是对语音情感的特征参数进行分类和模式识别,其核心问题在于寻找一个更为合适的语音情感识别算法.综述了语音情感识别算法的分类概况、常用的分类算法、研究中的困难与需要进一步研究的问题.最后展望了可能提高精度的先进识别模型.  相似文献   

5.
为了在语音情感识别中获得高效、紧凑的低维特征,提出了一种新的基于不确定线性判别分析的特征约简方法.用与传统LDA相同的原则,在最大判别方向的估计中引入带噪声或失真输入数据的不确定性.在维吾尔语语音情感识别任务上验证了不确定性判别分析的有效性.在该情感数据上,分析了维吾尔语的语音情感特征,着重对维吾尔语语音的基音频率和共振峰频率进行了详细分析.利用不确定性线性判别分析对特征维数进行了降维研究,获得了比其他的常用降维技术更好的结果.通过不确定性线性判别分析获得的低维数据供给支持向量机,实现了维吾尔语的语音情感识别.实验结果表明,采用适当的不确定性估计算法时,在维吾尔语音情感识别任务上,不确定性线性判别分析(ULDA)算法优于传统LDA降维算法.  相似文献   

6.
基于迁移学习的遥感影像树种类型分类   总被引:1,自引:0,他引:1  
提出了基于迁移学习思想的卷积神经网络遥感影像树种类型分类算法。采用ImageNet上训练的Inception-v3模型对树种影像特征进行提取,使用AID标准数据集和自行采集的东北林业大学实验林场数据集训练一个新的全连接层和Softmax层,更改输出层的节点数量;引入Dropout函数改善过拟合现象;通过反向传播优化模型。实验结果显示,模型在两种数据集上总体分类精度分别达到了98. 8%和97. 2%,Kappa系数分别为0. 987和0. 984,表明实验算法不仅降低了卷积神经网络的参数数量,还提高了目标分类识别的准确性。与传统方法相比,实验算法无需进行复杂的预处理技术即可实现树种的自动特征提取,同时解决了只有依赖大规模样本才可达到较高分类精度问题,在树种类型分类上具有很高的应用价值。  相似文献   

7.
研究了基于认知评估原理的多维耳语音情感识别.首先,比较了耳语音情感数据库和数据采集方法,研究了耳语音情感表达的特点,特别是基本情感的表达特点.其次,分析了耳语音的情感特征,并通过近年来的文献总结相关阶特征在效价维和唤醒维上的特征.研究了效价维和唤醒维在区分耳语音情感中的作用.最后,研究情感识别算法和应用耳语音情感识别的高斯混合模型.认知能力的评估也融入到情感识别过程中,从而对耳语音情感识别的结果进行纠错.基于认知分数,可以提高情感识别的结果.实验结果表明,耳语音信号中共振峰特征与唤醒维度不显著相关,而短期能量特征与情感变化在唤醒维度相关.结合认知分数可以提高语音情感识别的结果.  相似文献   

8.
针对目前市场上语音控制家居产品的语音识别必须在服务端进行,在缺乏互联网情况下则无法使用,以及智能家居设备采用有线组网方式导致升级维护成本高的问题,设计一款采用WiFi、蓝牙等无线混合组网技术搭建的异构家庭网关,可以动态添加设备,组网灵活方便且成本低,即使在断网情况下,网关也可自动切换到本地语音识别。为此,使用基于上下文相关的GMM-HMM算法训练声学模型与语言模型搭建语音识别引擎,采用BP神经网络学习算法实现语音智能控制。测试结果表明,系统功能基本符合预期,在断网情况下系统仍可以进行语音识别并对家庭设备进行语音控制。  相似文献   

9.
为有效识别浮动验证码,提出一种基于特征匹配与卷积神经网络的识别方法。首先使用特征匹配的方法得到匹配特征点,结合交叉匹配算法与 K 近邻匹配算法滤除错误匹配;然后对特征点进行聚类及投票分析,得到待识别字符区域,将其分割得到单个字符;最后在 mnist 手写数字数据集的基础上加入英文字符,构建卷积神经网络模型,将数据集送入模型进行训练。对 10 000 张浮动验证码进行测试,结果表明,该方法对浮动验证码的识别准确率达 95%,且构建的训练集具有可扩展性,可进一步应用到其它类型的字符识别中。  相似文献   

10.
为解决跨数据库语音情感识别领域中实验数据集特征不匹配的问题,提出一种基于时频原子的听觉注意特征提取模型.首先,为了提取频谱特征,引入听觉注意模型对多类情感特征进行有效的探测.然后,利用选择注意机制改进了提取的语谱图特征,其中包含的显著性信息与跨库识别性能有紧密联系.再引入Chirplet时频原子,通过形成的过完备原子库提高语谱图特征的信息量.来自多个数据库的样本具有多成分分布的特征,据此所提模型中的Chirplet扩大了特征向量在时频域上的尺度.实验结果显示,相比传统特征模型,所提方法性能有显著提升.此外,该方法在训练集和测试集来源不一致情况下具有更好的鲁棒性.  相似文献   

11.
近年来,手写数字识别是计算机视觉与模式识别中一个广受关注的问题。该问题的主要挑战是如何设计一种有效方法,以识别用户通过数字设备提交的手写数字。目前,深度学习算法在计算机视觉领域非常流行,被用于处理诸如图像分类、自然语言处理及语音识别等问题。以几种深度学习常见算法,包括线性感知器、卷积神经网络、循环神经网络、长短时记忆网络等为研究对象,分析其在手写数字识别方面的优缺点,并引入Google 第二代人工智能系统 TensorFlow,对比相同算法在不同框架下的识别速度及准确率。实验结果表明,几类深度学习算法都能明显提高识别准确率,且在训练数据集时不会损耗过多计算资源。  相似文献   

12.
针对语音情感识别中不同表征空间的信息利用不足问题,提出了一种多头注意力的双层长短时记忆模型,用于充分挖掘有效的情感信息.该模型以具有时序情感信息的帧级别特征作为输入值,利用长短时记忆模块学习时域特征,设计了特征注意力模块和时间多头注意力模块,对长短时记忆模块的逐层输出值、特征注意力模块输出值、时间多头注意力模块输出值进行融合.结果表明,相比传统的长短时记忆模型,所提方法在eENTERFACE和GEMEP两个数据集上的识别准确率分别提升了14.6%和10.5%,从而证明了其在语音情感识别任务中的有效性.  相似文献   

13.
从语音识别系统前端信号处理出发研究了语音信号特征的提取方法.对4种语音识别主流算法模型进行部署,构建了不同车载应用场景,并选择字错误率和实时率两种主流评价指标对算法模型进行了效果测试,开展了算法评价与分析,同时运用开源二维网格搜索法优化了百度DeepSpeech2模型,并对其进行硬件适配,使得模型识别精度、识别速率得到...  相似文献   

14.
针对年龄相关性黄斑变性图像的分类研究,提出采用DenseNet迁移学习的图像分类方法.对原始图像进行归一化、限制对比度自适应直方图均衡化等预处理方法,采用旋转、剪裁等数据增强方法扩增数据.在DenseNet网络模型基础上,采用数据集ImageNet首先对DenseNet网络模型进行预训练,然后将训练后得到的网络模型予以...  相似文献   

15.
语音识别技术及应用   总被引:5,自引:0,他引:5  
语音识别技术近年来得到了飞速的发展并且在越来越多的领域得到了广泛的应用。隐马尔可夫模型(HMM)语音识别技术是一种基于训练数据提供的概率自动构造识别系统的技术,主要用于大量词汇的语音识别,而且具有良好的识别性能和抗噪性能。因此,一般的语音识别系统都采用基于HMM的识别方法作为其基本算法。本文列举了语音识别在教学中的应用示例来分析其基本算法。  相似文献   

16.
为了弥补经典LeNet-5卷积神经网络模型在交通标志识别中易发生过拟合的不足,克服其识别准确率与训练效率较低的缺点,采用GTSRB德国交通标志数据集,并对数据集进行扩充,使训练集数量达到6 312 649张,同时对经典LeNet-5卷积神经网络模型在激活函数、池化策略、随机丢弃及网络结构等方面进行改进,使用基于交叉熵的梯度下降算法对模型的误差反向传播过程进行优化。实验结果表明,改进后的模型较改进前在识别准确率与训练效率上都有所提高,识别准确率最高可达97.04%。因此,基于交叉熵的卷积神经网络不仅能够提高模型的交通标志识别准确率,有效防止过拟合,还能够提升网络训练效率。  相似文献   

17.
黄浩  朱杰 《东南大学学报》2007,23(2):174-178
提出了2种解决汉语语音识别中声调问题的方法:利用区分性方法对基于隐马尔可夫模型(HMM)的声调模型进行训练;提出将区分性训练的声调模型加入大词汇量连续语音识别系统的最优方法,该方法根据最小音子错误的训练准则以及利用扩展Baum-Welch算法区分性训练与模型相关的概率权重,对声学模型以及声调模型概率进行加权.实验结果表明区分性训练的声调模型能够显著地提高连续语音声调识别率以及大词汇量语音识别系统的识别率,同时区分性的模型权重训练能够在区分性声调模型加入连续语音识别系统之后进一步提高系统的识别性能.  相似文献   

18.
深度学习技术与教师教育融合创新,可赋能教师教学体态语言行为精准测评。针对教师体态语言人工视频分析技术滞后问题,本研究采用人物目标检测、目标追踪和体态骨架图生成三种方法,创建真实教学情境下基于人体骨架图的专家型教师标准体态语言数据集,使用金字塔卷积模块优化ResNet50残差网络,构建金字塔残差神经网络模型,并基于数据集开展识别模型的训练、验证和测试实验。结果显示,体态语言识别模型的准确率、精确率和召回率均达到95%以上,识别准确率由高到低依次为工具性体态语言、巡视性体态语言、指示性体态语言、常规性体态语言、描述性体态语言。本研究基于上述训练良好的模型,开发教师体态语言智能感知测评系统,提出教师体态语言特征的人体骨架表征方法、教师体态语言数据集创建方法及智能识别神经网络模型构建方法,构建了大数据驱动的教师课堂体态语言智能测评方法体系。  相似文献   

19.
基于迁移学习的家猪图像识别研究   总被引:1,自引:0,他引:1  
为实现家猪图像识别并提高识别准确率,提出一种基于迁移学习的家猪图像识别方法。首先对现有数据集进行数据增强,然后迁移 VGG16 模型并对其进行微调,从而更好地提取图像特征并缩短网络训练时间。采用自归一化神经网络解决了梯度消失和梯度爆炸问题,在网络构造时使用全局平均池化代替全连接层,以达到降低模型过拟合的效果。实验对比结果表明,该方法分类效果较好,准确率达到了 84%,召回率和 F1 值分别提升至 0.8、0.82,各项指标相比基础模型均有所提升。  相似文献   

20.
基于数据智能分析的学习资源推送是精准支持个性化学习的教学服务方式之一。随着人工智能技术和学习分析技术的发展,通过对行为数据、测评数据和日志数据等的分析进行资源推送虽已有较成功应用,但未能实现学习者个人情感状态为引导的资源推送。为此,该研究针对个性化学习资源推荐中情感价值、情感控制理论和实践的缺失,以实现个性化学习多维度情感识别为目标,采用BERT模型和TextCNN构建个性化学习资源推荐文本情感识别模型,并提出了基于学习者作业、论坛内容等的文本情感识别模型实现过程。学习资源推荐文本情感识别模型和实现过程可为真实应用提供方法支持和技术路线指引。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号