首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 101 毫秒
1.
根据说话人识别系统结构,为了使系统识别率得到有效提高,在特征提取方面,将美尔倒谱系数与其一阶差分结合在一起形成新的特征参数。在识别算法方面,对基本的VQ识别算法进行了改进,提出了一种新的矢量量化识别方法,即基于方差的加权失真测度的矢量量化,并通过大量实验进行了论证。  相似文献   

2.
说话人识别是语音识别的一种特殊方式,其目的不是识别语音内容,而是识别说话人是谁,即从语音信号中提取个人特征。采用矢量量化(VQ)可避免困难的语音分段问题和时间归整问题,且作为一种数据压缩手段可大大减少系统所需的数据存储量。本文提出了识别特征选取采用复倒谱特征参数和对应用VQ的说话人识别系统改进的一种方法。当用于训练的数据量较小时,复倒谱特征可以得到比较稳定的识别性能。VQ的改进方法避免了说话人识别系统的训练时间与使用时间相差过长从而导致系统的性能明显下降以及若利用自相关函数带来的大量运算。  相似文献   

3.
基于韵律变换的情感说话人识别   总被引:1,自引:0,他引:1  
为了解决由情感变化引起的说话人识别性能下降问题,提出了一种新的情感说话人识别系统.首先,通过引入情感识别作为前端处理模块,对中性语音和情感语音进行分类.然后,对情感语音进行韵律修正,分别采用高斯归一化、高斯混合模型(GMM)和支持向量回归(SVR)等方法建立情感语音和中性语音的基频映射规则,并根据平均线性变化率对时长进行了修正.最后,对韵律修正后的情感语音进行识别.实验结果表明,提出的情感说话人识别系统可以有效地提高情感说话人识别的性能,识别率相比传统方法有了显著的提高.并且通过基频和时长修正的情感语音更接近于中性语音.  相似文献   

4.
Matlab作为目前最流行的功能强大的软件,可用于说话人识别。在介绍说话人识别基本概念和原理的基础上,通过一个具体实例,说明如何用matlab的simulink工具箱提取特征参数、通过编程来进行对说话人识别的过程。最后给出了识别结果。  相似文献   

5.
围绕移动终端多媒体数据版权保护问题,在智能手持装置中引入Client-Service方法,将码书设计与水印嵌入分开.采用IEENNS搜索算法缩短编码时间,借助图像检索方法自动选择码书.设计系统分为两个子系统:一个是最优码书生成子系统,一个是自识别VQ子系统.实验结果表明,不仅能够提高码书生成质量与重构图像的质量,同时能够缩短编码时间,而且具有较强的鲁棒性.  相似文献   

6.
借助语音增强、基音频率分析和共振峰分析,设计了简单的说话人识别系统.在识别过程中以平均基音频率、共振峰峰值位置作为两种评价标准,交互印证,最终实现了说话人的身份辨认.  相似文献   

7.
说话人识别系统是在语音信号中提取说话人信息来鉴别说话人身份.整个系统以DSP处理器为核心结构,进行训练和识别语音信号.采用LPC和DTW作为核心算法来进行说话人识别.  相似文献   

8.
介绍了隐马尔可夫模型及其主要解决的3个基本问题,以及在说话人识别系统中实现的基本过程,并对256和512码本、文本相关与文本无关进行比对,得出文本相关的识别率更高的结论并分析了其原因。  相似文献   

9.
在VC++环境下,提取PLAR特征参数,基于听觉特性和语谱特性的语音增强器作为预处理器,对语音信号首先进行降噪处理,建立了基于DTW的抗噪声说话人识别系统.实验结果表明,即使在信噪比比较低的情况下,该系统都会在一定程度上提高多种噪声环境下说话人识别系统的识别性能.  相似文献   

10.
针对使用话语级特征参数矩阵作为卷积神经网络输入而导致收敛速度慢及识别率低的问题,提出一种基于二维主成分分析(2DPCA)特征降维的卷积神经网络(CNN)说话人识别方法.首先将每段语音分帧成多个帧级语音并提取同等大小的帧级特征组成特征矩阵,然后利用2DPCA对特征矩阵进行降维处理,再将得到的主成分特征向量组合成新的特征矩...  相似文献   

11.
研究并提取了2种重要的语音特征参数,包括能有效表征语音全极点模型的线性预测倒谱系数和模拟人耳对不同频率声音感知特性不同的美尔倒谱系数(MFCC),对这2个参数进行了分析和比较。在预处理中分析比较了矩形窗和汉明窗。在建模的过程中,采用最小距离分类器的识别策略。  相似文献   

12.
以DSP实现基于概率DP匹配算法的说话人识别系统   总被引:1,自引:0,他引:1  
提出了利用概率DP匹配算法进行说话人识别的的设想。并给出了运用TMS320C5416实现说话人自动识别系统的方案。该系统利用一种新的语音信号r阶的倒谱线性回归系数等参数构成识别的特征矢量集,运用提出的概率DP匹配算法进行与文本无关的说话人识别。实验结果表明该系统具有识别精度高、识别速度快,占用系统资源少等特点,是一种有效的说话人自动识别的实现方法。  相似文献   

13.
将遗传算法应用于小波变换与矢量量化技术相结合的图像压缩编码中,提出了基于DWT和遗传算法的矢量量化图象压缩编码算法.研究表明,在相同压缩比下,这种算法较其它算法能更好地改善图像的质量.  相似文献   

14.
为了实现支持向量机对磨损磨粒的自动识别,首先对彩色磨粒图像进行图像处理,运用 K -均值聚类、区域生长法和数学形态学将磨粒成功地从图像中分割出来;其次根据各类磨粒形貌特征确定磨粒的形状尺寸、纹理特征和颜色特征参数,并采用相应的方法提取这三方面的参数;由于支持向量机参数的选取对其分类效果影响很大,所以采用遗传算法对其参数做进一步的优化;最后以提取的特征参数为基础,运用优化的支持向量机成功地识别了严重滑动磨粒、球形磨粒、切削磨粒、疲劳磨粒和红色氧化物五类特征磨粒,其识别准确率达90%。结果表明该方法切实可行。  相似文献   

15.
考虑将支持向量机的思想应用于信息融合,提出基于支持向量机的信息融合的方法,并将这种方法应用于城市污水处理厂的数据处理。同时使用神经网络的信息融合方法与其相比较,实验的结果表明,基于支持向量机的信息融合的方法在对城市污水处理厂的这类数据的模式识别中,有着较好的分类预测能力。  相似文献   

16.
ImageCodingUsingWaveletTransformandEntropyConstrainedVectorQuantizationwithQuadtreeStructureVectorsGaoXiqi(高西奇)HeZhenya(何振亚...  相似文献   

17.
基于CHMM的高性能连续数字语音识别算法   总被引:3,自引:0,他引:3  
介绍了一种基于连续隐马尔可夫模型(CHMM)的汉语连续数字语音识别算法,该识别算法以MEL频率倒谱系数(MFCC)为主要语音特征参数,采用切割-识别方案。在此框架下,本文提出了变时窗的连续数字切割算法,并且结合了声调信息,因此最终连续数字语音识别率达到了90%以上。  相似文献   

18.
给出了一种基于LPQ特征向量的帘子布疵点识别方法。首先给出了局部相位量化(LPQ)的定义,,然后计算帘子布样本图像的LPQ特征向量,使用PCA降维处理,再利用降维后的LPQ特征向量对预先设置的BP神经网络参数进行最优选择,最后利用最优的BP神经网络作为帘子布疵点分类器。此识别算法能对断经、浆斑、劈缝、稀经和经线粘连等帘子布疵点进行有效识别。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号