首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
基于CHMM的高性能连续数字语音识别算法   总被引:3,自引:0,他引:3  
介绍了一种基于连续隐马尔可夫模型(CHMM)的汉语连续数字语音识别算法,该识别算法以MEL频率倒谱系数(MFCC)为主要语音特征参数,采用切割-识别方案。在此框架下,本文提出了变时窗的连续数字切割算法,并且结合了声调信息,因此最终连续数字语音识别率达到了90%以上。  相似文献   

2.
声纹识别技术,形象的说法就是说话人识别技术。它是根据人在说话时产生的波形,以及波形中反映人类心理和生理的特征参数来判断说话人的身份的技术。本文所研究的是与文本有关的说话人确认系统。比较了基于声道的线性预测倒谱系数(LPCC)和基于听觉特性的MEL频率倒谱系数(MFCC)参数特征,得出MFCC对环境存在更高的鲁棒性。并运用了隐形马尔可夫模型(HMM)在MATLAB上实现了语音数字的识别仿真。本实验系统的识别率达到了90%,验证了HMM模型识别的准确性。  相似文献   

3.
提出了一种基于LPC的语音信号特征参数提取的算法思想,对原始的语音信号进行线性预测建模,估计预算模型参数,提取LPC系数,分析LPC倒谱并计算预测误差。实验结果表明,该算法能较好的提取语音信号的特征参数,且预测重构的语音信号误差较小,易于建模的实现,为语音信号处理提供了一种特征参数提取的方法。  相似文献   

4.
基于LPC预测残差的倒谱基音检测算法分析   总被引:1,自引:0,他引:1  
给出了加窗语音的新倒谱模型,提出了基于语音LPC预测残差的倒谱基音周期检测算法(LP—CEP法),该算法在倒谱计算中采取高频分量置零的新措施,仿真研究结果表明,该算法相对于传统倒谱基音检测算法(CEP法),无论是对不同的干净语音还是对不同信噪比的含噪语音,其基音检测结果有明显的改善。  相似文献   

5.
根据说话人识别系统结构,为了使系统识别率得到有效提高,在特征提取方面,将美尔倒谱系数与其一阶差分结合在一起形成新的特征参数。在识别算法方面,对基本的VQ识别算法进行了改进,提出了一种新的矢量量化识别方法,即基于方差的加权失真测度的矢量量化,并通过大量实验进行了论证。  相似文献   

6.
研究并提取了2种重要的语音特征参数,包括能有效表征语音全极点模型的线性预测倒谱系数和模拟人耳对不同频率声音感知特性不同的美尔倒谱系数(MFCC),对这2个参数进行了分析和比较。在预处理中分析比较了矩形窗和汉明窗。在建模的过程中,采用最小距离分类器的识别策略。  相似文献   

7.
给出了加窗语音的新倒谱模型,提出了基于语音LPC预测残差的倒谱基音周期检测算法(LP—CEP法),该算法在倒谱计算中采取高频分量置零的新措施。仿真研究结果表明,该算法相对于传统倒谱基音检测算法(CEP法),无论是对不同的干净语音还是对不同信噪比的含噪语音,其基音检测结果都有明显的改善。  相似文献   

8.
基于Matlab设计了以动态时间规整(dynamic time warping,DTW)算法和Mel频率倒谱系数(Mel frequency cepstrum coefficients,MFCC)参数提取算法为基础的孤立词自动语音识别系统;然后结合机器人语音识别的需求,基于凌阳SPCE061A设计了语音识别应用系统。结合上述两部分工作,设计、实现了机器人语音识别系统演示实验和机器人语音识别半开放实验,实现效果达到预期实验设计目标。  相似文献   

9.
汉语语音识别中连续大词汇量的语音识别率较差。若能把连续大词汇量的语音进行实时自动切分为单个音节,便可提高系统的识别率。如何做到对语音识别中音节的自动切分,首先需找出汉语语音音节的特征。本文综合了当前对汉语音节特征的研究成果,通过深入地比较分析,系统地给出了汉语语音音节的功率谱特征和时域特征,为汉语语音音节的自动切分提供算法依据,对提高连续大词汇量语音的识别率有重要意义。  相似文献   

10.
黄浩  朱杰 《东南大学学报》2007,23(2):174-178
提出了2种解决汉语语音识别中声调问题的方法:利用区分性方法对基于隐马尔可夫模型(HMM)的声调模型进行训练;提出将区分性训练的声调模型加入大词汇量连续语音识别系统的最优方法,该方法根据最小音子错误的训练准则以及利用扩展Baum-Welch算法区分性训练与模型相关的概率权重,对声学模型以及声调模型概率进行加权.实验结果表明区分性训练的声调模型能够显著地提高连续语音声调识别率以及大词汇量语音识别系统的识别率,同时区分性的模型权重训练能够在区分性声调模型加入连续语音识别系统之后进一步提高系统的识别性能.  相似文献   

11.
本文从语音信号的线性预测码模型出发,分析了其误差传输函数方程的根与其系数之间的关系,得到了线性预测系数与根幂和之间的关系式,从而得到了误差传输函数的倒谱系数的递推公式。  相似文献   

12.
本文指出了在声码器、语音识别、说话人识别等方面在利用广泛应用的线性预测技术时,压缩LPC系数的重要意义,又在最小均方误差准则下,探讨了将p个LPC系数压缩到q个(1相似文献   

13.
说话人识别是语音识别的一种特殊方式,其目的不是识别语音内容,而是识别说话人是谁,即从语音信号中提取个人特征。采用矢量量化(VQ)可避免困难的语音分段问题和时间归整问题,且作为一种数据压缩手段可大大减少系统所需的数据存储量。本文提出了识别特征选取采用复倒谱特征参数和对应用VQ的说话人识别系统改进的一种方法。当用于训练的数据量较小时,复倒谱特征可以得到比较稳定的识别性能。VQ的改进方法避免了说话人识别系统的训练时间与使用时间相差过长从而导致系统的性能明显下降以及若利用自相关函数带来的大量运算。  相似文献   

14.
汉语语音识别中连续大词汇量的语音识别率较差.若能把连续大词汇量的语音进行实时自动切分为单个音节,便可提高系统的识别率.如何做到对语音识别中音节的自动切分,首先需找出汉语语音音节的特征.本文综合了当前对汉语音节特征的研究成果,通过深入地比较分析,系统地给出了汉语语音音节的功率谱特征和时域特征,为汉语语音音节的自动切分提供算法依据,对提高连续大词汇量语音的识别率有重要意义.  相似文献   

15.
提出了以Mel频率倒谱系数(MelFrequencyCepstrumCoefficients,MFCC)作为特征提取技术,以支持向量机(SupportVectorMachine,SVM)作为分类器的语音识别方法,实验结果表明,对于容易混淆的英文单词,该方法语音识别准确率较高。  相似文献   

16.
作为语言学习的重要组成部分之一,发音学习是人与人之间互相交流的基础。该文分析了传统语音教学及其评价方式的不足,以梅尔频率倒谱系数作为参数进行特征提取,用隐马尔可夫声学模型和音素后验概率算法将测试语音与标准语音进行比对,从而找出二者之间的差异程度,通过评分机制得到分数。实验结果表明,该系统能提高说话者学习语音的积极性,其评分结果与教师的主观感觉相一致,具有一定的实用性和可操作性。  相似文献   

17.
分析了在航管雷达模拟系统增加语音识别和合成功能的实现过程。根据航管雷达模拟系统的特点,采用中英文皆可识别且适合连续识别的语音引擎,以及符合人类语言特点的TTS语音库,与系统内部通讯机制相结合,实现语音识别和合成的过程。该系统运行稳定,在识别率和数据传输速度等方面效果比较好。  相似文献   

18.
以DSP实现基于概率DP匹配算法的说话人识别系统   总被引:1,自引:0,他引:1  
提出了利用概率DP匹配算法进行说话人识别的的设想。并给出了运用TMS320C5416实现说话人自动识别系统的方案。该系统利用一种新的语音信号r阶的倒谱线性回归系数等参数构成识别的特征矢量集,运用提出的概率DP匹配算法进行与文本无关的说话人识别。实验结果表明该系统具有识别精度高、识别速度快,占用系统资源少等特点,是一种有效的说话人自动识别的实现方法。  相似文献   

19.
针对非特定人的孤立词识别问题,研究构造了基于神经网络建模的语音识别算法。该算法的意义在于将神经网络应用于非特定人语音识别中,并取得了较好的识别效果,表明了神经网络在语音识别中的优势。  相似文献   

20.
将基于多个嵌入图组合形式的半监督判别分析(SDA)以及核SDA(KSDA)应用于全监督的语音情感识别.在语音信号样本情感成分的预处理阶段,从样本语段中提取出多种特征及其统计参数,包括基音、过零率、能量、持续长度、共振峰和MFCC(Mel频率倒谱系数).在将样本特征送入分类器之前的维数约简阶段,使用经过参数优化的SDA或KSDA进行降维.Berlin语音情感数据库上的实验表明,在使用多类SVM分类器时的全监督语音情感识别中,SDA优于其他一些先进的基于谱图学习的维数约简算法,如LDA,LPP,MFA等,而KSDA通过核化的数据映射,能够取得比上述所有算法更好的识别效果.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号