期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

《科技通报》2016,(8)

语音信号的特征提取是语音识别中重要的环节之一,特征提取是否准确决定着语音识别的识别率,不同的语音信号有着不同的特征提取方法,本文针对安多藏语的语音特征,进行线性预测分析,对线性预测余量信号通过感觉加权滤波后重新提取特征,使之具有更高的精确度,更好的稳健性。相似文献

2.

基于减少阶数的Mel频谱倒谱系数改进

于震王朝立刘伶俐《中国科技信息》2013,(1):49+56

本文通过实验对比,在语音识别的特征参数方面进行了有效的改进,创新内容是改善Mel频谱倒谱系数(MFCC),将12阶Mel频谱倒谱系数减为11阶,通过实验证明,改进后的参数有效提高了实验的识别率。实验主要采用删减特征分量的方法研究MFCC各阶参数对非特定人特定语音识别的贡献,并通过大量重复性实验得出验证,不同的参数选择对语音识别确实有不同的贡献,而且针对不同的语本模型,贡献也不同。相似文献

3.

基于DSP的语音识别系统研究

翟片富景新幸《大众科技》2013,(12):16-18

文章介绍了语音识别的基本原理以及用DSK6713实现语音识别算法的一些原则和方法,阐述了语音识别在DSP上的实现技术。系统使用梅尔倒谱系数（MFCC）作为特征参数,采用算法相对简单以及计算量较小的动态时间弯折算法（DTW）实现语音参数的匹配。用MATLAB实现DTW算法的仿真,进而将语音识别技术应用到DSP上,实验结果表明对特定人、小词汇量和孤立词的语音识别效果比较好。相似文献

4.

基于Labview软件的MFCC特征参数提取程序设计

苏力李阳庞宇辰《黑龙江科技信息》2018,(5)

MFCC特征参数提取是语音识别设计中非常重要的环节,MFCC特征参数提取的实现及参数的精确度对于最终语音识别的准确度有着非常大的影响。对于MFCC特征参数的提取主要的方法是利用MATLAB软件来实现。利用Labview软件调用MATLAB程序可将两者的优点综合起来,提高软件的适用性。相似文献

5.

广播电视同步播出监管系统的特点及应用技术

黄艳《大众科技》2011,(8):22-24

文章主要介绍了广播电视同步播出监管系统的主要功能、系统的总体框架、各个子系统完成的主要功能以及采用以MFCC（Mel频率倒谱系数）为特征提取算法和隐马尔可夫模型（HMM）为基本语音模型的音频比对的关键技术。相似文献

6.

基于DSP的语音识别系统设计

李俊周海滨邱胜林张艳珍蔡晓燕《科技广场》2011,(7):118-122

系统以16位数字信号处理器TMS320VC5502为核心,采用音频Codec芯片TLV320AIC23对语音信号进行采集和编码转换,通过端点检测、特征参数提取、DTW算法等关键技术实现特定人、小词汇量、孤立词的语音识别,最终根据LED闪灯次数检测数字0～9的识别结果。相似文献

7.

以语音识别为基础的音乐检索系统

袁婷婷曹萌萌《科技通报》2015,(7)

针对一般的语音识别算法均存在抗噪能力不好的问题,无法满足音乐检索系统的需求。针对于此,本文以抗噪能力为基础对MFCC语音识别算法进行了优化,第一步是通过F比方法加权优化了MFCC算法的特征参数,估计出各维特征分量对识别率的影响,并将其提取出来,然后采用主成分分析法对提取的特征分量进行降维处理,以降低计算复杂度,减少数据存储量,加快训练时间,最终提高识别效率。算法仿真结果表明,本文提出的基于抗噪能力优化的MFCC语音识别算法具有较好的抗噪能力,比传统MFCC算法对音乐检索的精确度更高。相似文献

8.

基于HMM的连续语音中的关键词检测

马晓梅李雪耀王洋《黑龙江科技信息》2008,(32)

关键词检测是语音识别中一个重要的研究方向.本文针对说话人的连续语音提出了一种基于HMM模型的关键词检测方法,并针对关键词模型、垃圾模型及关键词的检测策略进行了研究.实验表明,该方法具有一定的可行性,大大提高了系统的实用性. 相似文献

9.

改进MFCC参数在非特定人语音识别中的研究 总被引：1，自引：0，他引：1

田莎莎唐菀佘纬《科技通报》2013,29(3)

随着信息时代的高速发展,人们越来越关注计算机的便携使用方式,以语音输入代替手动输入成为计算机未来发展的一个必然趋势.本文在MFCC特征参数的基础上,提出了一种改进MFCC特征参数--BMFCC特征参数,以提高原MFCC特征参数在语音识别时的识别率和运算速度.BMFCC特征参数在进行参数的提取时,分为特征分量加权、特征分量求差分、主成分分析三个步骤.仿真实验结果表明,本文提出的BMFCC特征参数在识别率和有运算速度上均优于MFCC特征参数,且更具鲁棒性. 相似文献

10.

基于VQ的声纹识别研究

张旺俏《中国科技信息》2007,28(7):124-125,127

采用能够反映人对语音的感知特性的Mel频率倒谱系数（MFCC）作为语音的特征参数，研究了基于MFCC的VQ的识别方法，对单独使用MFCC与使用MFCC和AMFCC结合的识别率进行比较，实验结果表明通过对说话人的特征参数进行倒谱提升之后，MFCC和△MFCC结合能更好地区分不同说话人。相似文献

11.

基于语音识别和GSM的门控系统设计

曾杰邹祥祥王志平陈琼《科技广场》2012,(3):247-249

本设计采用语音识别和GSM远程报警技术使防盗系统智能化,安全性提高。该智能门控系统基于凌阳16位单片机SPCE061A为控制核心,将语音信号进行数字信号处理,利用特定人语音识别技术实现语音识别密码锁功能,并利用GSM模块实现无线远程短信和拨号报警功能。从硬件设计、软件优化等方面进行总体设计,并且通过结果测试和分析证明了设计的可行性。相似文献

12.

语音识别技术在楼宇自控系统中的应用

郭莉莉《科技广场》2010,(1):150-153

随着语音识别技术的发展,孤立词、小词汇量的语音识别系统在日常生活中得到广泛应用,本文提出了一种基于DSP的孤立词实时语音识别系统,并将动态时间规整技术运用到识别算法中。根据楼宇控制系统的特点,结合BACnet网络协议,把系统设计成BACnet设备的一个嵌入式子系统,从而把语音识别应用到楼宇控制系统中。结合了系统硬件速度快、算法高效的特点,实现了对楼宇更加实时、方便的控制。相似文献

13.

基于凌阳单片机的嵌入式声控门锁的设计

徐春辉《科技广场》2007,(5):208-210

通过分析语音特征参数的特点和说话人识别的基本方法,以线性预测倒谱系数为特征参数提取算法以及隐马尔可夫模型为建模算法,利用凌阳单片机作硬件平台,实现了声控锁的语音控制功能。实验结果表明,系统性能稳定,识别效果良好。相似文献

14.

Modern standard Arabic speech corpus for implementing and evaluating automatic continuous speech recognition systems

Mohammad Abd-Alrahman Mahmoud Abushariah Raja Noor Ainon Roziati Zainuddin Assal Ali Mustafa Alqudah Moustafa Elshafei Ahmed Othman Omran Khalifa 《Journal of The Franklin Institute》2012,349(7):2215-2242

This paper presents our work towards developing a new speech corpus for Modern Standard Arabic (MSA), which can be used for implementing and evaluating Arabic speaker-independent, large vocabulary, automatic, and continuous speech recognition systems. The speech corpus was recorded by 40 (20 male and 20 female) Arabic native speakers from 11 countries representing three major regions (Levant, Gulf, and Africa). Three development phases were conducted based on the size of training data, Gaussian mixture distributions, and tied states (senones). Based on our third development phase using 11 hours of training speech data, the acoustic model is composed of 16 Gaussian mixture distributions and the state distributions tied to 300 senones. Using three different data sets, the third development phase obtained 94.32% and 8.10% average word recognition correctness rate and average Word Error Rate (WER), respectively, for same speakers with different sentences (testing sentences). For different speakers with same sentences (training sentences), this work obtained 98.10% and 2.67% average word recognition correctness rate and average WER, respectively, whereas for different speakers with different sentences (testing sentences) this work obtained 93.73% and 8.75% average word recognition correctness rate and average WER, respectively. 相似文献

15.

朝鲜语紧急呼叫号码的语音识别系统研究

王晓丹金国哲《人天科学研究》2013,(10):103-106

朝鲜语是我国目前适用范围较为广泛、使用人12＇较多的一种少数民族语言。朝鲜语紧急呼叫号码的语音识别软件,采用语音命令来呼叫号码,能够准确识别拨叫号码,在特定场合可以起到至关重要的作用。将语音控制指令范围设定为报警求助、火警等词汇的识别中,实现了朝鲜语紧急呼叫号码语音识别系统的软件算法部分。通过对信号处理的每个步骤和朝鲜语数字连读问题进行深入分析及研究,选择DTW（动态时间弯曲）算法作为该软件的核心算法。Matlab实验结果表明,采用的语音识别过程及算法可以准确地对录制的朝鲜语紧急呼叫号码进行识别。相似文献

16.

Vulnerable community identification using hate speech detection on social media

《Information processing & management》2020,57(3):102087

With the rapid development in mobile computing and Web technologies, online hate speech has been increasingly spread in social network platforms since it's easy to post any opinions. Previous studies confirm that exposure to online hate speech has serious offline consequences to historically deprived communities. Thus, research on automated hate speech detection has attracted much attention. However, the role of social networks in identifying hate-related vulnerable community is not well investigated. Hate speech can affect all population groups, but some are more vulnerable to its impact than others. For example, for ethnic groups whose languages have few computational resources, it is a challenge to automatically collect and process online texts, not to mention automatic hate speech detection on social media. In this paper, we propose a hate speech detection approach to identify hatred against vulnerable minority groups on social media. Firstly, in Spark distributed processing framework, posts are automatically collected and pre-processed, and features are extracted using word n-grams and word embedding techniques such as Word2Vec. Secondly, deep learning algorithms for classification such as Gated Recurrent Unit (GRU), a variety of Recurrent Neural Networks (RNNs), are used for hate speech detection. Finally, hate words are clustered with methods such as Word2Vec to predict the potential target ethnic group for hatred. In our experiments, we use Amharic language in Ethiopia as an example. Since there was no publicly available dataset for Amharic texts, we crawled Facebook pages to prepare the corpus. Since data annotation could be biased by culture, we recruit annotators from different cultural backgrounds and achieved better inter-annotator agreement. In our experimental results, feature extraction using word embedding techniques such as Word2Vec performs better in both classical and deep learning-based classification algorithms for hate speech detection, among which GRU achieves the best result. Our proposed approach can successfully identify the Tigre ethnic group as the highly vulnerable community in terms of hatred compared with Amhara and Oromo. As a result, hatred vulnerable group identification is vital to protect them by applying automatic hate speech detection model to remove contents that aggravate psychological harm and physical conflicts. This can also encourage the way towards the development of policies, strategies, and tools to empower and protect vulnerable communities. 相似文献

17.

语言识别机器人控制系统设计

Li Hui Gong Yachao Pingdingshan Institute of Technology Henan Pingdingshan 《科技广场》2008,(7)

针对凌阳SPCE061A单片机在语音处理方面的优势,设计完成了一个基于SPCE061A的语音识别机器人控制系统。在经过训练后使机器人可根据训练人的命令完成一系列趣味动作。相似文献

18.

基于PMC方法的鲁棒声学模型研究

张明新倪宏张东滨陈国平《中国科学院研究生院学报》2006,23(5):660-664

在噪声鲁棒语音识别研究中，使用并行模型结合(parallel model combination, PMC)方法得到的模型理论上能够接近匹配噪声环境模型的性能，故成为噪声鲁棒语音识别的重要研究方向。本文首先提出了一种基于前后向差分动态参数的特征MFCC_FWD_BWD，该特征满足PMC对特征构造矩阵可逆的要求。在此基础上，提出了一种用于PMC的新模型——并行子状态隐马尔可夫模型(parallel sub-state hidden Markov model, PSSHMM)，该模型每个状态包含平行关系的子状态，且子状态间存在转移关系。实验表明，PSSHMM模型在各种噪声和SNR下取得了较好的识别效果，特别是对于非平稳噪声，其鲁棒性能非常显著。相似文献

19.

Improved Arabic speech recognition system through the automatic generation of fine-grained phonetic transcriptions

《Information processing & management》2019,56(2):343-353

相似文献