语音识别流程分析摘要:语言识别是将人类自然语言的声音信号,通过计算机自动转换为与之相对应的文字符号的一门新兴技术,属于模式识别的一种分支。语音识别的成果能够通过屏幕显示出文字符号,也能够存储在文本文献中。语音识别技术能够把语音信息直接转换成文字信息,对于中文信息解决来说,无疑是一种最抱负、最自然的中文输入方式。本文首先分析了语音识别的原理,在此基础上进行语音识别的流程分析,重要内容有:提取语音、端点检测、特性值提取、训练数据、语音识别。选用HMM隐马尔科夫模型,基于VC编译环境下的的多线程编程,实现算法的并行运算,提高了语音识别的效率。实验成果表明:所设计的程序满足语音识别系统的基本规定。核心词:语音识别预解决Mel倒谱系数HMM隐马尔科夫模式OpenMP编程前言语音识别是解决机器“听懂”人类语言的一项技术。作为智能计算机研究的主导方向和人机语音通信的核心技术,语音识别技术始终受到各国科学界的广泛关注。如今,随着语音识别技术研究的突破,其对计算机发展和社会生活的重要性日益凸现出来。以语音识别技术开发出的产品应用领域非常广泛,如声控电话交换、信息网络查询、家庭服务、宾馆服务、医疗服务、银行服务、工业控制、语音通信系统等,几乎进一步到社会的每个行业和每个方面。广泛意义上的语音识别按照任务的不同能够分为4个方向:说话人识别、核心词检出、语言辨识和语音识别。说话人识别技术是以话音对说话人进行区别,从而进行身份鉴别和认证的技术。核心词检出技术应用于某些含有特定规定的场合,只关注那些包含特定词的句子。语言辨识技术是通过分析解决一种语音片断以鉴别其所属语言种类的技术,本质上也是语音识别技术的一种方面。语音识别就是普通人们所说的以说话的内容作为识别对象的技术,它是4个方面中最重要和研究最广泛的一种方向,也是本文讨论的重要内容。语音识别技术,也被称为自动语音AutomaticSpeechRecognition,(ASR),其目的是将人类的语音中的词汇内容转换为计算机可读的输入,例如按键、二进制编码或者字符序列[1]。与说话人识别及说话人确认不同,后者尝试识别或确认发出语音的说话人而非其中所包含的词汇内容。语音识别技术的应用涉及语音拨号、语音导航、室内设备控制、语音文档检索、简朴的听写数据录入等。语音识别技术与其它自然语言解决技术如机器翻译及语音合成技术相结合,能够构建出更加复杂的应用,例如语音到语音的翻译。语音识别技术所涉及的领域涉及:信号解决、模式识别、概率论和信息论、发声机理和听觉机理、人工智能等等。一、语音识别的原理语音识别的基本原理是一种模式匹配的过程:先建立一种原则的模式寄存在计算机中,然后把输入的语言信息进行分析解决,采集有关的信息建立目的语音模式,再将目的语音模式与机内原则模式相匹配,找到近来的模式最为识别成果输出。语音识别本质上是一种模式识别的过程,未知语音的模式与已知语音的参考模式逐个进行比较,最佳匹配的参考模式被作为识别成果[2]。使用C语言编程,实现基于马尔科夫模型的数据特性提取,在此基础上编程实现特定语音实例的语音识别;将语音识别功效编写成可供其它模块调用的函数,为进一步实现语音识别系统提供基础;并且从中培养、提高查阅文献和综合运用知识的编程开发能力。图1是基于模式匹配原理的自动语音识别系统原理框图。图1语音识别系统原理框图(1)预解决模块:对输入的原始语音信号进行解决,滤除掉其中的不重要的信息以及背景噪声,并进行语音信号的端点检测、语音分帧以及预加重等解决。(2)特性提取模块:负责计算语音的声学参数,并进行特性的计算,方便提取出反映信号特性的核心特性参数用于后续解决。现在较惯用的特性参数有线性预测(LPC)参数、线谱对(LSP)参数、LPCC、MFCC、ASCC、感觉加权的线性预测(PLP)参数、动态差分参数和高阶信号谱类特性等。其中,Mel频率倒谱系数(MFCC)参数因其良好的抗噪性和鲁棒性而应用广泛。(3)训练阶段:顾客输入若干次训练语音,通过预解决和特性提取后得到特性矢量参数,建立或修改训练语音的参考模式库。(4)识别阶段:将输入的语音提取特性矢量参数后与...