语音识别及其关键技术一、语音识别概述语音识别技术以语音信号处理为研究对象,涉及语言学、计算机科学、信号处理、生理学、心理学等诸多领域,是模式识别的重要分支
该技术有非常广阔的应用前景,从60年代至今,世界许多著名公司不惜投入巨资进行开发研究
我国的北京大学和中科院声学研究所一直紧跟国际水平,进行汉语语音识别技术的研究工作
50年代,是语音识别研究工作的开始时期,它以贝尔实验室研制成功可识别十个数字的犃狌犱狉狔系统为标志
60年代,计算机广泛应用于语音识别的研究工作中,动态规划和线性预测分析技术是这一时期的重要成果
70年代,语音识别的研究取得了突破性进展
基于线性预测倒谱和动态时间规整技术的特定人孤立语音识别系统被研制成功,提出了矢量量化和隐马尔可夫模型理论
80年代,语音识别的研究工作进一步深入
其标志是人工神经元网络在语音识别中的成功应用
90年代,随着计算机技术的飞速发展,语音识别正从研究走向实用,其研究成果已达到相当高的水平
2000年,正象美国微软公司总裁所说的那样,语音识别技术将使计算机丢掉键盘和鼠标
这无疑将改变我们许多人的工作和生活方式
二、语音识别所面临的问题尽管语音识别的研究工作迄今已近50年,但仍未有突破性进展,主要原因如下:1.语音识别系统的适应性差
全世界有近百种官方语言,每种语言有多达几十种方言,同种语言的不同方言在语音上相差悬殊,这样,随着语言环境的改变,系统性能会变得很差
2.在强噪声干扰环境下语音识别困难
由于语音数据大部分都是在接近理想的条件下采集的,语音识别的编码方案在研制时都要在高保真设备上录制语音,尤其要在无噪环境下录音
然而,当语音处理由实验室走向实际应用时,环境噪声的存在所带来的问题就变得越来越重要
特别是线性预测作为语音处理技术中最有效的手段,恰恰是最容易受噪声影响的
3.体态语言难以识别
有人在讲话时习惯用眼神、手势、面部表