语音识别技术简介 我想大家都听过阿里巴巴与四十大盗的故事,阿里巴巴的“芝麻开门”就是一个语音识别的例子,可见语音识别是很早就启蒙了。今天我就和大家一起来学习一下语音识别技术。 让机器听懂人类的语音,这是人们长期以来梦寐以求的事情。伴随计算机技术发展,语音识别己成为信息产业领域的标志性技术,在人机交互应用中逐渐进入我们日常的生活,并迅速发展成为“改变未来人类生活方式厅的关键技术之一”。语音识别技术以语音信号为研究对象,是语音信号处理的一个重要研究方向。其最终目标是实现人与机器进行自然语言通信。语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高技术。 主要包括特征提取技术、模式匹配准则及模型训练技术三个方面,所涉及的领域包括:信号处理、模式识别、概率论和信息论、发声机理和听觉机理、人工智能等。 今天主要讲的内容有:语音识别的发展历史、系统分类、基本方法、系统结构、面临问题以及前景展望。 语音识别发展历史 1952 年贝尔研究所Davis 等人研究成功了世界上第一个能识别10 个英文数字发音的实验系统。 1960 年英国的Denes 等人研究成功了第一个计算机语音识别系统。 大规模的语音识别[3]研究是在进入了70 年代以后,在小词汇量、孤立词的识别方面取得了实质性的进展。 进入80 年代以后,研究的重点逐渐转向大词汇量、非特定人连续语音识别。在研究思路上也发生了重大变化,即由传统的基于标准模板匹配的技术思路开始转向基于统计模型 (HMM)的技术思路。此外,再次提出了将神经网络技术引入语音识别问题的技术思路。 进入90 年代以后,在语音识别的系统框架方面并没有什么重大突破。但是,在语音识别技术的应用及产品化方面出现了很大的进展。 我国语音识别研究工作起步于五十年代,但近年来发展很快。研究水平也从实验室逐步走向实用。我国语音识别技术的研究水平已经基本上与国外同步,在汉语语音识别技术上还有自己的特点与优势,并达到国际先进水平。中科院自动化所、声学所、清华大学、北京大学、哈尔滨工业大学、上海交通大学、中国科技大学、北京邮电大学、华中科技大学等科研机构都有实验室进行过语音识别方面的研究,其中具有代表性的研究单位为清华大学电子工程系与中科院自动化研究所模式识别国家重点实验室。 清华大学电子工程系语音技术与专用芯片设计课题组,研发的非特定人汉语数码串连续语音识别系统的识别精度,达到90%以...