下载后可任意编辑语音识别调查报告范文让计算机能听懂人的语言,是自计算机诞生以来人类便梦寐以求的,Intel创办人GordonMoore曾说,语音技术是影响未来科技进展最关键的技术;IBM总裁LouGerstner指出,有朝一日,将有数十亿的人运用自然语言在Internet上浏览、查询【’]。随着移动电话、掌上电脑、PDA等移动设备以及移动计算环境中各类智能设备的广泛应用,使用语音作为用户操作界面的要求越来越迫切,移动设备体积小,计算能力和存储空间有限,其使用场合又往往处于复杂、多变的噪声环境中,使得基于这类设备的语音识别有用技术面临许多挑战。如今语音识别的应用领域不断拓展,在军事、工业、家电、消费电子、交通等各方面都得到了广泛的应用。常见的应用有:(1>语音控制语音识别技术可实现这样的功能,利用声音来控制一台机器设备的运行。例如现在的智能家电,就可以通过语音控制其开关和其他功能的实现。语音控制一方面可以提高工作效率,另一方面也可以在人们手脚被占用的时候实现控制,解放人们的双手。(2)语音输入利用语音识别技术,将人们的声音信号直接转换成相应的文字输入计算机系统,不仅可以代替键盘使文字的输入工作更加省力和高效,同时也为那些不熟悉下载后可任意编辑键盘输入法的人们提供了一种新的文字输入途径。(3)身份识别和指纹类似,人们的声纹也具有较强的排他性,因此可以利用语音识别来进行身份的识别和确认工作。语音识别一般有广义和狭义之分。广义的语音识别指的是从语音信号中提取出任何人们感兴趣内容的技术,而我们通常所说的语音识别指的是狭义的语音识别,即从语音信号中提取出文本内容的技术。也就是通过算法,将语音转换成文本的过程[}2}根据识别的对象不同,语音识别大致分为3类:孤立词识别,连续语音识别,关键词识别。其中孤立词识别是识别事先己知的孤立词,如“开始”、“结束”等;连续语音识别的任务则是识别任意的连续语音,如一个句子或者一段话;连续语音流中的关键词检测针对的也是连续语音,但它并不要求识别全部文字,而只是检测己知关键词在何处出现,如在一段话中检测“西安”、“中国”这两个词。根据语音识别系统所针对的发音人,可以将语音识别分为2类:特定人语音识别和非特定人语音识别。其中前者只能识别特定的一个人或几个人的语音,而后者则可以被任何人使用。显然,非特定人语音识别系统更符合实际需要,但它要比特定人的识别困难得多。另外,根据语音设备和通道,可以分为桌面CPC)语音识别、电话语音识别和嵌入式设备(手机、PDA等)语音识别。下载后可任意编辑不同的采集通道会使发音的声学特性产生变形,因此需要构造各自的识别系统。虽然当前语音识别技术在实际应用中取得了较好效果,但我们也应清醒的认识到其中存在的问题并对其进行深化的分析。目前国内外对语音识别技术讨论存在的主要问题有:(1>标准输入的问题缺乏标准输入是目前语音识别面临的主要难题之一。因为语言、方言之间的差异,所以很难确定一个标准的输入,导致实际使用时误识率过高,较难达到人们预期的效果。即使语言相同,我们每个人的发音习惯也不尽相同,这就导致了根据某些人的语音数据设计出来的语音识别系统很难适应所有的使用者。因此目前绝大多数的语音识别系统在使用前,都需要使用者对其进行适应性训练,使其习惯自己的发音,以提高识别的正确率。另外,对语音识别的输入设备缺乏统一标准也是导致语音输入不标准的重要方面。因为当前的录音设备都是以人能听清,听懂为标准进行设计的,至于如何调整输入设备的各项参数,使其适应计算机识别的特点,让识别系统能够更好的分辨,对此我们还需要做大量的数据收集,分析和讨论工作。下载后可任意编辑(2)环境噪声的问题环境噪声的干扰也是语音识别讨论中一个不可回避的问题。在实际应用时,我们并不能保证识别系统始终处于一个宁静的环境中工作。大多数的应用场景总是存在着环境噪声,且不同场景的噪声也各不相同我们在语音识别系统开发时很难做到训练环境和真实环境的匹配,导致很多识别系统在实验室环境下识别效果很好但是到了实际应用的场景,一旦遇到较强的环境噪声,识别的效果就大打折扣了。所...