《人工智能应用概论》第5章智能语音技术PART1智能语音技术的概念《创新中国》是由中央电视台联合深圳市委宣传部于2018年1月22日推出的一部纪录片,该片主要讲述了最新科技成就和创新精神,用鲜活的故事记录中国伟大的创新实践
这部聚焦前沿科学突破与科技热点,以鲜活故事记录当下中国创新实践的纪录片,还以一种特殊的方式联结科技与人文:利用智能语音和人工智能技术,让已逝的著名配音艺术家李易老师的声音重现荧幕,完成了整部纪录片的配音
这也是全球第一部全篇采用人工智能配音的纪录片
1智能语音技术的概念1
1自动语音识别(AutomaticSpeechRecognition,ASR)广义上来讲智能语音技术有各种各样的定义,以上是常见的一些热门的场景
本书重点介绍语音识别技术(ASR)
自动语音识别是指让机器识别人说出的话,即将语音转换成相应的文本内容,然后根据内容信息执行人的某种意图
自动语音识别又称自动言语识别,这项任务涉及将输入声学信号与存储在计算机内存的词表(语音、音节、词等)相匹配,而匹配个别语词的标准技术则要用输入信号与预存的波形(或波形特征/参数)相比较(模型匹配)
1智能语音技术的概念1
2声纹识别(VoiceprintRecognition,VR)声纹识别,生物识别技术的一种,也称为说话人识别,包括说话人辨认和说话人确认
声纹识别就是把声信号转换成电信号,再用计算机进行识别
不同的任务和应用会使用不同的声纹识别技术,如缩小刑侦范围时可能需要辨认技术,而银行交易时则需要确认技术
声纹识别有两种应用场景:1:1验证(简称验证,Verification),比如显示为女朋友/老婆的电话号打来,接听之后发现声音不是她,那就让人紧张;1:n验证(又称识别,Identification),比如陌生电话打来,对方说一句字面上没有任何意义的"老王,是我啊",如果真是