Ⅴ说话人识别Ⅴ说话人识别(1)说话人识别(SpeakerRecognition):又称为话者识别,是指通过对说话人语音信号的分析处理,自动确认说话人是否在所记录的话者集合中,以及进一步确认说话人是谁
为什么能识别说话人
人与人间在发音器官上存在着差异,例如在声带和声管形状上的差异;讲话时发音习惯的差异,包括方言、土语、抑扬顿挫、常用词汇及讲话上的怪僻语等;说话人特点以复杂的形式反映在其语音波形中
使得每个人的语音都带有强烈的个人色彩
Ⅴ说话人识别(2)说话人识别的分类按其识别任务分:说话人辨认(SpeakerIdentification)判断某段语音是若干人中的哪一个人所说,是“多选一”问题
又可分为开集和闭集两种
说话人确认(SpeakerVerification)确定某段语音是否是指定的某个人所说,是“一对一”的判别问题
说话人分割和标注(SpeakerSegmentationandLabeling)将多个说话人的数据分割标定为独立的部分
Ⅴ说话人识别(3)Ⅴ说话人识别(4)Ⅴ说话人识别(5)根据识别对象的不同,还可将说话人识别分为三类:与文本有关(Text–Dependent)与文本无关(Text-Independent)文本提示型(Text-Prompted)Ⅴ说话人识别(6)说话人识别技术有着广阔的应用前景电话信道罪犯缉拿、法庭中电话录音信息的身份确认、电话语音跟踪,为用户提供防盗门开启功能等等
通信领域,说话人识别技术可以应用于诸如声音拨号、电话银行、电话购物、数据库访问、信息服务、语音e-mail、安全控制、计算机远程登陆等领域
呼叫中心应用上,说话人识别技术同样可以提供更加个性化的人机交互界面
Ⅴ说话人识别(7)•说话人识别的基本原理识别结果图8-1说话人识别系统原理图输入语音训练测试特征提取说话人模型匹配计算判决Ⅴ说话人识别(8)几个问题