摘 要语音识别在现实中有着极为重要的应用,现在语音内容的识别技术已日趋成熟
当前语音情感识别是研究热点之一,它可以帮助 AI 和人更好地互动、可以帮助心理医生临床诊断、帮助随时随地高效测谎等
本文采用了中科院自动化所的 CASIA 语料库作为样本,先进行预处理,之后对语料库进行语音情感特征函数的提取,再结合二叉树进行 SVM 支持向量机的分类,最后得到识别准确率
预处理是将语音信号提纯的操作,主要分为数字化、预加重、分帧加窗和端点检测 4 步,之后来到提取语音情感特征参数的阶段
虽然有许多语音情感特征参数,本文中使用的语音情感特征参数为基音频率、短时能量、共振峰和梅尔倒谱系数(MFCC)四种,再对每一种特征参数进行归一化运算
传统的支持向量机识别语音情感信号为“一对一”模型,若有种情感,算法复杂度为
结合语音情感的分类间有较为相似和不相似两种情况,本文采用将二叉树和支持向量机结合的方法,每一层都遵循相似聚类的准则,逐层二分,从根结点的所有情感,最后分类到叶结点只有一个情感,此时完成识别分类
种情感的算法复杂度为,大大提高了效率
本文最后在完成整个系统后端的架构之后,加入了 UI 界面,原本运行界面简陋的系统,拥有了更加直观的显示,在面板上就可以方便地调节参数,也可以快速得到对比结果和识别结果
- I -关键词: 语音情感识别,机器学习,二叉树,支持向量机(Speech emotion recognition based on Machine LearningAbstractSpeech recognition has extremely important applications in reality, and now the recognition technology of speech content has become increasingly mature