声纹鉴定自动识别系统介绍
随着研究手段和工具的不断改进,说话人识别的研究逐渐摆脱了早期单纯的人耳听辨模式。
Bell实验室的 L•G•Kesta用目视观察语谱图的方法进行识别,并提出了“声纹”的概念。
“声纹鉴定与自动识别技术研究”项目由公安部物证鉴定中心等单位完成,其主要研究成果是将声纹自动识别功能植入VS99语音工作站,该系统能对说话人特征进行自动分析、判断和语图显示及测量,并可结合专家鉴定以确定说话人身份,适合于法庭科学实际应用。本项目研制出当前声纹鉴定工作中非常实用的集声谱仪和说话人自动识别系统为一体的语音工作站,大大提高了结论的准确率,为声纹鉴定提供了一个实用系统。
◆创新技术:
1.抗噪声处理
噪声对检验结果的影响是一个不可忽视的问题。在本系统中对于非平稳噪声,研究人员提出了利用偶数帧段主分量特征输入隐马尔可夫模型(HMM)结合时间方向平滑处理的SS方法来提高噪声环境下汉语连续语音识别系统鲁棒性的方法,取得较好的识别结果。
2.语音端点检测
端点检测可以避免由噪音引起的误动作以及由噪音引起的误识别,对于准确检测语音信号的起始、提高识别系统精度等有重要意义。采用传统的语音端点检测器SAD很容易造成语音激活的漏检。另外,较大的干扰信号,又有可能被当成是语音的激活,造成语音激活的虚检。为克服这一缺点,研究人员采用一种基于相关性的语音激活检测器,定义了一种有效的相关函数,找到了判别门限设定方法以及防止漏检和虚检的方法。
3.识别算法
本系统采用的是基于GMM模型的优化算法。
(1)改进的GMM的模型训练方法
实验中发现EM算法存在出现奇异阵的重大缺陷,而最大似然估计(ML),虽然识别率比较低,但不会出现奇异阵。因此研究人员采用最大似然估计(ML)所得模型为初始模型,然后用EM算法中的每步的模型通过α值控制修正比例对其进行修正,称为改进EM算法。
(2)基于遗传算法的GMM的模型优化算法
研究人员对传统的遗传算法进行了改进,用于GMM的参数优化中,大大提高了模型的优化程度。
(3)GMM的说话人识别方法的优化
研究人员提出了一种新的优化的基于GMM的说话人识别方案,该方案通过先对一次发音对应一个模型的各帧似然度做一种特定变化然后再计算该音节总的似然度,也就是该音节对应该模型的总的评分,记作Sc,与最大Sc所属模型相对应的说话人即为目标说话人。
◆社会效益:
目前,公安部物证鉴定中心完成的国家“九五”攻关成果VS99语音工作站已经在国内普及,在实际办案中发挥了重要作用。该项目是在VS99的基础上增加自动判别功能,从而进一步提高办案效率和鉴定的准确率。
评论