一种用于抗噪语音识别的动态参数补偿新方法
表1~表3列出的是在不同噪声环境和信噪比条件下的各种算法的识别率。可以看出使用补偿算法的识别率比失配情况下有很大的提高。在-5dB条件下,使用了DPCM的识别方法对各种噪声语音的平均识别率比仅使用Log―Add PMC和Log―NormalPMC的方法有绝对的7.5%和6.6%增加,在0dB情况下绝对增加值分别为8%和7.3%。在信噪比5―10dB下,有含DPCM方法的识别率比其他两种算法仍然有性能上的提高。
表4列出了更新每个状态的4个高斯密度分布中的单个高斯密度分布时,静态均值和方差以及动态均值和方差(注:Log―Add PMC算法只对均值补偿)从倒谱域变化到对数谱域、在对数谱域进行模型补偿、以及从对数谱域变回倒谱域所需的乘法、除法、指数运算以及对数运算的次数。其中N和M分别表示在倒谱域和对数谱域特征的维数。从表中可看出含有DPCM的算法复杂度比其原始算法的复杂度只有轻微的增加。
实验证明了本文的DPCM算法可以处理在不同加性噪声环境下的语音识别任务,并且能够取得比较好的识别效果。性能的提升归功于相对应比较准确的动态模型补偿方法的应用。通过这种方法的使用,含DPCM算法的识别率比目前的PMC算法有较明显的提升。
5 结论
文中提出了一种新的动态特征补偿方法,并给出了反映加性噪声的语音动态特征失配函数,以及在此基础上依据合理的假设,推导出的一系列动态模型参数补偿DPCM的算法公式。并且DPCM算法可以与任意的静态模型补偿算法结合以提高原始算法的识别率。实验结果表明在不同的噪声环境下结合DPCM的PMC算法可以给出比原始PMC算法具有更好的识别率,在低信噪比条件下提升效果更为明显。此外结合DPCM的模型补偿算法的复杂度与原补偿算法的复杂度基本相当,只有轻微的增加。可见DPCM算法是一种非常有效的动态特征补偿算法。
评论