新闻中心

EEPW首页 > 模拟技术 > 设计应用 > 一种用于抗噪语音识别的动态参数补偿新方法

一种用于抗噪语音识别的动态参数补偿新方法

作者:时间:2009-05-04来源:网络收藏
1 引言
与机器进行语音交流,是人们长期以来梦寐以求的事情。技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的技术,其被认为是2000年至2010年间信息技术领域十大重要的科技发展技术之一。在中,当识别器的训练环境同应用环境不同时,其性能会急剧下降。为了解决这一问题,各种技术陆续地被提了出来,这些技术主要分为三大类:1)语音鲁棒特征的表达和提取技术;2)语音增强技术;3)模型技术。关于这些的详细回顾可参见文献。本文的讨论重点是模型技术。模型技术主要是通过合并纯净语音模型与噪声模型,从而产生出用于识别的带噪语音模型。文献中已经证明PMC方法是一种非常有效的模型补偿方法,它能产生出具有鲁棒性的带噪语音模型,这些文献中并且给出了几种不同的PMC方法。在这些PMC方法中,一些诸如数字积分PMC(Numerical Integral PMC)和数据驱动PMC(Date―driven PMC)方法能够获得很佳的识别率,但是这些方法的运算复杂度巨大,很难运用到实际应用中去。另一方面,一些诸如对数_力口PMC(Log-Add PMC)和对数.正态PMC(Log―Normal PMC)方法通过使用较简单的估计方法来生成带噪语音模型,这样在很低信噪比的条件下识别效果不是很令人满意。其中Log-Normal PMC方法对静态模型参数给出一个严格的补偿方案,但是对动态模型参数,到目前为止只能对其均值进行简单的补偿。虽然这种动态的均值补偿可以提高识别率,但是算法仍有改进的空间,使其能够为动态的协方差参数提供补偿。
为了解决这一问题,本文提出了一种新的动态模型补偿方法(DPCM)。DPCM选定语音特征与噪声特征的差为一个新的附加随机变量,并假设该附加变量与语音和噪声特征的导数之间均相互统计独立。这样,动态特征的补偿即可通过数学的方法来解决。此外新的DPCM可以同任何已知的静态补偿方法结合生成新的带噪语音模型。实验结果也证明使用该DPCM可以提供更好的识别率。
本文定义和使用一致的域标号。上标l表示对数功率谱域,无上标的则表示Mel线性功率谱域。估计出的噪声模型参数用~标记,补偿出的带噪语音模型参数用^标记。

2 模型补偿技术
模型补偿技术是根据应用环境的背景噪声情况,通过修正纯净语音特征的统计模型产生出一个更接近真实带噪语音特征的统计模型。图1是一个基本模型补偿方案框图,输入为一个纯净的语音模型(目前一般采用HMM对语音建模)和一个估计出的噪声模型。总的来讲,模型补偿依据补偿进行的域不同可以分为两类:线性谱域补偿算法和对数谱域补偿算法。

本文引用地址:http://www.amcfsurvey.com/article/188936.htm


上一页 1 2 3 4 下一页

评论


相关推荐

技术专区

关闭