新闻中心

EEPW首页 > 嵌入式系统 > 设计应用 > 高清语音技术在手机和蓝牙耳机中的实现

高清语音技术在手机和蓝牙耳机中的实现

作者:时间:2011-09-18来源:网络收藏

也被称为宽带语音,是一种能为蜂窝网络、和无线耳机传输高清、自然语音质量的音频技术。与传统的窄带电话相比,很大程度上提高了语音质量,减少了听觉负担。

通信产业链上的所有网络和设备都需支持才能体现出该技术的优点。到2011年6月为止,18个国家运营的20种蜂窝网络,以及33家领先的手机品牌都已支持高清语音。通过部署自适应多速率宽带(AMR-WB)语音编码,GSM, WCDMA(UMTS)和LTE蜂窝网络中已经引入了高清语音。此外,通过使用改良的子带编码(mSBC)语音编解码技术,无线蓝牙耳机也开始支持高清语音,将免提通话与高语音质量结合在了一起。

高清语音的优点同样可以在现有网络中体现出来。随着窄带网络和设备向高清语音过渡,一种名为带宽扩展(BWE)的语音处理技术可以用来在接收终端设备上模拟类似于高清语音的通话质量,为不支持高清语音的设备提供了一个折中的解决方案。

从窄带到高清语音

传统电话系统的带宽被限制在大约300Hz到3.4kHz的音频频率范围内(图表1),这一范围通常被称为窄带语音。尽管现在的电话系统是数字式的,但其还是传承了与传统模拟系统相同的带宽。从语音质量的角度来看,窄带语音缺乏自然语音保真度,常常被形容为单薄和模糊不清。尽管如此,窄带频率范围内完整语句的语音辨别度大概是99%。


图1:窄带和宽带语音的带宽特点

高清语音在采样频率为16kHz时音频带宽大约为50Hz至7kHz,因此与窄带语音相比具有更清晰的语音信号。虽然宽带语音并没有显著提高语音清晰度,但是窄带范围之外的3.4kHz至7kHz提高了单词中的摩擦音(例如f、s和th) 的识别度。宽带语音能够提供更加自然真实的语音,在主观音频质量方面比窄带语音有了显著的提高。高清语音扩展出的50Hz至300Hz的低频降低了窄带语音尖细的特点,而扩展出的高频则提高了发音清晰度。

在主观语音质量听力测试中,宽带语音在平均意见得分(MOS)中得到4.5分,而窄带语音则为3.2分(1分为质量差,5分为优秀)。宽带语音质量的提高减少了听力负担和听者的疲劳,特别是当听者处于嘈杂的环境下。移动网络运营商Orange在其网站上提供了一个音频样本作为高清语音优点的例证。2010年6月Orange公司所做的另一项调查进一步向终端用户证明了高清语音的价值:

* 96%的客户对高清语音通话表示满意;
* 86%的测试者表示,兼容高清语音将是他们未来购买手机时的一个选择标准;
* 76%的测试者愿意更换手机以获得高清语音功能。

此外,2006年爱立信和T-Mobile进行的用户试用调查也证实了高清语音的优点。在150个抽样用户中,超过70%的人认为使用了高清语音手机后通话质量更好,在嘈杂的环境中对话质量有所提高。

使用高清语音需要语音通信系统中的所有环节都支持宽带语音频率范围。采用高清语音技术的关键是在蜂窝网络和手持电话中协同部署AMR-WB编解码。做为一种宽带语音编码,AMR-WB的有效音频带宽是窄带编码AMR-NB的两倍。要完成一个高清语音通话,基站和手持电话之间协同传输以AMR-WB编码的语音,在这一过程中没有进行语音修改或从终端到终端的转换编码。如果高清语音连接无法实现,系统就会取而代之使用窄带AMR-NB编码。

扩展语音带宽

可以预计,在引入高清语音的过程中,通信系统中的某些环节会因无法支持而将语音转换为窄带频率,这实际上是在降低语音质量,增加听力负担。人工带宽扩展(BWE)通过在通信系统的终端环节为窄带语音信号加入人工生成的语音内容,弥补在传输过程中损失的高频和低频语音内容。通过这种方法,BWE将高清语音的优势拓展到了窄带和过渡的混合带宽的语音通信系统中。

BWE算法使用产生语音的声源过滤模型来估算和产生扩展频率范围内的语音内容。根据该模型,语音是由一个声源(例如声带)再加上一个模拟声道的模型产生的。BWE算法根据窄带语音估算出一个宽带声源模型,然后利用该模型的参数估算出其丢失的宽带频率内容。在实际应用中,BWE独立于源编码和发送路径处理过程的,因此它可以与传统的窄带和混合带宽的电话网络共存。


上一页 1 2 下一页

评论


相关推荐

技术专区

关闭