智能手机及平板电脑的语音辨识应用

作者：时间：2012-06-18来源：网络收藏

近年来，智能手机和笔记本电脑等移动/便携设备市场持续快速发展。这些产品在不断集成更多新功能以增强用户体验的同时，在基本语音通信功能的用户体验方面仍有充足提升空间，特别是在嘈杂环境下提升语音清晰度，同时保持语音自然逼真度。例如，用户在拥挤的商业街区行走时，周围环境中可能充斥着汽车喇叭、发动机轰鸣、建筑施工噪声、嘈杂人群噪声、脚步声甚至是风噪等，此时用手机进行语音通话时，传统技术难以提供清晰的语音通信效果。此外，制造商也在为新兴的平板电脑等增加视频通话功能。在利用这些移动/便携设备用于电话会议时，周围环境中同样可能包括多种噪声，如办公室嘈杂人声、周围谈话声、电脑噪声、笔划噪声及玻璃器皿碰击声等，要提供清晰的通话效果同样不易。

本文引用地址：http://www.amcfsurvey.com/article/165433.htm

　　在这些应用中，要降低或滤除环境噪声，提升语音通信效果，可以采用不同的方法，如专门降噪麦克风、模拟电路降噪或数字电路降噪等(见表1)。这些方法各有其特点，相比较而言，采用数字电路降噪的方法灵活，声学设计复杂度较低，且降噪效果优越。当然，便携设备设计人员除了要提供良好的降噪效果，还面临着多种设计约束及挑战，如尺寸、能耗、物理声学设计、音频保真度及成本等。

　　表1：不同降噪技术比较。

　　先进的双麦克风实时自适应噪声消减技术

　　安森美半导体最新推出了基于数字电路降噪技术的BelaSigna R261高性能语音捕获系统级芯片(SoC)。该器件采用先进的双麦克风噪声消减技术，能够帮助设计提供优异的噪声消减效果(参见图1)。这种先进的信号处理技术接受两个麦克风的信号，能够区分不同类型的信号，提取有效的语音信息并抑制环境噪声，从而提升语音辨识度。

　　图1：BelaSigna R261采用先进的实时自适应噪声消减算法。

　　BelaSigna R261在其集成的ROM存储器中内置了语音提取算法。这种算法利用一个或多个传感器来提取波形传播信号，而不需要预先知道声源或传感器位置。这种方案利用全局优化准则，同时工作在频域、时域和空域，对声源的数量及传感器的数量没有限制，与信噪比(SNR)无关，即在低SNR和高SNR环境下能够同样优化地工作，非常适合于需要从不同噪声域中提取有用语音信号的手机和便携计算机等应用。

　　这种自适应噪声抑制算法提供25 dB的噪声抑制能力，能够实时地分离需要的语音与环境噪声，适合于各种语音源和各种位置下的语音，同时能够保证音质自然(其它方案处理后声音不自然、不饱满)，可以有效配合各种品质的麦克风工作。

　　BelaSigna R261关键特性解析

　　BelaSigna R261是一款高性能的语音捕获SoC，集成了数字信号处理器(DSP)、稳压器、锁相环(PLL)、电平转换器及ROM存储器，如此高的集成度与其它方案相比，能够降低物料单(BOM)。如图2所示，这器件支持双麦克风直接输入，噪声消减算法内置于集成的ROM存储器中，基于DSP结构的应用控制器提供高性能及超低能耗，提供双通模拟输出，并支持数字麦克风输出。此外，内置的电源管理模块支持1.8 V至3.3 V的供电电压，内置的片上PLL提供多种频率选择，还提供I2C接口。