基于DSP嵌入式说话人识别系统的设计

作者：时间：2012-03-21来源：网络收藏

0 引言

本文引用地址：http://www.amcfsurvey.com/article/257627.htm

说话人身份识别属于生物认证技术的一种，是一项根据语音中反映说话人生理和行为特征的语音参数来自动识别说话人身份的技术。近年来，说话人身份识别以其独特的方便性、经济性和准确性等优势受到瞩目，在信息安全等领域的应用逐渐增大，并成为人们日常生活和工作中重要且普及的安全验证方式。目前，说话人身份识别在理论上和实验室条件下已经达到了比较高的识别精度，并开始走向实际应用阶段。ATT、欧洲电信联盟、ITT、Keyware、T-NETIX，Motorola和Vi-sa等公司相继开展了相关实用化研究，国内这方面研究主要在中科声学所，中科院自动化所，清华大学等研究所和大学中进行。

基于嵌入式的说话人身份识别系统具有高精度，适时性好，低功耗，低费用，体积小等优势，逐渐成为说话人身份识别面向实际应用的新热点。而随着DSP新技术的发展，DSP芯片无论在处理速度、精度、功耗或者体积等方面都取得了突破性的进展。DSP也越来越多的应用于说话人身份识别。但目前这方面研究主要局限于小数据量、与PC机配套使用上，没有太大的实用价值。在此介绍一种基于TMS320C6713 DSP芯片设计的嵌入式，10个人范围的说话人身份识别系统。该系统可以自举运行，并可灵活的选择训练、识别或者更换训练者、识别者，识别率达98％以上。

1 系统的架构及硬件构成

系统总体实现流程如图1所示。系统主要分为训练和识别两部分，系统初始化后由操作者控制训练或识别。训练目的是提取说话人模型参数并将其存储在FLASH ROM中。识别目的是读取待识别者语音信息并将获得的模型参数与训练的模型参数比较，从而获得识别结果。

1．1 系统的主要硬件构成

系统硬件构成如图2所示，主要包含语音采集模块、数据处理模块(DSP)、程序数据存储及自举FLASH模块、数据存储器RAM模块、系统时序逻辑控制CPLD模块、JTAG接口模块。

语音采集模块主要由TLV320AIC23音频编解码器来完成，该芯片是TI公司的一款高性能的立体声音频Codec芯片，内置放大器，输入／输出增益可编程设置。模数，数／模转换集成在一块芯片中。采样率8～96 kHz可编程实现。另外还具有低功耗，连接电路简单，性价比高的特点。

语音处理DSP采用TI公司的TMS320C6713芯片，该芯片实现浮点运算，最高时钟频率225 MHz，使用该芯片外部存储器接口可实现对外部存储器(SDRAM)数据传输和程序存储器(FLASH ROM)进行程序读写；依靠JTAG接口电路通过仿真器进行仿真调试，实现与主机数据交换；通过片内外设McBSP完成串行数据的接收和发送，实现对音频处理模块的控制等工作。

FLASH ROM最大可提供512 KB空间，通常为前256 KB可用。SDRAM最大容量为16 MB，为该系统提供较大的数据存储空间。CPLD为存储器的扩展实现逻辑编码。电源为TPS54310芯片，可为系统提供3．3 V和1．26 V两种电压。

linux操作系统文章专题:linux操作系统详解（linux不再难懂）

新闻中心

基于DSP嵌入式说话人识别系统的设计

评论

相关推荐

技术专区