基于OMAP的MPEG-4实时解码器的实现
随着移动通信和多媒体技术的发展,人们对通信的要求已不满足于传统的语音业务,而是追求更高品质的视频、音频等多媒体信息服务。在多媒体通信中,视频区别于音频和文字的显著特点是其大数据量以及高处理复杂度。现有的移动终端一般采用DSP芯片作为核心,DSP芯片在数据处理方面具有较多的优势,但其系统处理和控制能力比较弱。第三代移动通信(3G)终端需要提供更多更复杂的服务如实时视频交互等,原有的DSP芯片很难满足这些需求[1]。TI公司提出了开放式多媒体应用平台OMAP(Open Multimedia Applications Platform)体系结构,并为此设计了OMAP处理器。笔者利用本文提出的方法在使用TI OMAP1510的PocketPC上实现了MPEG-4简单级(simple profile)解码,基本满足了实时的要求,同时保持了较好的质量。
本文引用地址:http://www.amcfsurvey.com/article/86685.htm1 开放式多媒体平台(OMAP)
OMAP采用一种独特的双核结构,把控制性能较强的ARM处理器与高性能低功耗的DSP核结合,是一种开放式的、可编程的基于DSP的体系结构。主要目标是满足2.5G和3G网络上移动电话、PDA上的语音与多媒体需要。
1.1 OMAP的硬件平台
OMAP硬件平台主要由DSP核、ARM核以及业务控制器(Traffic Controller)组成。这三部分可以独立地进行时钟管理,有效地控制功耗。OMAP硬件平台采用双核技术提高操作系统的效率和优化多媒体代码的执行。实时性任务如实时视频通信等由DSP完成,非实时性任务和系统控制工作如界面交互、操作系统等由ARM完成[2]。例如,使用者在进行视频通信时可以同时使用操作系统上的应用软件如Word、Excel等,这样分别利用了DSP低功耗而又较强数据处理能力和ARM的较强控制能力的优势。与传统只使用ARM或者只使用DSP芯片的移动终端相比,OMAP成功地解决了性能与功耗的最佳组合问题。
OMAP硬件平台不断升级,以满足日益增长的应用需求。本文使用OMAP1510芯片,它的两个关键部分是TI增强型ARM925(TI925T)和TMS320C55x DSP。TMS320C55x DSP的工作主频为200MHz,内部有32K字双存取SRAM,48K字单存取SRAM和12K字的高速指令缓存。它具有高度的并行能力,32位读写和功能强大的EMIF、双流水线的独立操作以及双MAC的运算能力。它采用了三项关键的革新技术:增大的空闲省电区域、变长指令、扩大的并行机制。此外TMS320C55x DSP核增加了处理运动估计、离散余弦变换(DCT)、离散余弦反变换(IDCT)、1/2像素插值的硬件加速器,降低了视频处理的功耗,其结构对于多媒体应用高度优化,适合低功耗的实时语音图像处理。TI增强型ARM925采用ARM9TDMI技术,工作主频为175MHz,有16K字节的高速指令缓存、8K字节的高速数据缓存和17个字的写缓冲。ARM和DSP都可以访问内部SRAM和外部存储器接口,但ARM是平台的核心,它能访问全部16M字节的内存空间和DSP的128K字节的I/O空间。
1.2 OMAP的软件平台
OMAP的软件结构建立在两个操作系统之上,一个是基于ARM的操作系统如WindowsCE、Linux等;另一个是基于DSP的实时操作系统(RTOS)DSP/BIOS。无缝连接两个操作系统的关键技术是DSP/BIOS桥。DSP/BIOS桥建立的这种连接使ARM端的客户能与DSP上的任务交换信息和数据[3]。对于软件开发者来说,DSP/BIOS桥提供了一种使用DSP的无缝接口,开发者可以在GPP(通用处理器,包括ARM)上使用标准应用编程接口访问并控制DSP的运行环境。
2 MPEG-4实时视频解码在OMAP上的软件实现
2.1 MPEG-4解码流程
MPEG-4标准因其给出多种抗误码工具而适于应用在无线信道环境下的多媒体通信[4]。本文实现的是主要应用于无线通信的简单级(simple profile)[5],因而只使用了I帧和P帧。其解码的流程如图1所示。如果是I帧,码流中主要是纹理信息,经过可变长(VLC)解码、反扫描、反预测、反量化和反DCT(IDCT)可以直接得到重构的帧。如果是P帧,码流中还含有运动矢量信息,经过VLC解码、反扫描、反预测、反量化和反DCT得到的只是残差信息。利用解码得到的运动矢量、残差信息和参考帧进行运动补偿可以得到重构的帧。
2.2 在OMAP1510上的程序结构
在OMAP上开发程序通常分为两部分,一部分是使用Embedded Visual C开发ARM端程序,另一部分是使用TI CCS开发DSP端程序。前者主要是为了使设计的算法与xDAIS(eXpressDSP TM算法标准)兼容,在ARM端程序中调用一些DSP/BIOS桥的API实现在DSP上初始化信号处理任务、与DSP任务交换消息、对来自DSP和从DSP发出的数据流进行缓冲、暂停、继续、删除DSP任务并进行资源状态查询等。而具体的功能实现则是在DSP端完成。图2显示了TI-enhanced ARM925应用程序与DSP节点之间的关系。
通过写节点封装器的创建、执行及删除函数,将xDAIS算法封装于DSP节点中。创建函数可分配节点处理和xDAIS算法所需的存储器,还可分配节点的相关模块。这些模块是传递到执行和删除函数的一种结构。创建函数还可给出xDAIS算法的实例,并可将其激活,还可初始化任何在任务执行前必须初始化的数据或参数。执行函数是主要的分派函数,在此函数执行阶段中一般不分配存储器及其它资源。执行函数一般包括消息处理循环,该循环可中断函数并等待来自ARM925的消息或数据流,然后节点将这些消息或数据分派到合适的xDAIS控制或处理任务中去。同时执行函数查询DSP/BIOS桥所发送的指示函数退出循环的特殊消息,然后检查定制消息或流数据,并对这些消息或数据流进行适当处理。删除函数清空创建函数所分配的资源,包括相关模块和数据流。删除函数还必须关闭算法、释放存储器以及分配给节点的其它资源。
评论