在MPC555中实现从RAM的快速引导
摘要:介绍了PowerPC系列微处理器的异常和中断。同时以MPC555为例对嵌入式系统从ROM和RAM中的引导特点及技术实现方法进行了比较,给出了MPC555从RAM快速引导的实现方法。 关键词:MPC555;BOOT;异常向量;中断;映射 1 引言 嵌入式系统是以各种嵌入式微处理器为内核的计算机控制系统。它是计算机硬件和软件的集合体?通常是为了嵌入到对象体系中完成某种特定功能而设计的。MPC555是摩托罗拉MPC500 PowerPC精简指令集类32位微处理器。它能在-45℃~125℃恶劣环境下工作,其工作时钟可达40MHz。MPC555具有强大的浮点计算处理能力并支持复杂的算法。该器件具有多个独立的通讯和时间处理模块,内部带有448k字节的flash,因此,该产品即使在个人手中,也可随时更新升级。MPC555兼有工业标准JTAG和BDM接口,从而使产品硬件和软件的调试和试验更加方便快捷。MPC555已经在航空航天、汽车制造、继电保护等行业得到广泛应用。 由于在产品开发的后期,通常需要把程序用仿真器烧录到ROM中,但程序在ROM中的运行速度低于在RAM中的运行速度。为了提高程序的运行速度,往往需要在上电初始化阶段把ROM中的程序复制到RAM中去,或者通过双重映射把ROM的地址映射到外部RAM。本文以MPC555为例,给出了从RAM中将程序快速引导运行的具体实现方法。 2.1 异常与中断 异常通常是指改变正常的程序流和机器状态的事件。比如系统复位、递减器过零、系统调用指令、各种总线错误等。当一个异常事件发生时,通常会发生一个快速的硬件设备的转换或处理器分支到一个地址(异常向量),且一种异常类型对应一个地址的情况下。 中断是异常的一种类型,通常由外部中断输入引脚或者装置的中断请求所引起。在PowerPC结构中,所有的中断都分享一个异常向量偏移,称为“外部中断”,通常映射的偏移地址为0x500。 2.2 异常向量和异常向量表 异常发生后,首先被识别,然后机器的即时状态被保存,这时处理器从某一地址开始执行,异常向量就是这个地址。与68000结构不同(它的向量是指针),PowerPC的向量是固定的地址。每一个异常都有它自己的异常向量,异常向量等于基址和向量偏移量之和。异常基址通常是0x0或者是0xFFF00000,这取决于MSR[IP]位的设置。表1所列是MPC555的异常向量表。其中NMI指的是非屏蔽性中断。
表2 复位配置字的选择
2.3 复位配置字 在上电或者复位后,微处理器首先读取复位配置字,复位配置字由3种启动工作模式决定: (1) 外部数据总线引脚 DATA?0:31?; (2) 内部的默认常量(0x00000000); (3) 内部NVM 寄存器值(CMFCFIG); 表2给出了复位配置字的选择方法。通常选择第三种,即事先用仿真器把配置字写入寄存器CM-FCFIG。并用CMFCFIG中的IP位决定程序的入口地址,若IP 等于0,则入口地址为0x0,若IP等于1,则入口地址为0xfff00000。 嵌入式系统的应用程序一般都是被固化在ROM中运行的。通常可用汇编语言编写启动程序来完成系统的硬件以及软件运行环境的初始化。启动和应用程序可一起固化在ROM中?以使系统在上电和复位时能够自动跳转到复位异常向量入口地址处开始执行程序。 在源文件编译链接生成的目标文件中,代码、数据放在不同的段中。而目标文件中的.data 段则以系统RAM为参考地址,所以在系统启动时需要拷贝ROM中的.data到RAM,以完成RAM的初始化。 3 从RAM快速引导运行的实现方法 3.1 双重映射法 如果程序被烧录到微处理器的内部ROM, 可以通过MPC555的特有功能――双重映射法把内部FLASH的地址映射到外部RAM,以实现快速引导运行。在使能双重映射功能时,内部 FLASH区对应的地址不起作用,而映射的外部RAM区地址起作用。 具体操作时,首先把程序烧录到内部FLASH,然后在上电时把程序从内部FLASH拷贝到外部RAM,最后再使能微处理器的双重映射功能。这样,程序就可以在外部RAM中运行了。图1所示是其流程图。具体的程序代码如下: INT Vectors? /* 系统复位 */ .skip 0x0100 ?. INT Vectors? start? # /*设置RAM 和 ROM 存储区*/ # /*OR2=0xFFF00000片选RAM 大小 1M*/ lis r5? 0xfff0 ori r5? r5? 0x0000 lis r4? OR2@ha stw r5? OR2@l?r4? # /* BR2=0x0400003 RAM基址 0X400000 32位口大小 */ lis r5? 0x40 ori r5? r5? 0x0003 lis r4? BR2@ha stw r5? BR2@l?r4? # /* 拷贝内部Flash 到外部RAM */ li r6?0x0 lis r4?0x40 ori r4?r4?0x0000 lis r5?0xfff0 ori r5?r5?0x0 loop 1? lhzx r7?r6?r5 sthx r7?r6?r4 addi r6?r6?0x2 li r8?0xb00 cmp r6?r8 bne loop 1 # /* 使CS2的片选区无效 */ # /* BR2=0x0400003 基本寄存器2 */ lis r5? 0xfff0 ori r5? r5? 0x0000 lis r4? BR2@ha stw r5? BR2@l?r4? # /* 双重映射使能 */ # /* DMOR=0xFFF00000 片选双重映射区 大小 256k */ lis r5? 0x7000 ori r5? r5? 0x0000 lis r4? OR2@ha stw r5? OR2@l?r4? # /* DMBR=0x0400003 双重映射区基址 0X0 32位口大小 */ lis r5? 0x0 ori r5? r5? 0x0005 lis r4? BR2@ha stw r5? BR2@l?r4? ba INT Initialize … 3.2 复制法 对于与MPC500同系列中的MPC561和MPC562等芯片,由于微处理器内部没有ROM,所以必须外扩ROM。在这种情况下,可以把程序烧录到外部ROM,然后在上电时再把程序从外部ROM拷贝到外部RAM中,从而使程序能够在外部RAM中运行。以MPC555为例的流程图如图2所示。 在这种方法中,程序仅在重新配置存储区前运行在外部ROM,而在重新配置存储区后运行在外部RAM中,因此提高了程序的运行速度。该方法在操作时,首先把程序用仿真器烧录到外部FALSH,入口地址为0xfff00000,然后脱机运行。本例中,外部FLASH是16位总线,外部RAM是32位总线。下面以MPC555为例给出具体程序代码。 INT Vectors? /* 系统复位 */ .skip 0x0100-?.-INT Vectors? start? # /* 设置RAM 和 ROM 存储区 */ # /*OR2=0xFFF00000片选RAM 大小 1M*/ lis r5? 0xfff0 ori r5? r5? 0x0000 lis r4? OR2@ha stw r5? OR2@l?r4? # /* BR2=0x0400003 RAM基址 0X400000 32位口大小 */ lis r5? 0x40 ori r5? r5? 0x0003 lis r4? BR2@ha stw r5? BR2@l?r4? # /*OR0=0Xfff80000片选FLASH 大小 512k*/ lis r5? 0xfff8 ori r5? r5? 0x0000 lis r4? OR2@ha stw r5? OR2@l?r4? # /* BR0=0xfff00803 RAM基址 0Xfff00000 16位口大小 */ lis r5? 0xfff0 ori r5? r5? 0x0803 lis r4? BR2@ha stw r5? BR2@l?r4? # /* 拷贝外部Flash到外部RAM */ li r6?0x0 lis r4?0x40 ori r4?r4?0x0000 lis r5?0xfff0 ori r5?r5?0x0 loop 1? lhzx r7?r6?r5 sthx r7?r6?r4 addi r6?r6?0x2 li r8?0xb00 cmp r6?r8 bne loop_1 # /* 重新分配存储区 */ # /* BR0=0x600803 */ lis r5? 0x60 ori r5? r5? 0x0803 lis r4? BR0@ha stw r5? BR0@l?r4? # /* OR0=0xFFf80000 片选flash 512k 1个时钟等周期 */ lis r5? 0xfff8 ori r5? r5? 0x0003 lis r4? OR0@ha stw r5? OR0@l?r4? # /* OR2=0xFFF00000 片选RAM 1M */ lis r5? 0xfff0 ori r5? r5? 0x0000 lis r4? OR2@ha stw r5? OR2@l?r4? # /* BR2=0xfff00003 基址 0Xfff00000 32位口大小 */ lis r5? 0xfff0 ori r5? r5? 0x0003 lis r4? BR2@ha stw r5? BR2@l?r4? ba INT_Initialize … 4 结束语 笔者对文中所介绍的以MPC555为例?对从RAM快速引导运行的两种实现方法进行了测试对比。结果证明:程序在RAM中的运行速度比在FLASH中提高了1倍多,因而程序运行速度得到了很大提高。 |
评论