基于ELF的嵌入式软件源码级交叉调试技术
开发任何一个软件都不可避免地存在各种错误,要修正错误必须找出其错误原因。通常程序员利用调试器来跟踪程序执行情况,快速有效地定位错误产生的位置从而找到引起错误的原因,并改正错误。
调试器为用户提供的主要功能包括:在目标程序中设置、删除断点;以单步执行或连续执行等方式控制目标程序运行;浏览程序中的变量或表达式的值;查看、修改目标机寄存器的内容;查看、修改目标机内存的内容。源码级调试器是面向高级语言的符号调试工具,它基于源代码的语句和符号跟踪观察目标程序,同时提供基于汇编级的程序跟踪功能以满足用户底层的调试需要。通用计算机软件一般在同一台机器上进行编辑、编译、调试;而嵌入式软件的目标系统多为特殊的专用系统,通常采用宿主机/目标机开发环境,借助通用计算机作为编辑源文件的宿主机,利用交叉编译器在宿主机上编译生成目标机的可执行代码,调试时通过通讯介质(串线或网络)将目标代码下载到目标系统上运行,利用交叉调试器进行跟踪调试。
国外计算机业在调试器领域中发展很快,开发了许多功能强大、支持多种目标机的交叉调试器。但国内在调试器领域中一直处于落后状态,普遍采用的多是国外的工具产品。目前国内的嵌入式系统发展迅速,对嵌入式软件的开发环境也提出了新的要求,因此,我们着手进行嵌入式软件的源码级交叉调试器的设计与实现,以适应当前嵌入式软件发展的需要。
2 源码级交叉调试器的实现途径
程序运行过程中目标程序的指令代码和数据都映射到目标机上相应的内存内容,为了实现源码级调试,利用目标文件中在程序编译链接时生成的调试信息来实现目标程序与源程序之间的映射,从而在源码级实现对程序执行情况的控制和观察。其关键在于找到调试控制点和数据在源程序与目标程序之间的映射关系。
任何数据都有名和值两个侧面,数据名与数据值之间的映射关系为:根据数据名得到存放该数据值的内存地址,再从目标机的内存地址取出其内容即为数据值,如图1所示:
调试中的程序控制点通常为源程序中的函数、语句行等,它们对应于装载到目标内存中的相应目标代码,要实现程序的运行控制关键在于得到源代码与目标代码之间的映射关系:由源码定位信息得到相应的目标码信息;由目标码地址得到相应的源码定位信息。源码定位信息为源文件名+行号或函数名;目标码信息为目标指令在目标机内存中的起始和终止地址。两者关系如图2所示。
嵌入式软件以宿主机/目标机模式开发,其交叉调试器分为宿主机部分和目标机部分,两者以统一的通讯协议进行通信,宿主机向目标机发送命令,目标机接收、执行命令并将结果返回宿主机,从而实现两机之间的交互控制。免费软件基金会FSF提供的调试工具gdb具有一套比较成熟的通讯协议----remote通讯协议,该协议作为开放软件被广为采用,在此我们选择了rmote协议作为交叉调试器的远程通讯协议。
3 ELF格式目标文件
目标文件是实现源码级调试的基础,需要详细分析文件的格式及内容以从中获取有用的调试信息。在设计调试器时采用可执行连接格式――ELF格式目标文件作为开发基础,ELF(Executable and Linking Format)是UNIX系统实验室(USL)作为应用程序二进制接口(Application Binary Interface(ABI))而开发和发布的,已被软件业广泛采用,在Linux系统中ELF格式是其默认的目标文件格式,许多嵌入式软件都采用ELF 格式作为目标文件格式。
ELF目标文件主要有三种类型:可重定位文件,可执行文件,共享的目标文件,我们以可执行文件为分析对象。
ELF文件格式如图3所示:
ELF头固定在文件的起始位置,其它各部分的位置由ELF头及其它相关信息获得。
1、ELF头
ELF头是整个文件的入口,具有固定的长度,52个字节,包含14个值。包括ELF文件标识,程序头表和节头表的位置、长度,文件中段的数目和节的数目等信息。
评论