arm裸板驱动总结(makefile+lds链接脚本+裸板调试)

在裸板2440中,当我们使用nand启动时,2440会自动将前4k字节复制到内部sram中,如下图所示:

然而此时的SDRAM、nandflash的控制时序等都还没初始化,所以我们就只能使用前0~4095地址,在前4k地址里来初始化SDRAM,nandflash,初始化完成后,才能将nandflash的4096至后面的地址内容存放到SDRAM里去.

而裸板驱动的步骤如下所示:

1.写makefile
2.写lds链接脚本 (供makefile调用)
3.写真正要执行的文件代码,比如初始化nand,sdram,串口等

为什么要写lds链接脚本?

首先lds链接脚本的作用就是将多个*.o文件的各个段链接在一起,告诉链接器这些各个段存放的地址先后顺序,它的好处就是,确保裸板2440的前4k地址里存放的是初始化SDRAM,nandflash的内容

1.写makefile

(参考makefile初步制作:http://www.cnblogs.com/lifexy/p/7065175.html)

在写裸板之前首先要来写Makefile,如下所示:

objs := head.o init.o nand.o main.o   
//定义objs变量，表示obj文件,包含生成boot.bin目标文件需要的依赖文件, 使用$(objs)就可以使用这个变量了
//‘:=’:有关位置的等于(比如:”x:=a  y:=$(x)  x:=b”,那么y的值取决于当时位置的a,而不是b) 
//‘=’:无关位置的等于(比如:”x=a  y=$(x)  x=b”,那么y的值永远等于最后的b ,而不是a)                                                     

 

nand.bin : $(objs)　  //冒号前面的是表示目标文件, 冒号后面的是依赖文件，这里是将所有*.o文件编译出nand.bin可执行文件
arm-linux-ld -Tnand.lds    -o nand_elf $^   //将*.o文件生成nand_elf链接文件
//-T:指向链接脚本, $^:指向所有依赖文件,

arm-linux-objcopy -O binary -S nand_elf $@ //将nand_elf链接文件生成nand.bin文件
//$@:指向目标文件:nand.bin
//-O :选项,其中binary就是表示生成的文件为.bin文件

arm-linux-objdump -D -m arm  nand_elf > nand.dis //将nand.bin文件反汇编出nand.dis文件
//-D :反汇编nand.bin里面所有的段, -m arm:指定反汇编文件的架构体系,这里arm架构

 

%.o:%.c            //冒号前面的是目标文件,冒号后面的是依赖文件,%.o表示所有.o文件,

arm-linux-gcc -Wall -c -O2 -o $@ $<         //将*.c文件生成*.o文件
//$<:指向第一个依赖文件, 也就是.c文件
//$@:指向目标文件,也就是.o文件
//-Wall:编译若有错,便打印警告信息     -O2:编译优化程度为2级

 

%.o:%.S                       
    arm-linux-gcc -Wall -c -O2 -o $@ $<    //将*.S文件生成*.o文件

 

clean:                           //输入make clean,即进入该项,来删除所有生成的文件
    rm -f  nand.dis nand.bin nand_elf *.o   //通过rm命令来删除

2.写lds链接脚本

(参考lds脚本解析: http://www.cnblogs.com/lifexy/p/7089873.html)

 SECTIONS {
    . = 0x30000000;             //指定当前的链接地址=0x30000000

.text          :   {
head.o(.text)    //添加第一个目标文件,里面会调用这些函数
init.o(.text)      //添加第二个目标文件,里面存放关看门狗,初始化SDRAM等函数
nand.o(.text)   //添加第三个目标文件,里面存放初始化nand函数
*(.text)    // *(.text) 表示添加剩下的全部文件的.text代码段
}

.rodata ALIGN(4) : {*(.rodata)}       //指定只读数据段

.data ALIGN(4) : { *(.data) }     //指定读写数据段,     *(data):添加所有文件的数据段

__bss_start = .;     //把__bss_start赋值为当前地址位置,即bss段的开始位置

.bss ALIGN(4)  : { *(.bss)  *(COMMON) }     //指定bss段,里面存放未被使用的变量

__bss_end = .;        //把_end赋值为当前地址位置,即bss段的结束位置

}

上面的链接地址=0x30000000,表示程序运行的地方应该位于0x30000000处,0x30000000就是我们的SDRAM基地址,而一上电后,nand的前4k地址会被2440自动装载到内部ram中,所以我们初始化了sdram和nand后,就需要把程序所有内容都复制到链接地址0x30000000上才行

2.1为什么要在bss段的前后设置两个符号__bss_start, __bss_end?

定义__bss_start和__bss_end符号,是用来程序开始之前将这些未定义的变量清0,节省内存
且__bss_start -0x30000000就等于该bin文件的字节大小,实现动态复制

2.3为什么链接地址在0x30000000处,为什么在初始化sdram和nand之前,还能运行前4k地址的内容?

我们先来看看head.S第一个目标文件,就知道了:

.text                                                           @设置代码段

           @函数disable_watch_dog, memsetup, init_nand, nand_read_ll在init.c中定义
            ldr     sp, =4096               @设置堆栈
            bl      disable_watch_dog       @关WATCH DOG
            bl      memsetup                @初始化SDRAM
            bl      nand_init               @初始化NAND Flash

            ldr sp,=0x34000000              @64Msdram,所以设置栈SP=0x34000000,避免堆栈溢出
                                            
　　　　　　　　　　　　　　　　　　　　　　　　　  @nand_read_ll函数需要3个参数：
            ldr     r0,     =0x30000000     @1. 目标地址=0x30000000，这是SDRAM的起始地址
            mov     r1,     #0              @2.  源地址   = 0         
            ldr     r2,     =__bss_start         
            sub           r2,r2,r0          @3.  复制长度= __bss_start-0x30000000
            bl      nand_read               @调用C函数nand_read,将nand的内容复制到SDRAM中

            ldr     lr, =halt_loop          @设置返回地址

            ldr     pc, =main                @使用ldr命令 绝对跳转到SDRAM地址上
halt_loop:                                   @若main函数跳出后,便进入死循环,避免程序跑飞
            b       halt_loop

(参考位置无关码(bl)与绝对位置码(ldr): http://www.cnblogs.com/lifexy/p/7117345.html)

从上面代码来看,可以发现在复制数据到sdram之前,都是使用的相对跳转命令bl,bl是一个位置无关码,也就是说无论该代码放在内存的哪个地址,都能正确运行.

而ldr就是绝对跳转命令,是一个绝对位置码,当一上电时,我们的链接地址0x30000000上是没有程序的,因为程序都存在nand flash上,也就是0地址上,而如果在复制数据到sdram之前,使用ldr去执行的话,就会直接跳转到0x30000000上,就会运行出错.

而且在复制数据到sdram之前,执行的代码里都不能用静态变量、全局变量、以及数组,因为这些初始值量的地址与位置有关的,必须将nand的内容复制到sdram地址中,才能用.

2.4比如,下面memsetup ()函数,就是个会出错的函数

其中的mem_cfg_val[]数组的内存是存在链接地址0x30000000上,就是与位置有关,在未复制内容之前使用将会出错

#define   MEM_CTL_BASE            0x48000000           //SDRAM寄存器基地址
void memsetup()
{
   int   i = 0;
   unsigned long *p = (unsigned long *)MEM_CTL_BASE;

 

    /* SDRAM 13个寄存器的值 */

    unsigned long  const    mem_cfg_val[]={ 0x22011110,     //BWSCON

                                            0x00000700,     //BANKCON0

                                            0x00000700,     //BANKCON1

                                            0x00000700,     //BANKCON2

                                            0x00000700,     //BANKCON3 

                                            0x00000700,     //BANKCON4

                                            0x00000700,     //BANKCON5

                                            0x00018005,     //BANKCON6

                                            0x00018005,     //BANKCON7

                                            0x008C07A3,     //REFRESH

                                            0x000000B1,     //BANKSIZE

                                            0x00000030,     //MRSRB6

                                            0x00000030,     //MRSRB7

                                    };

 

       for(; i < 13; i++)

              p[i] = mem_cfg_val[i];

}

如下3个图所示,通过反汇编来看,上面的数组内容都是存在SDRAM的链接地址上面的rodata段0x300005d0里,在我们没有初始化SDRAM,复制数据到SDRAM之前,这些数据是无法读取到的

图1,使用bl跳到相对地址0x30000094处:

图2,使用ldr,使ip跳到绝对地址0x300005d0:

图3,0x300005d0里保存的.redata只读数据段,也就是 mem_cfg_val[]的内容:

2.5所以要修改memsetup ()函数为以下才行:

#define   MEM_CTL_BASE            0x48000000           //SDRAM寄存器基地址
void memsetup()
{
       unsigned long *p = (unsigned long *)MEM_CTL_BASE;

    /* 设置SDRAM 13个寄存器的值 */
   p[0]  =0x22011110,     //BWSCON
   p[1]  =0x00000700,     //BANKCON0
   p[2]  =0x00000700,     //BANKCON1
   p[3]  =0x00000700,     //BANKCON2
   p[4]  = 0x00000700,     //BANKCON3 
   p[5]  =0x00000700,     //BANKCON4
   p[6]  =0x00000700,     //BANKCON5
   p[7]  =0x00018005,     //BANKCON6
   p[8]  = 0x00018005,     //BANKCON7
   p[9] =0x008C07A3,     //REFRESH
   p[10] =0x000000B1,     //BANKSIZE
   p[11] = 0x00000030,     //MRSRB6
   p[12] =0x00000030,     //MRSRB7
}

通过反汇编来看,可以看到这些赋值,都是靠mov,add等命令来加加减减拼出来的

如下图,我们以上面的代码p[0] =0x22011110为例:

3.在裸板中调试有以下几步

3.1点灯法:

LED_SHOW:
               ldr   r0,  =0x56000050                        
               ldr  r1,  =(1<<(4*2))                 @设置GPFCON寄存器的GPF4为输出引脚
               str  r1,  [r0]                                           
               ldr  r0,  =0x56000054                       @GPFDAT寄存器
               ldr  r1,  =0                                @设置GPF4=0,亮灯
               ldr  r2,  =(1<<4)                           @设置GPF4=1,灭灯                            

LED_LOOP:                        @死循环闪灯

               str  r1,  [r0]           @亮灯
               bl   DELAY
               str  r2,  [r0]         @灭灯
               bl   DELAY   
               b    LED_LOOP 

DELAY:                           @延时

             ldr r3,=30000
1:
               sub  r3,  r3,   #1
               cmp  r3,  #0
               bne     1b
               mov  pc, lr     @跳出循环  PS:寄存器之间赋值只能用mov

在调试汇编中:就可以使用 “b LED_SHOW”，若LED闪烁,便说明程序已跑过,通过点灯来定位程序在哪出错,

缺点在于需要多次烧写才能得出结果,调试非常麻烦

3.2串口打印

首先需要通过寄存器来初始化串口

在2440中,当没有初始化MPLLCON和CLKDIVN寄存器时,所有的时钟都由12Mhz晶振提供,所以PCLK=12MHZ,则波特率最高就是57600,因为UBRDIV0=12000000/(57600*16-1)=13.02,所以串口代码如下所示:

#define S3C_PCLK            12000000    // PCLK初始值为12MHz
#define S3C_UART_CLK        PCLK        //  UART0的时钟源设为PCLK
#define S3C_UART_BAUD_RATE  57600      // 波特率
#define S3C_UART_BRD        ((UART_CLK  / (UART_BAUD_RATE * 16)) - 1)

#define S3C_GPHCON              (*(volatile unsigned long *)0x56000070)
#define S3C_GPHDAT              (*(volatile unsigned long *)0x56000074)
#define S3C_GPHUP               (*(volatile unsigned long *)0x56000078)
/*UART registers*/
#define S3C_ULCON0              (*(volatile unsigned long *)0x50000000)
#define S3C_UCON0               (*(volatile unsigned long *)0x50000004)
#define S3C_UFCON0              (*(volatile unsigned long *)0x50000008)
#define S3C_UMCON0              (*(volatile unsigned long *)0x5000000c)
#define S3C_UTRSTAT0            (*(volatile unsigned long *)0x50000010)
#define S3C_UTXH0               (*(volatile unsigned char *)0x50000020)
#define S3C_URXH0               (*(volatile unsigned char *)0x50000024)
#define S3C_UBRDIV0             (*(volatile unsigned long *)0x50000028)


#define TXD0READY   (1<<2)
#define RXD0READY   (1)

void uart0_init(void)
{
    S3C_GPHCON  |= 0xa0;    // GPH2,GPH3用作TXD0,RXD0
    S3C_GPHUP   = 0x0c;     // GPH2,GPH3内部上拉
    S3C_ULCON0  = 0x03;     // 8N1(8个数据位，无较验，1个停止位)
    S3C_UCON0   = 0x05;     // 查询方式，UART时钟源为PCLK
    S3C_UFCON0  = 0x00;     // 不使用FIFO
    S3C_UMCON0  = 0x00;     // 不使用流控
    S3C_UBRDIV0 = S3C_UART_BRD; // 波特率为115200
}
/*
 * 发送一个字符
 */
void putc(unsigned char c)
{
    /* 等待，直到发送缓冲区中的数据已经全部发送出去 */
    while (!(S3C_UTRSTAT0 & TXD0READY));  
    /* 向UTXH0寄存器中写入数据，UART即自动将它发送出去 */
    S3C_UTXH0 = c;
}
/*
 * 打印一串数字
 * num:数据
 */
void putnum(unsigned long num) //0xFFFF FFFF         (7:0)
{
        int i ,start=0;
        unsigned char c;
        uart0_init();
        for(i=0;i<100;i++);
        
        putc('0');
        putc('x');
       for(i=7;i>=0;i--)            //从[7:0]中打印数字,去除有效数字前面的0
       {
              c=( num >> (i*4) )&0xf;
              if(c!=0)
              {
                     if(c>9)    
                            putc(c-10+'A');                //打印A~F
                     else
                            putc(c+'0');                   //打印1~9                   
              if(!start)  start=1;                         //start=1,说明为有效数字
              }
              else if((start||!i)&&c==0)       //若是有效数字,便打印0,且在个位上时,不管是否有效都要打印
              {
                     putc('0');
              }
       }
       putc('\r');
       putc('\n');
}

在调试汇编中,就可以使用:

mov   r0,#0x100　　　  //参数等于0x100
bl    putnum　　　　   //调用打印函数

即可打印0x100数字, 能快速定位出程序在哪出错

在c中,直接通过调用函数即可

3.3 使用JTAG调试器

JTAG用于芯片的测试与程序调试,JTAG位于CPU内部,当CPU收发引脚上的数据时,都会通过JTAG单元,而JTAG单元会从CPU内部引出TMS，TCK，TDI，TDO，四个引脚,便可以通过OpenJTAG调试器连接电脑USB,而另一端连接这些JTAG脚来控制CPU

OpenJTAG可以实现:

读写某个地址上的数据
将文件下载到2440的某个地址上,或读取出某个地址到文件中
查询CPU当前状态、中断CPU运行、恢复CPU运行、复位CPU等
设置CPU的地址断点,比如设置为0x30000000,当CPU运行到这个地址时,便会停止运行

断点在调试中分为两种:

硬件断点,在2240中,共有两个硬件断点,也就是最多设置两个硬件断点

软件断点,可以设置无数个断点

1)为什么软件断点可以设置无数个?

实际JTAG后台会把每个需要暂停的地址断点里的数据复制到指定地址里,并赋为某个特殊值(如deeedeee),然后CPU运行时,当某个变量=这个特殊值(如deeedeee),便知道到了软件断点,并从指定地址里把原来的值换回去,然后暂停运行

注意:

由于软件断点,会后台保存断点数据到另一个地址中,前提要必须保证地址可直接读写,所以在nor flash,nand flash下则无法实现调试,若链接地址在SDRAM地址上,则软件断点的地址必须设置在SDRAM初始化后的地址上

3.3.1.通过OCD对JATG进行命令行调试

1)安装OpenOCD

OpenOCD:既可以烧写nor flash,也可以烧写nand flash,并可以通过JTAG调试器来进行调试

接上OpenJTAG,并安装OpenJTAG驱动

2)使用OpenOCD工具连接OpenJTAG调试器

如上图所示:

步骤1,选择jtag类型,CPU类型.

步骤2,点击连接按钮

步骤3,可以看到2440只支持2个硬件断点

其中,work dir 就是需要烧写的文件根目录, 或读取CPU某个地址内容到文件的文件根目录

3)然后通过telent控制台进行调试

telent的主要目的,就是发送命令行给连接的OpenJTAG调试器,然后OpenJTAG通过命令来对CPU进行操作

首先,在win7下,若没打开telnet客服端:

点击开始　->控制面板->　程序和功能->　打开或关闭Windows功能->打开“telnet客服端”

然后在cmd控制台下,输入 “telnet 127.0.0.1 4444”命令,进入telent控制台,如下图所示:

4)接下来便可以通过命令行来实现调试（需要参考反汇编文件,来实现调试）

常用的命令如下所示:

poll

查看当前状态

halt

暂停CPU运行

step

单步执行，如果指定了 address，则从 address 处开始执行一条指令

reg

显示CPU的r0、r1、r2、sp、lr、pc等寄存器的值(需要halt后才能看到)

resume [addr]

恢复CPU运行,若指定了地址,便从指定地址运行(需要halt后才能使用)

例如: resume 0 //从0地址运行

md<w|h|b> <addr> [size]

read读地址,读出size个内容,w:字,h:半字,b:字节.如下图所示:

mw<w|h|b> <addr> <size>

word写地址,写入size个内容,使用方法和上面类似

(PS:不能直接读写nand和nor上的地址,只能读写2440的内部地址(4096),若SDRAM已初始化,也可以实现读写)

load_image <file> <address>

将文件<file>载入地址为 address 的内存，格式有“bin”, “ihex”、 “elf”

例如:

load_image  led.bin  0              //烧写led.bin到0地址

(PS:该文件的目录位于之前在OpenOCD工具的界面里的work dir里)

dump_image <file> <address> <size>

将内存从地址 address 开始的 size 字节数据读出，保存到文件<file>中

bp <addr> <length> [hw]

在地址 addr 处设置断点，hw 表示硬件断点,length为指令集字节长度，,若未指定表示软件断点,比如: stm32是2个字节长，2440是4个字节长，部分MCU拥有多套指令集，长度不固定,如下图所示:

rbp <addr>

删除地址 addr 处的断点

打印断点信息

3.3.2通过GDB对JATG实现源码级别的调试

在linux中,使用arm-linux-gdb软件

在win7中,则使用arm-none-eabi-gdb软件

使用GDB工具,就不需要像上个OCD调试那么麻烦了

1)比如说,想在“int i=0;”处打上断点:

OCD调试:

就需要查看调试的反汇编文件,找到i=0所在的运行地址,然后通过命令在地址上打断点

GDB调试:

则可以直接在i=0处的源码上打断点,后台会通过带调试信息的编译文件,来找到i=0处的运行地址,并向OpenOCD发送打断点命令

2)上面的带调试信息的编译文件又是怎么来的？

通过Makefile里的arm-linux -g 来的, -g:表示生成的编译文件里包含gdb调试信息

然后我们将上面第1节的Makefile修改,如下图:

3)使用gdb之前,需要保证:

1.调试的源码里面的内容必须位于同一个链接地址上, 各个段也要分开存储,调试的链接脚本和上面第2节的类似,
2.如果程序的链接地址是SDRAM, 使用openocd初始化SDRAM

4)常用命令如下所示(以调试上图的nand_elf文件为例):

arm-none-eabi-gdb nand_elf

启动GDB,指定调试文件为nand_elf

target remote 127.0.0.1:3333

与OpenOCD建立连接

load

载入nand_elf调试文件

break [file]:[row]

打断点,比如:

break main.c:21     //在main.c文件的第21行处打断点

info br

查看断点

delete <num>

删除第几个断点,如下图所示:

恢复程序运行,若使用load后,使用c便是启动程序, 按ctrl+c便暂停运行

step

单步执行

monitor <cmd...>

调用OCD的命令使用,比如 :

monitor resume 0              //使用OCD的resume命令,使程序从0地址运行

quit

退出

(PS:也可以通过eclipse平台软件来调用GDB,GDB最终转换为命令行,再调用OCD来实现调试,如下图所示)

posted @ 2017-12-01 11:35 诺谦阅读(4302) 评论(0) 编辑收藏举报

刷新页面返回顶部

NQian

demo相关的已放在群里,qt交流3群931532133(未满员)、ffmpeg交流群929155430(正在完善资源中)、本博客暂停更新、已移至csdn(https://blog.csdn.net/qq_37997682/)

arm裸板驱动总结(makefile+lds链接脚本+裸板调试)

公告

NQian

demo相关的已放在群里,qt交流3群931532133(未满员)、ffmpeg交流群929155430(正在完善资源中)、 本博客暂停更新、已移至csdn(https://blog.csdn.net/qq_37997682/)

arm裸板驱动总结(makefile+lds链接脚本+裸板调试)

公告

demo相关的已放在群里,qt交流3群931532133(未满员)、ffmpeg交流群929155430(正在完善资源中)、本博客暂停更新、已移至csdn(https://blog.csdn.net/qq_37997682/)