Ep1 逆向及Bof基础实践-20201324

1 逆向及Bof基础实践说明

1.1 实践目标

本次实践的对象是一个名为pwn1的linux可执行文件。

该程序正常执行流程是:main调用foo函数,foo函数会简单回显任何用户输入的字符串。

该程序同时包含另一个代码片段,getShell,会返回一个可用Shell。正常情况下这个代码是不会被运行的。我们实践的目标就是想办法运行这个代码片段。我们将学习两种方法运行这个代码片段,然后学习如何注入运行任何Shellcode。

  • 三个实践内容如下:
    • 手工修改可执行文件,改变程序执行流程,直接跳转到getShell函数。
    • 利用foo函数的Bof漏洞,构造一个攻击输入字符串,覆盖返回地址,触发getShell函数。
    • 注入一个自己制作的shellcode并运行这段shellcode。
  • 这几种思路,基本代表现实情况中的攻击目标:
    • 运行原本不可访问的代码片段
    • 强行修改程序执行流
    • 以及注入运行任意代码。

1.2 基础知识

该实践需要同学们

  • 熟悉Linux基本操作
    • 能看懂常用指令,如管道(|),输入、输出重定向(>)等。
  • 理解Bof的原理。
    • 能看得懂汇编、机器指令、EIP、指令地址。
  • 会使用gdb,vi
  • 指令、参数:掌握NOP, JNE, JE, JMP, CMP汇编指令的机器码
    • NOP:机器码为0x90。NOP指令即“空指令”,执行到NOP指令时,CPU什么也不做,完毕之后继续执行NOP后面的一条指令。
    • JNE:机器码为0x75。JNE是条件转移指令,如果不相等则跳转。
    • JE:机器码为0x74。JE是条件转移指令,如果相等则跳转。
    • JMP:无条件跳转指令。JMP主要分为3种:
      • 短跳转:机器码为0xE8。只能跳转到256字节的范围内
      • 近跳转:机器码为0xE9。可跳至同一个段范围内的地址
      • 远跳转:机器码为0xEA。可跳至任意地址,使用48位/32位全指针
    • CMP:比较指令,功能相当于减法指令,对操作数之间运算比较,不保存结果。CMP指令也有多种形式,分别代表不同的功能,机器码分别为0x38、0x39、0x3A、0x3B、0x3C、0x3D。

2 直接修改程序机器指令,改变程序执行流程

  • 知识要求:Call指令,EIP寄存器,指令跳转的偏移计算,补码,反汇编指令objdump,十六进制编辑工具
  • 学习目标:理解可执行文件与机器指令
  • 进阶:掌握ELF文件格式,掌握动态技术

下载目标文件pwn1,将文件名改为与自己学号相关的名字,然后objdump -d pwn1 | more反汇编

(我的图中,pwn1=pwn1324,pwn2=pwn20201324)

一直按回车就会逐行显示更多信息,直到找到<main>的内容

more是可以分页显示的可执行文件,管道“|”的作用就是把前面的执行结果放到后面的"more"里面

发现主函数会通过call调用foo函数,该指令对应的机器指令为“e8 d7ffffff”,e8即跳转之意

正常流程下,eip中原本存储的是下一条指令的地址,即80484ba,但一解释e8这条指令,CPU就会转而执行 ”eip + e8后面的四字节地址“ 这个位置的指令

因此,eip = 80484ba+fffffd7=8048491(注意d7ffffff是补码,小段优先,计算时应写为fffffd7),也就是foo函数的地址

那我们想让它调用getShell,只要修改“d7ffffff”为 "getShell-80484ba"对应的补码就行

0804847d-80484ba=ffffffc3

于是我们修改可执行文件,将其中的call指令的目标地址由d7ffffff变为c3ffffff:

  1. vi进入pwn2,在乱码界面按Esc键,然后输入:%!xxd
  2. 找到e8d7,修改d7为c3(先按i进入编辑模式再改,改完按Esc键退出)
  3. 输入:%!xxd -r
  4. 输入:wq退出

对pwn2反汇编,检验是否修改正确

运行改后的代码,会得到shell提示符

如上图所示,我们已经完成了对对应文件的修改。原来的可执行文件的功能是输入一段字符串,程序会重复输出该字符串,现在我们的程序变成了打开一个“命令行”。我们执行了ls命令后,成功打印出了当前目录下的所有文件

我遇到了报错zsh: permission denied

解决方法是chmod u+x赋予执行权限,如上图。或者右键单击文件->属性->promissions->allow...

3 通过构造输入参数,造成BOF攻击,改变程序执行流

3.1 反汇编,了解程序的基本功能

对pwn1反汇编。该可执行文件正常运行是调用函数foo。foo函数有Buffer overflow漏洞:foo读入字符串,但系统只预留了(28)字节的缓冲区,超出部分会造成溢出,我们的目标是覆盖返回地址

3.2 确认输入字符串哪几个字符会覆盖到返回地址

3.2.1安装gdb

在终端中输入gdb -v,若找不到该命令,则需先进行安装操作

sudo chmod a+w /etc/apt/sources.list
sudo chmod a-w /etc/apt/sources.list
sudo su
apt-get update
apt-get install gdb

最后再通过gdb -v,显示出版本号即为安装成功。

3.2.2分析覆盖返回地址的字符

按指导书步骤走

输入为1111111122222222333333334444444455555555时可以看到eip的值0x35353535,也就是5555的ASCII码

输入字符串1111111122222222333333334444444412345678,发现eip的值为0x34333231,即1234(小端)的ASCII码。

那只要把这四个字符替换为 getShell 的内存地址,输给pwn1,pwn1就会运行getShell。

3.3 确认用什么值来覆盖返回地址

之前反汇编时我们已知getShell的内存地址0x0804847d,由1234对应0x34333231分析出应该是小端写法,所以我们应当输入11111111222222223333333344444444\x7d\x84\x04\x08

对比之前 eip 0x34333231 0x34333231,验证了输入正确

3.4 构造输入字符串

按指导书进行操作,最终获取shell

我们没法通过键盘输入\x7d\x84\x04\x08这样的16进制值,所以先生成包括这样字符串的一个文件。\x0a表示回车。使用输出重定向“>”将perl生成的字符串存储到文件input中。

使用16进制查看指令xxd查看input文件的内容是否如预期,然后将input的输入,通过管道符“|”,作为pwn1的输入

可以看到攻击成功,获取了一个交互式的shell

4. 注入Shellcode并执行

4.1 准备一段Shellcode

shellcode就是一段机器指令(code)

  • 通常这段机器指令的目的是为获取一个交互式的shell(像linux的shell或类似windows下的cmd.exe),
  • 所以这段机器指令被称为shellcode。
  • 在实际的应用中,凡是用来注入的机器指令段都通称为shellcode,像添加一个用户、运行一条指令。

4.2 准备工作

输入sudo apt-get install execstack ,安装execstack命令,如果安装失败可参考以下连接

Kali Linux E:Unable to locate package 完美解决

按教程进行操作:

  1. 先通过execstack - s指令来设置堆栈可执行
  2. 再用 execstack -q 指令查询文件的堆栈是否可执行
  3. 检查发现randomize_va_space为2,即地址随机化保护是开启的

  1. 关闭地址随机化
  2. 检查发现randomize_va_space为0,即地址随机化保护是关闭的

4.3 构造要注入的payload

  • Linux下有两种基本构造攻击buf的方法:
    • retaddr+nop+shellcode
    • nop+shellcode+retaddr。
  • 因为retaddr在缓冲区的位置是固定的,shellcode要不在它前面,要不在它后面。
  • 简单说缓冲区小就把shellcode放后边,缓冲区大就把shellcode放前边

--

  • 我们这个buf够放这个shellcode了,所以shellcode放后边

  • 结构为:retaddr+nop+shellcode(指导书里此处是坑

    • nop一为是了填充,二是作为“着陆区/滑行区”。
    • 我们猜的返回地址只要落在任何一个nop上,自然会滑到我们的shellcode。

打开两个终端,都进入root模式

终端1注入攻击buf,回车一次即可,不要出现指导书里的乱码
注:cat之前要先输入input_shellcode,按指导书来。我此处因为是补做所以没有输

打开终端2,用gdb来调试pwn1这个进程

终端2执行到上图位置时,在终端1中按下回车,此时终端1出现乱码

终端2继续执行,看到 01020304了,就是返回地址的位置。shellcode就在后面,所以地址是 0xffffd320

将 0xffffd320放进shellcode,运行后发现成功获取shell,攻击成功

4.5 结合nc模拟远程攻击

我用的是本机上的两个虚拟机,靶机为kali,攻击机为ubuntu。二者互ping可通

靶机

ip:192.168.137.142

靶机输入以下命令

nc -lvnp 1324 -e ./pwn20201324

攻击机

ip:192.168.137.136

perl -e 'print "11111111222222223333333344444444\x7d\x84\x04\x08\x0a"' > input
(cat input; cat) | nc 192.168.137.142 1324

然后就能获取靶机的shell

5 Bof攻击防御技术

5.1. 从防止注入的角度

在编译时,编译器在每次函数调用前后都加入一定的代码,用来设置和检测堆栈上设置的特定数字,以确认是否有bof攻击发生

5.2. 注入了也不让运行

结合CPU的页面管理机制,通过DEP/NX用来将堆栈内存区设置为不可执行。这样即使是注入的shellcode到堆栈上,也执行不了

5.3. 增加shellcode的构造难度

开启地址随机化:shellcode中需要猜测返回地址的位置,需要猜测shellcode注入后的内存位置。这些都极度依赖一个事实:应用的代码段、堆栈段每次都被OS放置到固定的内存地址。ALSR,地址随机化就是让OS每次都用不同的地址加载应用。这样通过预先反汇编或调试得到的那些地址就都不正确了

/proc/sys/kernel/randomize_va_space用于控制Linux下 内存地址随机化机制,其取值有以下三种情况

0 - 表示关闭进程地址空间随机化。
1 - 表示将mmap的基址,stack和vdso页面随机化。
2 - 表示在1的基础上增加栈(heap)的随机化。

当前/proc/sys/kernel/randomize_va_space值为0,我们将其改回2

5.4 从管理的角度

加强编码质量。注意边界检测。使用最新的安全的库函数。

6 实践总结

6.1问题与解决

我遇到的主要是虚拟机本身的个性化问题,还有自己操作不熟练的问题。比如zsh: permission denied、E:Unable to locate package等报错,解决方法已经在对应部分给出

除此之外在原理理解上可能也比较困难,比如 3.2.2分析覆盖返回地址的字符 那一部分中,我就不太能理解验证原理。经询问老师,发现指导书步骤不太全面。调试到断点以后,应该是再继续执行几条指令,等到foo执行完毕,return的时候,再检查eip的值,这时的值应该是我们注入的那个值,因而验证注入正确。但我的单步调试一直出问题,现在还没有跑出来,如果有朋友实现出来可以在评论区教我一下,感谢~

比较自豪的是在4.3那一节没有跳进老师挖的坑。仔细阅读一下前面的导入就会发现,既然我们的buf够放这个shellcode了,那么按前文的逻辑shellcode就应该放后边,所以我把指导书翻到后面,发现果然是坑

6.2实验体会

总而言之,按指导书一步步做不会有太大问题,对我来说理解原理其实更费力一点。

实验大概分了三个层次,难度应该是递增的,但我感觉一旦掌握了基本的思路和原理,反而是越来越简单的。我自己好像就是第一部分花的时间最长。所以建议大家不要有畏难情绪,慢慢熟悉(kali比ubuntu好用多了就是说)

我能想到的大家可能遇到的问题应该都写在文章里了,大家要是有其他问题欢迎评论或私聊 ૧(●´৺`●)૭

人比较菜,好多地方理解的感觉也不太到位,如有问题欢迎大家批评指正 o(≧v≦)o

posted @ 2023-03-10 23:55  20201324徐源  阅读(597)  评论(0编辑  收藏  举报