[pwn基础]Pwntools学习
[pwn基础]Pwntools学习
Pwntools介绍
Pwntools
是一个非常著名的CTF框架
和漏洞利用开发库
,可以让使用者快速的编写exp
。
它拥有本地执行
、远程连接读写
、shellcode生成
、ROP链构建
、ELF解析
、符号泄漏
等众多强大的功能。
Pwntools安装
因为他是个python库,所以直接用pip来管理安装即可。
#提前安装pip
sudo apt-get install python3-pip
#安装pwntools
pip install pwntools -i https://pypi.tuna.tsinghua.edu.cn/simple
测试是否安装成功
Pwntools常用模块和函数
Pwntools分为两个模块,一个是pwn,简单的用from pwn import *
就能把所有子模块和一些常用的系统库导入当前命名空间中,是专门为了CTF比赛优化的。
另外一个模块是pwnlib
,它适合开发成产品,根据自己需要来导入不同的子模块。
- pwnlib.adb: 安卓adb
- pwnlib.asm: 汇编和反汇编
- pwnlib.constans: 包含各种体系结构和操作系统中的系统调用号常量(来自头文件),constants.linux.i386.SYS_stat
- pwnlib.context: 设置运行环境
- pwnlib.dynelf: 利用信息泄漏远程解析函数
- pwnlib.encoders: 对shellcode进行编码,如encoders.encoder.null('xxx')
- pwnlib.elf: 操作ELF可执行文件和共享库
- pwnlib.fmtstr: 格式化字符串利用工具
- pwnlib.gdb: 调试,配合gdb使用
- pwnlib.libcbd: libc数据库,入libcdb.search_by_build_id('xxx')
- pwnlib.log: 日志记录管理,比如log.info('hello')
- pwnlib.memleak: 内存泄漏工具,将泄漏的内存缓存起来,可作为Payload
- pwnlib.qume: QEMU模拟相关,一般用来模拟不同架构的指令或运行程序
- pwnlib.rop: ROP利用工具,包括rop,srop等
- pwnlib.runner: 运行Shellcode,例如:run_assembly('mov eax,SYS_exit;int 0x80;')
- pwnlib.shellcraft: Shellcode生成器
- pwnlib.tubes: scokets、ssh、进程管道通信
- pwnlib.utils: 一些实用小工具,比如CRC计算,cyclic字符串生成等
pwnlib.tubes模块学习
tubes
模块是主要用来通信的模块,应该是pwn题中用的最广泛的交互方式,他主要有下面4中通信方式。
- pwnlib.tubes.process: 进程通信
- pwnlib.tubes.serialtube: 串口通信
- pwnlib.tubes.sock: socket套接字通信
- pwnlib.tubes.ssh: SSH连接通信
tubes.process
这里我一直好奇这个进程通信他是怎么弄的,为什么我用代码p=process('./mydemo')
,然后就可以用send和recv对程序进行发送,然后看了他源码注释 Spawns a new process, and wraps it with a tube for communication.
,他应该是用了比较hack的方法,自己模拟了系统加载本地程序变成进程的操作,并且封装了一层管道通信在上面,这样我们就可以通过send、recv来和他创建的进程来进行通信了,所以就给我们创造了无数可能,比如我之前文章[二进制漏洞]栈(Stack)溢出漏洞 Linux篇中里面的题目scanf
只能输入ASCII码
,这样我们无法构造一个地址Payload
,而有了tubes.process
则可以轻松做到。
#include <stdio.h>
void hack()
{
printf("Hack Success!!!!\n");
}
int main()
{
printf("Hello,Please Start Hack!\n");
char buf[20]={0};
scanf("%s",buf);
printf("Your input:%s\n",buf);
int i;
for(i=0;i<sizeof(buf);i++)
{
printf("0x%x,",buf[i]);
}
return 0;
}
gcc hack2.c -m32 -fno-stack-protector -z noexecstack -o hack2
正常情况下:无法输入0x01、0x02、0x03
这种数据。
而用tubes.process
则可以用send发送原始十六进制数据。
#导入pwntools模块
from pwn import *
context(arch = 'i386',os='linux')
p = process("./hack2")
#显示程序运行的第一条回显
print(p.recv())
#利用pipe管道发送带 十六进制的数据
p.sendline(b'AAAA'+b'\x01\x02\x03\x04')
#回显结果
print(p.recvline())
print(p.recvline())
所以[二进制漏洞]栈(Stack)溢出漏洞 Linux篇文章的题,用tubes.process搞起来就方便多了。
打印进程装载起始地址。
p = process("./hack")
imageBase = p.libs()["/home/ubuntu/hack"]
远程的话使用如下命令:
conn = remote('exploitme.example',31337)
conn.recv()
conn.sendline('test')
pwnlib.context(运行环境)
这个模块主要是用来设置进程运行时的环境,比如目标是什么CPU架构,多少位数,什么平台,是否开启日志等等。
#架构32位X86,平台Linux
context(arch='i386',os='linux')
#设置tmux分屏
context.terminal['tmux','splitw','-h']
#开启日志信息
context.log_level = 'debug'
CPU架构如下:
architectures = _longest({
'aarch64': little_64,
'alpha': little_64,
'avr': little_8,
'amd64': little_64,
'arm': little_32,
'cris': little_32,
'i386': little_32,
'ia64': big_64,
'm68k': big_32,
'mips': little_32,
'mips64': little_64,
'msp430': little_16,
'powerpc': big_32,
'powerpc64': big_64,
'riscv': little_32,
's390': big_32,
'sparc': big_32,
'sparc64': big_64,
'thumb': little_32,
'vax': little_32,
'none': {},
})
transform = [('ppc64', 'powerpc64'),
('ppc', 'powerpc'),
('x86-64', 'amd64'),
('x86_64', 'amd64'),
('x86', 'i386'),
('i686', 'i386'),
('armv7l', 'arm'),
('armeabi', 'arm'),
('arm64', 'aarch64')]
位数:
big_32 = {'endian': 'big', 'bits': 32}
big_64 = {'endian': 'big', 'bits': 64}
little_8 = {'endian': 'little', 'bits': 8}
little_16 = {'endian': 'little', 'bits': 16}
little_32 = {'endian': 'little', 'bits': 32}
little_64 = {'endian': 'little', 'bits': 64}
平台:
oses = sorted(('linux','freebsd','windows','cgc','android','baremetal'))
pwnlib.elf(ELF文件操作)
pwnlib.elf
模块还是挺实用的,虽然linux下有<elf.h>头文件可以用来解析ELF文件,但是很多代码都要自己实现,这个模块就解决了这些实现,可以进行符号查找、虚拟内存、文件偏移、修改和保存二进制等等。
from pwnlib.elf import ELF
#构造类
elf = ELF('./hack_dyn')
#架构,位数,平台
print("---------------------------------------------")
print("[+]架构:{0} 位数:{1} 系统:{2}".format(elf.arch,elf.bits,elf.os))
print("")
#打印装载地址
print("[*]装载地址:",hex(elf.address))
#打印GOT表
print("[*]GOT表:")
for kv in elf.got.items():
print(kv)
#打印PLT表
print("")
print("[*]PLT表:")
for kv in elf.plt.items():
print(kv)
print("[*]hack函数偏移:",hex(elf.symbols['hack']))
print("---------------------------------------------")
可以看到打印出了GOT表、PLT表、符号表中hack函数的偏移,其中装载地址为0是因为这是个动态链接程序,装载地址不确定,改成静态编译就能显示装载地址。
静态链接
asm(address,assembly) # 汇编指令assembly插入ELF的address地址处,需要使用save函数来保存
bss(offset) # 返回.bss段加上offset后的地址
checksec() # 查看文件开启的安全保护
disable_nx() # 关闭NX
disasm(address,n_bytes) # 返回地址address反汇编n字节的字符串
offset_to_vaddr(offset) # 将偏移offset转换为虚拟地址
vaddr_to_offset(address) # 从虚拟地址address转换为文件偏移
read(address,count) # 从虚拟地址address读取count个字节的数据
write(address,data) # 在虚拟地址address写入data
section(name) # 获取name段的数据
debug() # 使用gdb.debug()进行调试
pwnlib.asm(汇编模块)
这是个很强大的模块,可以进行汇编和反汇编,通常用来开发Shellcode的时候非常有用。
可以用pwnlib.context
先设置CPU架构
、字节序
、位数。
用asm()函数进行汇编
,用disasm()函数进行反汇编
from pwnlib.asm import *
#汇编
print(asm('mov eax, 0'))
print(asm('mov ebx, 1'))
print(asm('add eax, ebx'))
print(asm('mov eax, SYS_execve'))
print(asm('nop'))
disasm()反汇编
from pwnlib.asm import *
from pwnlib.util.fiddling import *
#反汇编
print(disasm(unhex('E007BFA9E20FBFA9E417BFA9E61FBFA9E827BFA9FA6FBFA9FC77BFA9FE0F1FF8C81580D2010000D440050035881580D2010000D41F040071C1040054000080D261FCFF10021880D2E3031FAA080780D2010000D4E003F837FF4300D1481680D2010000D4E00B00B9881B80D2E4230091E3031FAAE2031FAAE1031FAA200280D20024A0F2010000D4E00B00B9FF43009100020035000080D241FAFF300201A0D2E3031FAA080780D2010000D4E40300AAC81B80D2000080D2230080D2E5031FAAA20080D2010094D20100A0F2010000D4FE0741F8FC77C1A8FA6FC1A8E827C1A8E61FC1A8E417C1A8E20FC1A8E007C1A8FD7BBEA9010000142C010000000000000000000000000000000000000000000000000000AA0400000000F1FF'),arch='aarch64',bits=64))
当汇编反汇编,其他架构平台时候,记得要安装对应的Binutils
,安装教程:https://docs.pwntools.com/en/stable/install/binutils.html
反编译效果,真的很强大!
pwnlib.shellcraft(Shellcode生成器)
这个模块可以用来生成Shellcode代码,这种模块简直太爱了,他可以生成aarch64、arm、thumb、mips、i386、amd64、powerpc
架构的shellcode代码,基本上的架构都有了。
生成Shellcode代码。
>>> from pwn import *
>>> print(shellcraft.i386.nop())
nop
#生成了一个x86架构平台的nop
接下来生成一个Android手机打开/data/local/tmp/test.txt
的Shellcode,这模块太强大了。
#设置CPU架构 aarch64
#设置系统平台 android
print(shellcraft.aarch64.android.open('/data/local/tmp/test.txt'))
还能配合asm输出不同格式shellcode,实在是太方便、太好用了!
from pwn import *
shellcode = shellcraft.aarch64.android.open('/data/local/tmp/test.txt')
print("输出字符串格式Shellcode:")
print(asm(shellcode,arch='aarch64',bits=64,os='android'))
print("")
print("输出十六进制格式Shellcode:")
print(asm(shellcode,arch='aarch64',bits=64,os='android').hex())
官方的例子。
from pwnlib.shellcraft import *
context.clear()
context.arch = 'amd64'
sc = 'push rbp; mov rbp, rsp;'
sc += shellcraft.echo('Hello\n')
sc += 'mov rsp, rbp; pop rbp; ret'
solib = make_elf_from_assembly(sc, shared=1)
subprocess.check_output(['echo', 'World'], env={'LD_PRELOAD': solib}, universal_newlines = True)
'Hello\nWorld\n'
pwnlib.util(小工具)
这个模块是一些常用的功能函数,比如之前用到过的unhex
就来自这模块,除此之外还有packing、hashes、net、misc、sh_string、cyclic
等函数。
#用的最多的应该是pack函数了吧
p8(0) #打包1字节
b'\x00'
p32(0xdeadbeef) #32位最常用的,打包4字节
b'\xef\xbe\xad\xde'
p64(0xdeadbeef)
b'\xef\xbe\xad\xde\x00\x00\x00\x00'
#可设置大小端序
>>> p32(0xdeadbeef,endian='little')
b'\xef\xbe\xad\xde'
>>> p32(0xdeadbeef,endian='big')
b'\xde\xad\xbe\xef'
#解包
unpack(b'\xaa\x55',16,endian='little')
'0x55aa'
u32('\xaa\x55\x00\x00')
21930
u64('\xaa\x55\x00\x00\x00\x00\x00\x00')
21930
#生成溢出字符串(cyclic)
cyclic(20)
b'aaaabaaacaaadaaaeaaa'
cyclic(20, alphabet=string.ascii_uppercase) #全大写
b'AAAABAAACAAADAAAEAAA'
cyclic(20, n=8) #8字符对齐
b'aaaaaaaabaaaaaaacaaa'
cyclic(20, n=2) #2字符对齐
b'aabacadaeafagahaiaja'
cyclic(alphabet = "ABC", n = 3)#设置成ABC对齐
b'AAABAACABBABCACBACCBBBCBCCC'
context.cyclic_alphabet = "ABC" #全局修改
cyclic(10)
b'AAAABAAACA'
#查找偏移
cyclic_find('daaa')
12
cyclic_find(0x61616162)
4
#unhex
unhex('0102030405060708')
b'\x01\x02\x03\x04\x05\x06\x07\x08'
pwnlib.rop
rop利用模块,包括rop,srop等。
现在的exploit是越来越难,一般起手题都得是NX开启的,ROP这种以前都能出400分题的技术现在也就出50-100分题了非常惨,也许跟这个工具简化了ROP过程有关系?「误」
先简单回顾一下ROP的原理,由于NX开启不能在栈上执行shellcode,我们可以在栈上布置一系列的返回地址与参数,这样可以进行多次的函数调用,通过函数尾部的ret语句控制程序的流程,而用程序中的一些pop/ret的代码块(称之为gadget)来平衡堆栈。其完成的事情无非就是放上/bin/sh
,覆盖程序中某个函数的GOT为system的,然后ret到那个函数的plt就可以触发system('/bin/sh')
。由于是利用ret指令的exploit,所以叫Return-Oriented Programming。(如果没有开启ASLR,可以直接使用ret2libc技术)
好,这样来看,这种技术的难点自然就是如何在栈上布置返回地址以及函数参数了。而ROP模块的作用,就是自动地寻找程序里的gadget,自动在栈上部署对应的参数。
from pwn import *
elf = ELF('ropasaurusrex')
rop = ROP(elf)
rop.read(0, elf.bss(0x80))
rop.dump()
# ['0x0000: 0x80482fc (read)',
# '0x0004: 0xdeadbeef',
# '0x0008: 0x0',
# '0x000c: 0x80496a8']
str(rop)
# '\xfc\x82\x04\x08\xef\xbe\xad\xde\x00\x00\x00\x00\xa8\x96\x04\x08'
使用ROP(elf)
来产生一个rop的对象,这时rop链还是空的,需要在其中添加函数。
因为ROP对象实现了__getattr__
的功能,可以直接通过func call的形式来添加函数,rop.read(0, elf.bss(0x80))
实际相当于rop.call('read', (0, elf.bss(0x80)))
。 通过多次添加函数调用,最后使用str将整个rop chain dump出来就可以了。
- call(resolvable, arguments=()) : 添加一个调用,resolvable可以是一个符号,也可以是一个int型地址,注意后面的参数必须是元组否则会报错,即使只有一个参数也要写成元组的形式(在后面加上一个逗号)
- chain() : 返回当前的字节序列,即payload
- dump() : 直观地展示出当前的rop chain
- raw() : 在rop chain中加上一个整数或字符串
- search(move=0, regs=None, order=’size’) : 按特定条件搜索gadget,没仔细研究过
- unresolve(value) : 给出一个地址,反解析出符号
参考文章:
http://unbelievable.cool/2021/07/25/pwntools学习/#pwnlib-asm (pwntools学习)
http://brieflyx.me/2015/python-module/pwntools-intro/ (Exploit利器--Pwntools)
http://www.leonlist.top/2020/09/02/pwn基本工具-pwntools/ (pwn基本工具-pwntools)
https://xuanxuanblingbling.github.io/ctf/pwn/2020/12/13/getshell3/ (Getshell远程:真·RCE 正连?反连?不连?)
https://github.com/Gallopsled/pwntools (pwntools源码)
最后大家可以多看看pwntools源码去熟悉熟悉,每个模块的功能,他注释一般有demo写的还是非常详细的。
PWN菜鸡小分队
最后感谢大家的阅读,本菜鸡也是刚学,文章中如有错误请及时指出。
大家也可以来群里骂我哈哈哈,群里有PWN、RE、WEB大佬,欢迎交流
本文来自博客园,作者:VxerLee,转载请注明原文链接:https://www.cnblogs.com/VxerLee/p/16397405.html 专注逆向、网络安全 ——VxerLee